Dopamine - 基于 Tensorflow 的强化学习框架


Apache 2.0
跨平台
Python

软件简介

Dopamine 是由 Google AI 实验室推出的一个基于 Tensorflow 的强化学习(RL)框架,旨在为新手和资深 RL
研究人员提供灵活性、稳定性和可重复性。该框架受大脑中的奖励动机行为启发,反映了神经科学与强化学习研究之间的强历史联系,旨在实现可以推动激进发现的投机性研究。

Dopamine 遵循以下设计原则:

  • 简单的实验:让新用户轻松运行基准实验。

  • 灵活的开发:让新用户轻松尝试研究创意。

  • 紧凑而可靠:为少数经过实战考验的算法提供实施方案。

  • 可重复性:促进结果的可重复性。