Dopamine 是由 Google AI 实验室推出的一个基于 Tensorflow 的强化学习(RL)框架,旨在为新手和资深 RL 研究人员提供灵活性、稳定性和可重复性。该框架受大脑中的奖励动机行为启发,反映了神经科学与强化学习研究之间的强历史联系,旨在实现可以推动激进发现的投机性研究。
Dopamine 遵循以下设计原则:
简单的实验:让新用户轻松运行基准实验。
灵活的开发:让新用户轻松尝试研究创意。
紧凑而可靠:为少数经过实战考验的算法提供实施方案。
可重复性:促进结果的可重复性。