RL Coach 是一个Python 强化学习框架,由 英特尔 2017 年推出,包含许多最先进算法的实现。RL Coach 只是 英特尔 真正的人工智能生态系统中的几个工具之一。
它以模块化的方式对代理和环境之间的交互进行建模。有了 Coach,就可以通过组合各种构建块并在多个环境中对代理进行培训来对代理建模。可用的环境允许在不同的领域测试代理,如机器人、自主驾驶、游戏等等。
它公开了一组易于使用的 API,用于试验新的 RL 算法,并允许简单地集成新环境来解决问题。基本 RL 组件(算法、环境、神经网络体系结构及勘探策略等等)是很好的解耦,所以扩展和重用现有的组件是相当方便的。
Coach 从培训过程中收集统计数据,并支持高级可视化技术来调试正在培训的代理。
注意:RL Coach 只在 Ubuntu 16.04 LTS 和 Python 3.5 上进行过测试。
有关使用 Python 3.6.3 在 Ubuntu17.10 上安装的一些信息,请参阅
https://github.com/NervanaSystems/coach/issues/54