Horizon 是一个开源的端到端的应用强化学习平台,在 Facebook 内部被大量使用。
Horizon 采用 Python 构建,使用 PyTorch 进行建模和训练,使用 Caffe2 提供模型服务。 该平台包含主流的训练深度强化学习算法的工作流,包括数据预处理、特征转换、分布式训练、反事实策略评估和优化服务等。
支持的算法
Discrete-Action DQN
Parametric-Action DQN
Double DQN, Dueling DQN, Dueling Double DQN
DDPG (DDPG)
Soft Actor-Critic (SAC)