Super-mario-bros-A3C-pytorch - 超级马里奥的 A3C 算法


MIT
跨平台
Python

软件简介

Asynchronous Advantage Actor-Critic (A3C) for playing Super Mario Bros
是超级马里奥兄弟的 A3C 算法,用于训练代理玩超级马里奥兄弟。

它可以:

  • 通过运行 python train.py 来训练模型
  • 通过运行 python test.py 来测试已经过训练的模型

样本示例:

要求:

  • python 3.6
  • gym
  • cv2
  • pytorch
  • numpy