OpenAI Gym-强化学习算法工具包

OpenAI Gym - 强化学习算法工具包

机器学习/深度学习

授权协议: MIT

操作系统: 跨平台

开发语言: Python

软件简介

OpenAI Gym 是一个用于开发和比较强化学习算法的工具包。

gym 不对代理的结构做任何假设，并且与任何数值计算库兼容，例如 TensorFlow 或 Theano。

有关 OpenAI Gym 的白皮书，请访问 http://arxiv.org/abs/1606.01540，这里有一个 BibTeX
条目，可以在出版物中引用它：

@misc{1606.01540,
  Author = {Greg Brockman and Vicki Cheung and Ludwig Pettersson and Jonas Schneider and John Schulman and Jie Tang and Wojciech Zaremba},
  Title = {OpenAI Gym},
  Year = {2016},
  Eprint = {arXiv:1606.01540},
}

Basics

强化学习有两个基本概念：环境（即外部世界）和代理（即你正在编写的算法）。代理向环境发送操作，环境回复观察和奖励（即分数）。

核心的 gym 界面是 Env，它是统一的环境界面。没有代理商界面。以下是应该了解的 Env 方法：

reset(self):：重置环境的状态。返回观察。
step(self, action)：一步一步进入环境。返回观察、奖励、完成、信息。
render(self, mode=’human’)：渲染一帧环境。默认模式将执行人性化的操作，例如弹出窗口。

安装

可以执行最小的安装：

git clone https://github.com/openai/gym.git
cd gym
pip install -e .

可以直接从 PyPI 进行最小的打包版本安装：

pip install gym

可以立即运行一些环境：

算法
toy_text
classic_control（需要 pyglet 来渲染）

建议首先使用这些环境，然后再安装其余环境的依赖项。

软件首页