这是一本介绍用 OpenAI Gym 构建智能体的实战指南。全书先简要介绍智能体和
学习环境的一些入门知识,概述强化学习和深度强化学习的基本概念和知识点,然后
重点介绍 OpenAI Gym 的相关内容,随后在具体的 Gym 环境中运用强化学习算法构建
智能体。本书还探讨了这些算法在游戏、自动驾驶领域的应用。
本书适合想用 OpenAI Gym 构建智能体的读者阅读,也适合对强化学习和深度强
化学习感兴趣的读者参考。读者应具备一定的 Python 编程基础。
作者简介:
普拉文•巴拉尼沙米(Praveen Palanisamy)专注于研究自主智能系统。他是通用汽 车研发部门的 AI(人工智能)研究员,主要负责针对自动驾驶开发基于深度强化学习的规划和决策算法。在此之前,他在卡内基-梅隆大学机器人所从事自动导航的研究(包括可移动机器人的感知与智能),曾从零开始研发一个完整的、自动的机器人系统。
目录:
第1章 智能体与学习环境入门 1
1.1 智能体简介 1
1.2 学习环境 2
1.3 OpenAI Gym简介 3
1.4 理解OpenAI Gym的主要特性 8
1.5 OpenAI Gym工具包的作用 9
1.6 创建第一个OpenAI Gym环境 9
1.7 小结 11
第2章 强化学习和深度强化学习 12
2.1 强化学习简介 12
2.2 直观理解人工智能的含义和内容 13
2.3 强化学习实战 14
2.4 马尔可夫决策过程 18
2.5 动态规划 19
2.6 蒙特卡洛学习和时序差分学习 19
2.7 SARSA和Q-Learning 20
2.8 深度强化学习 21
2.9 强化学习和深度强化学习算法的实践应用 22
2.10 小结 23
第3章 开启OpenAI Gym和深度强化学习之旅 24
3.1 代码库、设置和配置 24
3.2 安装深度强化学习所需的工具和库 32
3.3 小结 35
第4章 探索Gym及其功能 36
4.1 探索环境列表和术语 36
4.2 理解Gym接口 40
4.3 Gym中的空间 43
4.4 小结 47
第5章 实现第一个智能体—解决过山车问题 48
5.1 了解过山车问题 48
5.2 从零开始实现Q-Learning智能体 50
5.3 在Gym中训练强化学习智能体 58
5.4 测试并记录智能体的性能 58
5.5 一个简单且完整的Q-Learner实现—过山车问题的解决方案 59
5.6 小结 63
第6章 用深度Q-Learning实现最优化控制智能体 64
6.1 优化Q-Learning智能体 65
6.2 实现一个深度Q-Learning智能体 76
6.3 Atari Gym环境 89
6.4 训练深度Q-Learner玩Atari游戏 98
6.5 小结 104
第7章 创建自定义OpenAI Gym环境—CARLA 105
7.1 理解Gym环境结构 105
7.2 创建与OpenAI Gym兼容的CARLA环境 108
7.3 小结 122
第8章 用深度演员-评论家算法实现无人驾驶智能体 123
8.1 深度n步优势演员-评论家算法 123
8.2 实现深度n步优势演员-评论家智能体 133
8.3 训练一个“聪明”的自动驾驶智能体 140
8.4 小结 144
第9章 探索学习环境全景——Roboschool、Gym Retro、StarCraft-Ⅱ和DeepMind Lab 145
9.1 Gym接口兼容的环境 146
9.2 其他基于Python的开源学习环境 153
9.3 小结 160
第10章 探索学习算法世界——DDPG(演员-评论家)、PPO (策略梯度)、Rainbow(基于值) 161
10.1 深度确定性策略梯度 162
10.2 近端策略优化 163
10.3 Rainbow 165
10.4 小结 170
点击下载