当前位置: 首页 > 人工智能

《深度强化学习》王树森 pdf电子书[112MB]

简介《深度强化学习》是由王树森编著,本书基于备受读者推崇的王树森“深度强化学习”系列公开视频课,专门解决“入门深度强化学习难”的问题。 本书的独特之处在于:第一,知识精简,剔除一切不必要的概念和公式,学起来轻松;第二,内容新颖,聚焦近1...
《深度强化学习》pdf电子书下载
《深度强化学习》pdf百度网盘
《深度强化学习》pdf百度网盘
《深度强化学习》pdf百度网盘
《深度强化学习》pdf百度网盘

 

本书基于备受读者推崇的王树森“深度强化学习”系列公开视频课,专门解决“入门深度强化学习难”的问题。

本书的独特之处在于:第一,知识精简,剔除一切不必要的概念和公式,学起来轻松;第二,内容新颖,聚焦近10年深度强化学习领域的突破,让你一上手就紧跟最新技术。本书系统讲解深度强化学习的原理与实现,但不回避数学公式和各种模型,原创100多幅精美插图,并以全彩印刷展示。简洁清晰的语言+生动形象的图示,助你扫除任何可能的学习障碍!本书内容分为五部分:基础知识、价值学习、策略学习、多智能体强化学习、应用与展望,涉及DQN、A3C、TRPO、DDPG、AlphaGo等。

本书面向深度强化学习入门读者,助你构建完整的知识体系。学完本书,你能够轻松看懂深度强化学习的实现代码、读懂该领域的论文、听懂学术报告,具备进一步自学和深挖的能力。


作者简介:
王树森 现任小红书基础模型团队负责人,从事搜索和推荐算法研发工作。从浙江大学获得计算机学士和博士学位,就读期间获得“微软学者”和“百度奖学金”等多项荣誉。在加入小红书之前,曾任美国加州大学伯克利分校博士后、美国史蒂文斯理工学院助理教授、博导。在机器学习、强化学习、数值计算、分布式计算等方向有多年科研经验,在计算机国际顶级期刊和会议上发表30多篇论文。 在YouTube、B站开设“深度强化学习”“深度学习”“推荐系统”公开课(ID:Shusen Wang),全网视频播放量超过100万次。 黎彧君 华为诺亚方舟实验室高级研究员,主要从事AutoML相关的研发工作。上海交通大学博士,研究方向为数值优化、强化学习;攻读博士学位期间曾前往普林斯顿大学访问一年。共同翻译出版“花书”《深度学习》。 张志华 北京大学数学科学学院教授。此前先后执教于浙江大学和上海交通... 王树森 现任小红书基础模型团队负责人,从事搜索和推荐算法研发工作。从浙江大学获得计算机学士和博士学位,就读期间获得“微软学者”和“百度奖学金”等多项荣誉。在加入小红书之前,曾任美国加州大学伯克利分校博士后、美国史蒂文斯理工学院助理教授、博导。在机器学习、强化学习、数值计算、分布式计算等方向有多年科研经验,在计算机国际顶级期刊和会议上发表30多篇论文。 在YouTube、B站开设“深度强化学习”“深度学习”“推荐系统”公开课(ID:Shusen Wang),全网视频播放量超过100万次。 黎彧君 华为诺亚方舟实验室高级研究员,主要从事AutoML相关的研发工作。上海交通大学博士,研究方向为数值优化、强化学习;攻读博士学位期间曾前往普林斯顿大学访问一年。共同翻译出版“花书”《深度学习》。 张志华 北京大学数学科学学院教授。此前先后执教于浙江大学和上海交通大学,任计算机科学教授。主要从事统计学、机器学习与计算机科学领域的研究和教学。曾主讲“统计机器学习”“机器学习导论”“深度学习”“强化学习”,其课程视频广受欢迎。

目录:
第一部分 基础知识 1
第1章 机器学习基础 2
第2章 蒙特卡洛方法 20
第3章 强化学习基本概念 34
第二部分 价值学习 51
第4章 DQN与Q学习 52
第5章 SARSA算法 69
第6章 价值学习高级技巧 81
第三部分 策略学习 106
第7章 策略梯度方法 107
第8章 带基线的策略梯度方法 129
第9章 策略学习高级技巧 142
第 10章 连续控制 154
第 11章 对状态的不完全观测 175
第 12章 模仿学习 182
第四部分 多智能体强化学习 199
第 13章 并行计算 200
第 14章 多智能体系统 219
第 15章 完全合作关系设定下的多智能体强化学习 230
第 16章 非合作关系设定下的多智能体强化学习 247
第 17章 注意力机制与多智能体强化学习 267
第五部分 应用与展望 280
第 18章 AlphaGo与蒙特卡洛树搜索 281
第 19章 现实世界中的应用 297
附录A 贝尔曼方程 319
附录B 习题答案 321
参考文献 327

点击下载