本书系统介绍深度强化学习的理论和算法,并配有大量的案例。全书核心内容可以分为3部分,部分为经典强化学习,主要内容有动态规划法,蒙特卡洛法、时序差分法;第二部分为深度强化学习,主要内容有值函数近似法、策略梯度法、策略梯度法阶;第三部分重介绍了深度强化学习的经典应用——AlphaGo系列算法。 ★ 大多数每个算法配有一个或多个测试案例,便于读者理解理论和算法;
售 价:¥
纸质售价:¥70.30购买纸书
温馨提示:数字商品不支持退换货,不提供源文件,不支持导出打印
为你推荐
作者简介
内容简介
前言
第1章 强化学习的模型
第2章 动态规划法
第3章 蒙特卡罗法
第4章 时序差分法
第5章 深度学习与PyTorch
第6章 值函数近似算法
第7章 策略梯度算法
第8章 策略梯度法进阶
第9章 深度强化学习案例:AlphaGo系列算法
参考文献
买过这本书的人还买过
读了这本书的人还在读
同类图书排行榜