万本电子书0元读

万本电子书0元读

顶部广告

深度强化学习理论与实践电子书

本书系统介绍深度强化学习的理论和算法,并配有大量的案例。全书核心内容可以分为3部分,部分为经典强化学习,主要内容有动态规划法,蒙特卡洛法、时序差分法;第二部分为深度强化学习,主要内容有值函数近似法、策略梯度法、策略梯度法阶;第三部分重介绍了深度强化学习的经典应用——AlphaGo系列算法。 ★ 大多数每个算法配有一个或多个测试案例,便于读者理解理论和算法;

售       价:¥

纸质售价:¥84.60购买纸书

24人正在读 | 0人评论 6.7

作       者:龙强、章胜

出  版  社:清华大学出版社

出版时间:2023-03-01

字       数:14.3万

所属分类: 科技 > 计算机/网络 > 软件系统

温馨提示:数字商品不支持退换货,不提供源文件,不支持导出打印

为你推荐

  • 读书简介
  • 目录
  • 累计评论(0条)
  • 读书简介
  • 目录
  • 累计评论(0条)
本书比较全面、系统地介绍了深度强化学习的理论和算法,并配有大量的案例和编程实现。全书核心内容可以分为3部分,部分为经典强化学习,包括第2、3、4章,主要内容有动态规划法,蒙特卡洛法、时序差分法;第二部分为深度强化学习,包括第6、7、8章,主要内容有值函数近似法、策略梯度法、策略梯度法阶;第三部分重介绍了深度强化学习的经典应用——AlphaGo系列算法。另外,作为理论和算法的辅助,第1章介绍了强化学习的模型,第5章简单介绍了深度学习和PyTorch编程框架。 本书可以作为理工科大学相关专业研究生的学位课教材,也可以作为人工智能、机器学习相关专业高年级本科生的选修课教材,还可以作为相关领域学术研究人员、教师和工程技术人员的参考资料。<br/>【推荐语】<br/>本书系统介绍深度强化学习的理论和算法,并配有大量的案例。全书核心内容可以分为3部分,部分为经典强化学习,主要内容有动态规划法,蒙特卡洛法、时序差分法;第二部分为深度强化学习,主要内容有值函数近似法、策略梯度法、策略梯度法阶;第三部分重介绍了深度强化学习的经典应用——AlphaGo系列算法。 ★ 大多数每个算法配有一个或多个测试案例,便于读者理解理论和算法; ★ 每个案例都配有编程实现的代码,便于读者理论联系实际,并亲自上手实践; ★ 为减轻读者编写代码的难度,本书所有案例的代码都是可以独立运行的,并且尽量减少了对依赖包的使用。<br/>【作者】<br/>龙强,博士、副教授、硕士研究生导师;就职于西南科技大学数理学院数据科学系,中国运筹学会终生会员;主要从事化理论与算法、机器学习算法研究;在国际国内学术期刊上发表论文20余篇,获批国家发明专利3项,主持和参与国家自然科学基金3项,参与国家社会科学基金1项;讲授“深度强化学习”“深度学习与神经网络”“算法设计与分析”“化理论与算法”“机器学习”等课程。 章胜,博士、副研究员、硕士研究生导师;就职于中国空气动力研究与发展中心,中国空气动力学学会会员;主要从事飞行器轨迹优化、非线性控制与智能控制研究。在国际及国内学术期刊上发表论文20篇,获批国家发明专利5项,主持和参与国家自然科学基金、国家重基础研究发展计划等项目15项。<br/>
目录展开

作者简介

内容简介

前言

第1章 强化学习的模型

第2章 动态规划法

第3章 蒙特卡罗法

第4章 时序差分法

第5章 深度学习与PyTorch

第6章 值函数近似算法

第7章 策略梯度算法

第8章 策略梯度法进阶

第9章 深度强化学习案例:AlphaGo系列算法

参考文献

累计评论(0条) 0个书友正在讨论这本书 发表评论

发表评论

发表评论,分享你的想法吧!

买过这本书的人还买过

读了这本书的人还在读

回顶部