当当云阅读 > 科技 > 计算机/网络 > 软件系统 > 深度强化学习理论与实践

深度强化学习理论与实践电子书

本书系统介绍深度强化学习的理论和算法，并配有大量的案例。全书核心内容可以分为3部分，部分为经典强化学习，主要内容有动态规划法，蒙特卡洛法、时序差分法；第二部分为深度强化学习，主要内容有值函数近似法、策略梯度法、策略梯度法阶；第三部分重介绍了深度强化学习的经典应用——AlphaGo系列算法。 ★ 大多数每个算法配有一个或多个测试案例，便于读者理解理论和算法；

售价：¥

纸质售价：¥70.30购买纸书

18人正在读 | 0人评论

6.7

作者：龙强、章胜

出版社：清华大学出版社

出版时间：2023-03-01

字数：14.3万

所属分类：科技 > 计算机/网络 > 软件系统

温馨提示：数字商品不支持退换货，不提供源文件，不支持导出打印

为你推荐

读书简介
目录
累计评论(0条)

读书简介
目录
累计评论(0条)

本书比较全面、系统地介绍了深度强化学习的理论和算法，并配有大量的案例和编程实现。全书核心内容可以分为3部分，部分为经典强化学习，包括第2、3、4章，主要内容有动态规划法，蒙特卡洛法、时序差分法；第二部分为深度强化学习，包括第6、7、8章，主要内容有值函数近似法、策略梯度法、策略梯度法阶；第三部分重介绍了深度强化学习的经典应用——AlphaGo系列算法。另外，作为理论和算法的辅助，第1章介绍了强化学习的模型，第5章简单介绍了深度学习和PyTorch编程框架。本书可以作为理工科大学相关专业研究生的学位课教材，也可以作为人工智能、机器学习相关专业高年级本科生的选修课教材，还可以作为相关领域学术研究人员、教师和工程技术人员的参考资料。 【推荐语】 本书系统介绍深度强化学习的理论和算法，并配有大量的案例。全书核心内容可以分为3部分，部分为经典强化学习，主要内容有动态规划法，蒙特卡洛法、时序差分法；第二部分为深度强化学习，主要内容有值函数近似法、策略梯度法、策略梯度法阶；第三部分重介绍了深度强化学习的经典应用——AlphaGo系列算法。 ★ 大多数每个算法配有一个或多个测试案例，便于读者理解理论和算法； ★ 每个案例都配有编程实现的代码，便于读者理论联系实际，并亲自上手实践； ★ 为减轻读者编写代码的难度，本书所有案例的代码都是可以独立运行的，并且尽量减少了对依赖包的使用。 【作者】 龙强，博士、副教授、硕士研究生导师；就职于西南科技大学数理学院数据科学系，中国运筹学会终生会员；主要从事化理论与算法、机器学习算法研究；在国际国内学术期刊上发表论文20余篇，获批国家发明专利3项，主持和参与国家自然科学基金3项，参与国家社会科学基金1项；讲授“深度强化学习”“深度学习与神经网络”“算法设计与分析”“化理论与算法”“机器学习”等课程。章胜，博士、副研究员、硕士研究生导师；就职于中国空气动力研究与发展中心，中国空气动力学学会会员；主要从事飞行器轨迹优化、非线性控制与智能控制研究。在国际及国内学术期刊上发表论文20篇，获批国家发明专利5项，主持和参与国家自然科学基金、国家重基础研究发展计划等项目15项。

目录展开