强化学习(RL)是用于创建自学习自主智能体的人工智能方法。本书基于强大的理论基础,采用实用的方法来研究强化学习,并使用受现实世界中商业和行业问题启发的实际示例来教授先的强化学习知识。 本书首先介绍老虎机问题、马尔可夫决策过程和动态规划,带你深了解经典强化学习技术,包括蒙特卡罗方法和时间差分学习方法。然后,你将了解深度Q-学习、策略梯度方法、Actor-Critic算法、基于模型的方法以及多智能体强化学习。下来,本书将介绍一些成功的强化学习实现背后的关键方法,例如,域随机化和好奇心驱动的强化学习。 随着学习的深,你将使用现代Python库(例如,TensorFlow和Ray的RLlib包)探索许多具有高级实现的新颖算法。你还将了解如何在机器人、供应管理、市场营销、金融、智慧城市与网络安全等领域应用强化学习技术,同时评估不同方法的利弊并避免常见的陷阱。 学完本书,你将掌握如何训练和部署自己的强化学习智能体来解决强化学习问题。通过阅读本书,你将: ? 使用强化学习建模并解决复杂的序贯决策问题。 ? 深了解先的强化学习方法的工作原理。 ? 使用Python和TensorFlow从头始编写强化学习算法。 ? 使用Ray的RLlib包并行化强化学习实现,以及扩展强化学习实现。 ? 深了解各种强化学习主题。 ? 了解不同强化学习方法之间的利弊。 ? 发现并解决在现实世界中实现强化学习的挑战。
售 价:¥
纸质售价:¥96.70购买纸书
温馨提示:数字商品不支持退换货,不提供源文件,不支持导出打印
为你推荐
THE TRANSLATOR'S WORDS 译者序
PREFACE 前言
ABOUT THE AUTHOR 作者简介
INTRODUCTION TO REVISERS 审校者简介
第一部分 强化学习基础
CHAPTER 1 第1章 强化学习简介
CHAPTER 2 第2章 多臂老虎机
CHAPTER 3 第3章 上下文多臂老虎机
CHAPTER 4 第4章 马尔可夫决策过程的制定
CHAPTER 5 第5章 求解强化学习问题
第二部分 深度强化学习
CHAPTER 6 第6章 规模化的深度Q-学习
CHAPTER 7 第7章 基于策略的方法
CHAPTER 8 第8章 基于模型的方法
CHAPTER 9 第9章 多智能体强化学习
第三部分 强化学习中的高级主题
CHAPTER 10 第10章 机器教学
CHAPTER 11 第11章 泛化和域随机化
CHAPTER 12 第12章 元强化学习
CHAPTER 13 第13章 其他高级主题
第四部分 强化学习的应用
CHAPTER 14 第14章 自主系统
CHAPTER 15 第15章 供应链管理
CHAPTER 16 第16章 营销、个性化和金融
CHAPTER 17 第17章 智慧城市与网络安全
CHAPTER 18 第18章 强化学习领域的挑战和未来方向
买过这本书的人还买过
读了这本书的人还在读
同类图书排行榜