当当云阅读 > 科技 > 计算机/网络 > 计算机理论与教程 > Python强化学习:算法、核心技术与行业应用

Python强化学习:算法、核心技术与行业应用电子书

强化学习(RL)是用于创建自学习自主智能体的人工智能方法。本书基于强大的理论基础，采用实用的方法来研究强化学习，并使用受现实世界中商业和行业问题启发的实际示例来教授先的强化学习知识。本书首先介绍老虎机问题、马尔可夫决策过程和动态规划，带你深了解经典强化学习技术，包括蒙特卡罗方法和时间差分学习方法。然后，你将了解深度Q-学习、策略梯度方法、Actor-Critic算法、基于模型的方法以及多智能体强化学习。下来，本书将介绍一些成功的强化学习实现背后的关键方法，例如，域随机化和好奇心驱动的强化学习。随着学习的深，你将使用现代Python库（例如，TensorFlow和Ray的RLlib包）探索许多具有高级实现的新颖算法。你还将了解如何在机器人、供应管理、市场营销、金融、智慧城市与网络安全等领域应用强化学习技术，同时评估不同方法的利弊并避免常见的陷阱。学完本书，你将掌握如何训练和部署自己的强化学习智能体来解决强化学习问题。通过阅读本书，你将： ? 使用强化学习建模并解决复杂的序贯决策问题。 ? 深了解先的强化学习方法的工作原理。 ? 使用Python和TensorFlow从头始编写强化学习算法。 ? 使用Ray的RLlib包并行化强化学习实现，以及扩展强化学习实现。 ? 深了解各种强化学习主题。 ? 了解不同强化学习方法之间的利弊。 ? 发现并解决在现实世界中实现强化学习的挑战。

售价：¥

纸质售价：¥96.70购买纸书

27人正在读 | 0人评论

6.8

作者：(美)埃内斯·比尔金(Enes Bilgin)

出版社：机械工业出版社

出版时间：2023-09-22

字数：23.6万

所属分类：科技 > 计算机/网络 > 计算机理论与教程

温馨提示：数字商品不支持退换货，不提供源文件，不支持导出打印

为你推荐

读书简介
目录
累计评论(0条)

读书简介
目录
累计评论(0条)

本书使用受现实世界商业和行业问题启发的实际示例来讲授强化学习技术的相关知识。本书分为四部分：部分涵盖强化学习的必要背景，包括定义、数学基础和强化学习解决方案的概述；第二部分深介绍先的强化学习算法（规模化的深度Q-学习、基于策略的方法、基于模型的方法、多智能体强化学习等），包括每种算法的优缺；第三部分介绍强化学习中的高级技术，包括机器教学、泛化和域随机化、元强化学习等主题，还涵盖强化学习中有助于改模型的各种高级主题；第四部分讲解强化学习的各种应用，例如自主系统、供应管理、营销和金融、智慧城市与网络安全等，并讨论强化学习领域的一些挑战及未来方向。学完本书，你将掌握如何训练和部署自己的强化学习智能体来解决强化学习问题。 【推荐语】 强化学习(RL)是用于创建自学习自主智能体的人工智能方法。本书基于强大的理论基础，采用实用的方法来研究强化学习，并使用受现实世界中商业和行业问题启发的实际示例来教授先的强化学习知识。本书首先介绍老虎机问题、马尔可夫决策过程和动态规划，带你深了解经典强化学习技术，包括蒙特卡罗方法和时间差分学习方法。然后，你将了解深度Q-学习、策略梯度方法、Actor-Critic算法、基于模型的方法以及多智能体强化学习。下来，本书将介绍一些成功的强化学习实现背后的关键方法，例如，域随机化和好奇心驱动的强化学习。随着学习的深，你将使用现代Python库（例如，TensorFlow和Ray的RLlib包）探索许多具有高级实现的新颖算法。你还将了解如何在机器人、供应管理、市场营销、金融、智慧城市与网络安全等领域应用强化学习技术，同时评估不同方法的利弊并避免常见的陷阱。学完本书，你将掌握如何训练和部署自己的强化学习智能体来解决强化学习问题。通过阅读本书，你将：使用强化学习建模并解决复杂的序贯决策问题。深了解先的强化学习方法的工作原理。使用Python和TensorFlow从头始编写强化学习算法。使用Ray的RLlib包并行化强化学习实现，以及扩展强化学习实现。深了解各种强化学习主题。了解不同强化学习方法之间的利弊。发现并解决在现实世界中实现强化学习的挑战。 【作者】 埃内斯·比尔金（Enes Bilgin）微软自主系统部门的高级人工智能工程师和技术主管。他是一名机器学习与运筹学从业者和研究员，在使用Python、TensorFlow和Ray/RLlib为顶级科技公司构建生产系统和模型方面拥有丰富的经验。他拥有波士顿大学系统工程硕士学位和博士学位，以及比尔肯特大学工业工程学士学位。他曾在亚马逊担任研究科学家，并在AMD担任过运筹学研究科学家，还在得克萨斯大学奥斯汀分校的麦库姆斯商学院和得克萨斯州立大学的英格拉姆工程学院担任过兼职教师。

目录展开