读者对象: 本书面向普通大众,指导读者以PyTorch为工具,在Python中实践深度强化学习。读者只需要具备一些基本的编程经验和基本的线性代数知识即可读懂书中内容,通过实现具体程序来掌握深度强化学习的相关知识。 本书内容: 介绍监督学习、非监督学习和强化学习的基本知识。 通过走迷宫任务介绍三种不同的算法(策略梯度法、Sarsa和Q学习)。 使用Anaconda设置本地PC,在倒立摆任务中实现强化学习。
售 价:¥
纸质售价:¥48.30购买纸书
温馨提示:数字商品不支持退换货,不提供源文件,不支持导出打印
为你推荐
译者序
前言
第1章 强化学习概述
1.1 机器学习的分类(监督学习、非监督学习、强化学习)
1.2 强化学习、深度强化学习的历史
1.3 深度强化学习的应用实例
参考文献
第2章 在走迷宫任务中实现强化学习
2.1 Try Jupyter的使用方法
2.2 迷宫和智能体的实现
2.3 策略迭代法的实现
2.4 价值迭代法的术语整理
2.5 Sarsa的实现
2.6 实现Q学习
参考文献
第3章 在倒立摆任务中实现强化学习
3.1 在本地PC上准备强化学习的实现和执行环境
3.2 倒立摆任务“CartPole”
3.3 由多变量连续值表示的状态的表格表示
3.4 Q学习的实现
参考文献
第4章 使用PyTorch实现深度学习
4.1 神经网络和深度学习的历史
4.2 深度学习的计算方法
4.3 使用PyTorch实现MNIST手写数字分类任务
参考文献
第5章 深度强化学习DQN的实现
5.1 深度强化学习DQN(深度Q网络)的说明
5.2 实现DQN的四个要点
5.3 实现DQN(上)
5.4 实现DQN(下)
参考文献
第6章 实现深度强化学习的改进版
6.1 深度强化学习算法发展图
6.2 DDQN的实现
6.3 Dueling Network的实现
6.4 优先经验回放的实现
6.5 A2C的实现
参考文献
第7章 在AWS GPU环境中实现消砖块游戏
7.1 消砖块游戏“Breakout”的描述
7.2 准备在AWS上使用GPU所需要的深度学习执行环境
7.3 学习Breakout的四个关键思想
7.4 A2C的实现(上)
7.5 A2C的实现(下)
参考文献
后记
买过这本书的人还买过
读了这本书的人还在读
同类图书排行榜