欢迎光临当当，请登录免费注册

男频| 女频

当当云阅读

当当云阅读文字

万本电子书0元读

万本电子书0元读

搜索

购物车

图书分类

小说: 侦探/悬疑/推理; 情感/都市; 科幻/魔幻; 作品集; 外国小说

文艺: 文学; 青春文学; 传记; 艺术; 动漫/幽默

历史文化: 哲学/宗教; 历史; 政治/军事; 文化; 社会科学; 古籍; 法律

经济/管理: 管理; 经济; 投资理财; 市场/营销; 商务沟通; 中国经济; 国际经济

心理/励志: 心理学; 女性心理学; 儿童心理学; 情绪管理; 职场/人际交往; 人生哲学

生活: 两性关系; 亲子/家教; 旅游/地图; 烹饪/美食; 保健/养生

童书: 儿童文学; 启蒙读物; 少儿英语; 动漫/图画书

科技/教育: 科普读物; 计算机/网络; 自然科学; 中小学教辅; 考试; 外语; 工具书

原版书: 外文原版书; 港台圖書; 小语种

我要充值赠送20%

顶部广告

当当云阅读 > 科技 > 计算机/网络 > 程序设计 > 边做边学深度强化学习:PyTorch程序设计实践

边做边学深度强化学习:PyTorch程序设计实践

| | 手机阅读

扫描下载当当云阅读App

边做边学深度强化学习:PyTorch程序设计实践电子书

读者对象：本书面向普通大众，指导读者以PyTorch为工具，在Python中实践深度强化学习。读者只需要具备一些基本的编程经验和基本的线性代数知识即可读懂书中内容，通过实现具体程序来掌握深度强化学习的相关知识。本书内容：介绍监督学习、非监督学习和强化学习的基本知识。通过走迷宫任务介绍三种不同的算法（策略梯度法、Sarsa和Q学习）。使用Anaconda设置本地PC，在倒立摆任务中实现强化学习。

售价：¥

纸质售价：¥49.70购买纸书

52人正在读 | 0人评论

6.7

作者：(日)小川雄太郎

出版社：机械工业出版社

出版时间：2020-04-01

字数：7.4万

所属分类：科技 > 计算机/网络 > 程序设计

温馨提示：数字商品不支持退换货，不提供源文件，不支持导出打印

为你推荐

读书简介
目录
累计评论(2条)

读书简介
目录
累计评论(2条)

Pytorch是基于python且具备强大GPU加速的张量和动态神经网络，更是Python中优先的深度学习框架，它使用强大的 GPU 能力,提供*大的灵活性和速度。本书指导读者以Pytorch为工具在Python中学习深层强化学习(DQN)。主要内容包括：强化学习概述及分类、强化学习的算法和实施方法、在Pytorch中实施深度规划与实现。、“实施深层强化学习DQN”、理解并实施新的深层强化学习方法（Double-DQN、Dueling Network、Prioritized Experience Replay、A3C、A2C）。<br/>

目录展开

译者序

前言

第1章强化学习概述

1.1 机器学习的分类（监督学习、非监督学习、强化学习）

1.2 强化学习、深度强化学习的历史

1.3 深度强化学习的应用实例

参考文献

第2章在走迷宫任务中实现强化学习

2.1 Try Jupyter的使用方法

2.2 迷宫和智能体的实现

2.3 策略迭代法的实现

2.4 价值迭代法的术语整理

2.5 Sarsa的实现

2.6 实现Q学习

参考文献

第3章在倒立摆任务中实现强化学习

3.1 在本地PC上准备强化学习的实现和执行环境

3.2 倒立摆任务“CartPole”

3.3 由多变量连续值表示的状态的表格表示

3.4 Q学习的实现

参考文献

第4章使用PyTorch实现深度学习

4.1 神经网络和深度学习的历史

4.2 深度学习的计算方法

4.3 使用PyTorch实现MNIST手写数字分类任务

参考文献

第5章深度强化学习DQN的实现

5.1 深度强化学习DQN（深度Q网络）的说明

5.2 实现DQN的四个要点

5.3 实现DQN（上）

5.4 实现DQN（下）

参考文献

第6章实现深度强化学习的改进版

6.1 深度强化学习算法发展图

6.2 DDQN的实现

6.3 Dueling Network的实现

6.4 优先经验回放的实现

6.5 A2C的实现

参考文献

第7章在AWS GPU环境中实现消砖块游戏

7.1 消砖块游戏“Breakout”的描述

7.2 准备在AWS上使用GPU所需要的深度学习执行环境

7.3 学习Breakout的四个关键思想

7.4 A2C的实现（上）

7.5 A2C的实现（下）

参考文献

后记

累计评论(2条) 2个书友正在讨论这本书 发表评论

发表评论

发表评论，分享你的想法吧！

当当云阅读

买过这本书的人还买过

读了这本书的人还在读

支持设备

同类图书排行榜

01

图解Skill:AI提效实战指南

图解Skill:AI提效实战指南￥39.90

宝玉著

￥39.90

02

Python从入门到全栈开发

Python从入门到全栈开发￥70.00

钱超

￥70.00

03

大模型应用开发动手做AI Agent

大模型应用开发动手做AI Agent ￥57.47

黄佳著

￥57.47

04

Python编程:从入门到实践(第3版)

Python编程:从入门到实践(第3版) ￥54.90

[美]埃里克·马瑟斯(Eric Matthes) 著

￥54.90

05

Python网络爬虫与数据分析从入门到实践

Python网络爬虫与数据分析从入门到实践￥55.86

马国俊

￥55.86

06

程序员必会的40种算法

程序员必会的40种算法￥59.40

(加)伊姆兰·艾哈迈德(Imran Ahmad)

￥59.40

07

Python完全自学教程

Python完全自学教程￥57.54

明日科技编著

￥57.54

08

懒人“养虾”攻略:OpenClaw+豆包+扣子+飞书落地实战指南

懒人“养虾”攻略:OpenClaw+豆包+扣子+飞书落地实战指南￥45.00

林园编著

￥45.00

09

Python+Office:轻松实现Python办公自动化

Python+Office:轻松实现Python办公自动化￥55.30

王国平

￥55.30

10

量化投资：策略与技术

量化投资：策略与技术￥22.00

丁鹏

￥22.00

更多同类图书 >

电子书排行榜

新书排行榜

5元封顶

关注我们

最受欢迎的阅读产品

关注我们：
- 新浪微博
- 官方微信
关于我们

欢迎反馈宝贵意见给我们

客服书吧：当当云阅读问答

意见反馈

Copyright (C) 当当网 2004-2022, All Rights Reserved

京ICP备17043473号-1 | 出版物经营许可证新出发京批字第直0673号

当当网收录的免费小说作品、频道内容、书友评论、用户上传文字、图片等其他一切内容及在当当网所做之广告均属用户个人行为，与当当网无关。

当当云阅读

二维码

0元畅读数万本精选电子书