当当读书
首页
书房
账户
购物车
分享
分享到
QQ空间
新浪微博
关闭
强化学习:原理与Python实现
肖智清
0
¥
42.50
抢
秒
原价¥42
¥
开通租阅权,免费读此书
提示:数字商品不支持退换货,不提供源文件,不支持导出打印。
评论
赠一得一
收藏
分享
此书籍暂不支持在移动端购买和阅读
秒
剩余
0
天
00
小时
00
分
00
秒
抢
此商品限时抢购中,剩余
1
天
12
小时
31
分
23
秒
减
折
满80元折上8折
N件折
满2件折上8折
N元场
已选1件,再选1件即可享8折
领券
查看对应纸书
25.2
详情
目录
评论(
0
)
内容简介
第1章:介绍强化学习的基础知识与强化学习环境库Gym的使用,并给出完整的编程实例。 第2~9章:介绍强化学习的理论知识。以Markov决策过程为基础模型,覆盖了所有主流强化学习理论和算法,包括资格迹等经典算法和深度确定性梯度策略等深度强化学习算法。所有章节都提供了与算法配套的Python程序,使读者完全掌握强化学习算法的原理与应用。 第10~12章:介绍了多个热门综合案例,包括电动游戏、棋盘游戏和自动驾驶。算法部分涵盖了在《自然》《科学》等权威期刊上发表的多个深度强化学习明星算法,包括AlphaGo的改版AlphaZero。
【推荐语】
适读人群: 1.强化学习算法和研发人员 2. 深度学习研发和算法工程师 3. 大数据架构师 4.其他爱好者。 (1)理论完备,涵盖主流经典强化学习算法和深度强化学习算法,并配套理论基础和性能分析。 (2)逐章配套Python代码,深度强化学习算法同时配套TensorFlow 2和PyTorch 1对照代码。在GitHub上展示全部代码和运行结果。 (3)环境丰富,理论讲解部分的环境只依赖于Gym的简化安装,使理论学习免受环境安装困扰;综合案例部分环境既涵盖Gym库的完整安装和自定义扩展,还包括Gym库以外的环境,让读者体验更加复杂的强化学习任务。全面兼容Windows、macOS和Linux三大操作系统,书中给出环境配置方法。 (4)多个综合案例,涵盖AlphaGo改版算法AlphaZero、自动驾驶等。 (5)对硬件配置要求低,理论讲解部分代码不需要GPU即可运行,综合案例代码只需要普通的GPU即可运行。
【作者】
肖智清 强化学习一线研发人员,清华大学工学博士,现就职于全球知名投资银行。擅长概率统计和机器学习,近5年发表SCI/EI论文十余篇,是多个国际性知名期刊和会议审稿人。在国内外多项程序设计和数据科学竞赛上获得冠军。
展开
作者
肖智清
出版
机械工业出版社
分类
出版物 >
计算机/网络 >
程序设计
大家都在看
换一批
Python网络爬虫:从入门到精通(附微课)
吕云翔 主编
Python数据科学实战
尤利•瓦西列夫(Yuli Vasiliev) 著
算法详解(卷3)——贪心算法和动态规划
蒂姆·拉夫加登(Tim Roughgarden) 著
Python办公效率手册
麦叔 著
面向对象是怎样工作的(第3版)
[日]平泽章 著
Python 3.8从零开始学
刘艳,刘宇宙
算法详解(卷4)——NP-Hard问题算法
蒂姆·拉夫加登(Tim Roughgarden) 著
Python数据分析基础与案例实战
杨果仁 张良均 主编
递归算法与项目实战
阿尔•斯维加特(Al Sweigart) 著
大家都在看
换一批
Python网络爬虫:从入门到精通(附微课)
吕云翔 主编
Python数据科学实战
尤利•瓦西列夫(Yuli Vasiliev) 著
算法详解(卷3)——贪心算法和动态规划
蒂姆·拉夫加登(Tim Roughgarden) 著
Python办公效率手册
麦叔 著
面向对象是怎样工作的(第3版)
[日]平泽章 著
Python 3.8从零开始学
刘艳,刘宇宙
算法详解(卷4)——NP-Hard问题算法
蒂姆·拉夫加登(Tim Roughgarden) 著
Python数据分析基础与案例实战
杨果仁 张良均 主编
递归算法与项目实战
阿尔•斯维加特(Al Sweigart) 著
购物车
购买
免费试读
加入购物车
领取优惠券
温馨提示:
您已领取的礼券,请到【个人中心】-【资产】中查看。
升级VIP,6万精品免费读。
快来当当读书app
取消
确定