当当读书
首页
书房
账户
购物车
分享
分享到
QQ空间
新浪微博
关闭
强化学习的数学原理(英文版)
赵世钰
0
¥
80.24
抢
秒
原价¥80
¥
开通租阅权,免费读此书
提示:数字商品不支持退换货,不提供源文件,不支持导出打印。
评论
赠一得一
收藏
分享
此书籍暂不支持在移动端购买和阅读
秒
剩余
0
天
00
小时
00
分
00
秒
抢
此商品限时抢购中,剩余
1
天
12
小时
31
分
23
秒
减
折
满80元折上8折
N件折
满2件折上8折
N元场
已选1件,再选1件即可享8折
领券
查看对应纸书
25.2
详情
目录
评论(
0
)
内容简介
本书从强化学习最基本的概念始介绍, 将介绍基础的分析工具, 包括贝尔曼公式和贝尔曼最 优公式, 然后推广到基于模型的和无模型的强化学习算法, 最后推广到基于函数逼近的强化学习方 法。本书强调从数学的角度引概念、分析问题、分析算法, 并不强调算法的编程实现。本书不要求 读者具备任何关于强化学习的知识背景, 仅要求读者具备一定的概率论和线性代数的知识。如果读者 已经具备强化学习的学习基础, 本书可以帮助读者更深地理解一些问题并提供新的视角。 本书面向对强化学习感兴趣的本科生、研究生、研究人员和企业或研究所的从业者。
【推荐语】
·从零始到透彻理解,知其然并知其所以然; ·本书在GitHub收获2000 星; ·课程视频全网播放超过80万; ·国内外读者反馈口碑爆棚; ·教材、视频、课件三位一体。
展开
作者
赵世钰
出版
清华大学出版社
分类
出版物 >
自然科学 >
数学
大家都在看
换一批
用Go语言自制解释器
[德] 索斯藤·鲍尔(Thorsten Ball) 著
JavaScript全栈开发
凌杰 著
零基础开发AI Agent——手把手教你用扣子做智能体
叶涛;管锴;等
Scratch少儿编程学AI
李若瑜,李强 著
算法(第4版)
(美)Robert Sedgewick Kevin Wayne 著
Python从入门到精通(第3版)
明日科技
可信计算原理及应用
王勇 王喜媛 张跃宇 编著
纯数学教程(第9版)
(英)戈弗雷·哈代
普林斯顿数学分析读本
(美)拉菲·格林贝格(Raffi Grinberg)
大家都在看
换一批
零基础自学AI应用开发
李光毅 著
PHP入门很轻松(微课超值版)
云尚科技
Visual Basic从入门到精通(微视频精编版)
明日科技
可信计算原理及应用
王勇 王喜媛 张跃宇 编著
C#从入门到精通(第7版)
明日科技
小学生C++创意编程(视频教学版)
刘凤飞
藏地密码1:一部关于西藏的百科全书
何马
天下霸唱循环系列(套装共2册)
天下霸唱之天坑系列(套装共2册)
购物车
购买
免费试读
加入购物车
领取优惠券
温馨提示:
您已领取的礼券,请到【个人中心】-【资产】中查看。
升级VIP,6万精品免费读。
快来当当读书app
取消
确定