万本电子书0元读

万本电子书0元读

顶部广告

深度学习电子书

本书目标读者是大三以上的学生,以及广大的工程技术人员,研发人员。亦可以作为统计、计算机、大数据以及相关专业和各交叉学科的教材使用。

售       价:¥

纸质售价:¥75.10购买纸书

21人正在读 | 1人评论 6.2

作       者:陈蔼祥

出  版  社:清华大学出版社

出版时间:2020-08-01

字       数:32.7万

所属分类: 科技 > 计算机/网络 > 软件系统

温馨提示:数字商品不支持退换货,不提供源文件,不支持导出打印

为你推荐

  • 读书简介
  • 目录
  • 累计评论(110条)
  • 读书简介
  • 目录
  • 累计评论(110条)
本书初定五个章节,*章浅层模型部分介绍线性回归、Logistics 回归、Softmax 回归、广义线性回归模型以及机器学习基本概念。第二章介绍深度学习模型以及相应的正则化技术。第三章介绍卷积的物理意义、卷积神经网络及其各种改。第四章介绍反馈神经网络及其改的长短期记忆单元。第五章介绍深度强化学习,展示深度卷积网络如何与强化学习技术融合用以人机围棋博弈以及自动驾驶领域。<br/>【推荐语】<br/>本书目标读者是大三以上的学生,以及广大的工程技术人员,研发人员。亦可以作为统计、计算机、大数据以及相关专业和各交叉学科的教材使用。<br/>【作者】<br/>陈蔼祥,中山大学博士,广东财经大学统计与数学学院副院长,先后访问美国韦恩州立大学、北京大学<br/>
目录展开

封面页

书名页

版权页

内容简介

作者简介

前言

第1章 浅层模型

1.1 深度学习史前发展史

1.1.1 数据分析的初级阶段:手工演算阶段

1.1.2 数据分析的中级阶段:浅层模型阶段

1.1.3 数据分析的高级阶段:大数据深度学习阶段

1.2 线性回归模型

1.2.1 极小二乘线性回归

1.2.2 模型选择:模型容量与过拟合和欠拟合问题

1.2.3 属性空间、假设函数空间与基于核函数的特征映射

1.2.4 特征选择

1.2.5 回归分析的概率解释

1.3 Logistics二分类模型

1.4 Softmax多分类模型

1.5 广义线性模型

参考文献

第2章 深度神经网络

2.1 引言

2.2 BP神经网络

2.2.1 从生物神经元到MP神经元模型

2.2.2 BP神经网络结构

2.2.3 BP算法

2.2.4 BP算法算例

2.3 从BP网络到深度网络

2.3.1 梯度消失:多层BP网络训练难题

2.3.2 逐层贪心预训练+全局微调

2.4 深度网络的进一步解释

2.5 克服过拟合:深度网络中的正则化技术

2.5.1 模型约束技术

2.5.2 输入约束技术

2.5.3 模型集成技术

2.6 深度网络发展史

2.6.1 早期神经网络模型(1958—1969年)

2.6.2 深度学习萌芽期(1969—2006年)

2.6.3 深度学习爆发期(2006年至今)

参考文献

第3章 卷积神经网络

3.1 引言

3.2 卷积的数学公式及其含义

3.3 卷积神经网络的技术细节

3.3.1 计算机“眼”中的图像

3.3.2 卷积神经网络

3.3.3 卷积神经网络的结构

3.3.4 CNNs训练算法

3.3.5 卷积网提取特征的可视化

3.4 CNNs的变体

3.4.1 关于卷积核的变体

3.4.2 关于卷积通道的变体

3.4.3 关于卷积层连接的变体

3.5 卷积网络在自动驾驶中的应用

3.6 卷积网络发展史

参考文献

第4章 反馈神经网络

4.1 引言

4.2 反馈神经网络

4.2.1 统计语言模型

4.2.2 RNNs的网络结构

4.2.3 RNNs的训练算法:BPTT

4.2.4 RNNs的误差沿时间轴传播公式

4.2.5 RNNs的变体

4.3 长短期记忆单元反馈神经网络

4.3.1 早期解决长时间序列学习难题的朴素方法

4.3.2 LSTM网络结构

4.3.3 LSTM的前向计算

4.3.4 LSTM的反向计算

4.3.5 LSTM的权值更新

4.3.6 理解LSTM网络

4.4 时间序列处理中的几种重要机制

4.4.1 处理变长序列的编码器-解码器模型

4.4.2 注意力机制

4.4.3 序列自动对齐的CTC技术

4.4.4 小结

4.5 深度反馈网络在时间序列处理中的应用

4.5.1 Google神经机器翻译系统

4.5.2 深度语音识别系统

4.5.3 用LSTM编程和写作

4.6 反馈神经网络发展现状

参考文献

第5章 深度强化学习

5.1 引言

5.2 马尔可夫决策过程

5.2.1 马尔可夫过程

5.2.2 马尔可夫奖励过程

5.2.3 马尔可夫决策过程

5.2.4 广义策略迭代

5.2.5 小结

5.3 强化学习算法

5.3.1 动态规划算法

5.3.2 蒙特卡罗算法

5.3.3 时间差分学习算法

5.3.4 小结

5.4 深度强化学习算法

5.4.1 基于深度网络的状态价值和动作价值函数近似

5.4.2 基于深度网络的策略梯度法

5.5 深度强化学习的应用

5.5.1 围棋AlphaGo

5.5.2 从AlphaGo到AlphaGo Zero

5.5.3 基于像素的乒乓球游戏

5.6 深度强化学习发展现状

5.6.1 强化学习起源与发展现状

5.6.2 深度强化学习在棋类中的应用

5.6.3 深度强化学习技术在自主智能体中的应用

参考文献

后记

文后彩插

累计评论(110条) 90个书友正在讨论这本书 发表评论

发表评论

发表评论,分享你的想法吧!

买过这本书的人还买过

读了这本书的人还在读

回顶部