万本电子书0元读

万本电子书0元读

顶部广告

Transformer大模型:原理、实践及应用电子书

售       价:¥

纸质售价:¥56.10购买纸书

3人正在读 | 0人评论 6.6

作       者:陈喆

出  版  社:清华大学出版社

出版时间:2025-09-01

字       数:9.9万

所属分类: 科技 > 计算机/网络 > 软件系统

温馨提示:数字商品不支持退换货,不提供源文件,不支持导出打印

为你推荐

  • 读书简介
  • 目录
  • 累计评论(条)
  • 读书简介
  • 目录
  • 累计评论(条)
这本书的目标读者群体较难界定,介于学校教学和常识性科普之间。而科普内容人们在网上可以即时检索到**内容。故目前还是更偏重于学校教学使用,可作为前沿选修课和相关专业课的参考书。主要内容为生成式AI,如果届时ChatGPT仍然具有广阔前景,再加上ChatGPT的介绍与使用方面的内容。ChatGPT的技术细节,目前OpenAI尚未公布,因此目前来看难以详细讲述ChatGPT。此外,目前在国内还无法注册使用ChatGPT,这是一个很大的挑战,不仅对写书而言,对读者也是如此。<br/>
目录展开

作者简介

内容简介

前言

第1章 引言

1.1 从机器学习到深度学习

1.2 Transformer架构

1.3 PyTorch框架

1.4 深度神经网络

1.5 本书各章之间的联系

1.6 本章小结

1.7 思考与练习

第2章 序列监督学习

2.1 两种序列监督学习

2.2 序列预测

2.3 序列生成

2.4 本章小结

2.5 思考与练习

第3章 序列聚合与注意力机制

3.1 基于标量投影的序列聚合

3.2 选择性序列聚合

3.3 注意力机制与多头注意力机制

3.4 本章小结

3.5 思考与练习

第4章 Transformer架构

4.1 使用样本组训练序列预测模型

4.2 Transformer中的层

4.3 解码器型Transformer

4.4 编码器型Transformer

4.5 编解码器型Transformer

4.6 本章小结

4.7 思考与练习

第5章 Transformer架构在自然语言处理领域的应用

5.1 文本分类

5.2 文本生成

5.3 机器翻译

5.4 语音分类

5.5 语音转文本

5.6 本章小结

5.7 思考与练习

第6章 Transformer架构在计算机视觉领域的应用

6.1 图像分类

6.2 图像说明

6.3 视频分类

6.4 视频预测

6.5 本章小结

6.6 思考与练习

第7章 Transformer架构在其他领域的应用

7.1 Transformer架构在数字信号处理中的应用

7.2 Transformer架构在推荐系统中的应用

7.3 Transformer架构在深度强化学习中的应用

7.4 本章小结

7.5 思考与练习

附录A 实验参考程序及注释

A.1 第1章实验

A.2 第2章实验

A.3 第3章实验

A.4 第4章实验

A.5 第5章实验

A.6 第6章实验

A.7 第7章实验

参考文献

写在后面

累计评论(条) 个书友正在讨论这本书 发表评论

发表评论

发表评论,分享你的想法吧!

买过这本书的人还买过

读了这本书的人还在读

回顶部