万本电子书0元读

万本电子书0元读

顶部广告

Happy-LLM:从零开始构建大模型电子书

1.【从零门体系完整】本书从NLP基础讲起,逐步深Transformer架构、预训练模型到大语言模型,帮读者搭建完整的LLM知识体系。  2.【源社区背书内容靠谱】来自国内领先AI源学习社区Datawhale,作者此前推出的Self-LLM等源教程获国内外发者广泛认可。 3.【手把手实战教学】从基于PyTorch亲手搭建大模型,到借助Transformers框架实现训练、LoRA高效微调,全流程带你动手实践。 4.【覆盖前沿热门应用】讲解大模型评测、检索增强生成RAG、大模型智能体等主流应用,帮助读者快速落地实际项目。

售       价:¥

纸质售价:¥63.00购买纸书

0人正在读 | 0人评论 6.3

作       者:朱信忠 宋志学 邹雨衡

出  版  社:人民邮电出版社有限公司

出版时间:2026-06-01

字       数:17.7万

所属分类: 科技 > 计算机/网络 > 程序设计

温馨提示:数字商品不支持退换货,不提供源文件,不支持导出打印

为你推荐

  • 读书简介
  • 目录
  • 累计评论(条)
  • 读书简介
  • 目录
  • 累计评论(条)
2022年底,ChatGPT的诞生引发变革,以GPT系列模型为代表的大语言模型(Large Language Model,LLM)成为人工智能领域的研究热,LLM在此背景下基于预训练语言模型取得突破性展。本书分为基础知识与实战应用两大部分,基础知识部分包含第1~4章,首先介绍NLP的基本任务及文本表示的发展历程,着阐述LLM基本架构Transformer和经典PLM架构,最后详述LLM的特、能力和训练过程;实战应用部分包含第5~7章,依次讲解基于PyTorch搭建LLM的全流程,借助主流框架实现LLM训练,以及LLM的各类应用,帮助读者构建完整的LLM知识体系。 本书适合具备一定编程经验(尤其对Python编程语言有所了解)、掌握深度学习相关知识且了解NLP领域相关概念和术语的大学生、研究人员及LLM爱好者阅读。<br/>【推荐语】<br/>1.【从零门体系完整】本书从NLP基础讲起,逐步深Transformer架构、预训练模型到大语言模型,帮读者搭建完整的LLM知识体系。  2.【源社区背书内容靠谱】来自国内领先AI源学习社区Datawhale,作者此前推出的Self-LLM等源教程获国内外发者广泛认可。 3.【手把手实战教学】从基于PyTorch亲手搭建大模型,到借助Transformers框架实现训练、LoRA高效微调,全流程带你动手实践。 4.【覆盖前沿热门应用】讲解大模型评测、检索增强生成RAG、大模型智能体等主流应用,帮助读者快速落地实际项目。 5.【化繁为简快乐学习】拆解复杂技术难,让学习大模型变得轻松高效,帮助读者实现学得明白、用得顺畅的学习目标。<br/>【作者】<br/>朱信忠,工学博士,博士生导师,二级教授,浙江省特级专家,浙江师范大学杭州人工智能研究院院长,工业和信息化部人工智能产业创新任务“智能机器人”揭榜挂帅项目负责人,国家高层次人才,国家有突出贡献中青年专家,国家科技步奖二等奖第一完成人,享受国务院政府特殊津贴。Datawhale 首席科学家,Happy-LLM、Hello-Agents 等源项目总体负责人及核心贡献者。主要研究方向为大模型、具身智能、世界模型、自主移动机器人及低空具身等。通过“场景—数据—技术—泛化”闭环迭代,推动具身智能拣货、焊、装配、抹灰、喷涂等下一代“感知—理解—决策—执行”智能体技术与商业的协同化。 宋志学,河南理工大学工学学士、测绘工程硕士,西湖大学通用人工智能实验室科研助理。研究方向为自然语言处理、多模态大模型智能体落地应用。Datawhale 成员,Self-LLM、Happy-LLM 等源项目负责人,所负责项目数十次登上 GitHub 趋势榜单,累计获得GitHub 星标 5.5 万余次。 邹雨衡,对外经济贸易大学数据科学与大数据技术学士、管理科学与工程硕士,小红书人工智能工程师,研究方向为大语言模型、大模型智能体及其落地应用。Datawhale 成员,LLM-Cookbook、LLM-Universe 等源项目负责人,所负责项目数十次登上 GitHub 趋势榜单,累计获得 GitHub 星标 7.6 万余次。<br/>
目录展开

版 权

内 容 提 要

前 言

资源与支持

第1章 NLP基础概念

1.1 什么是NLP

1.2 NLP发展历程

1.3 NLP任务

1.3.1 中文分词

1.3.2 子词切分

1.3.3 词性标注

1.3.4 文本分类

1.3.5 实体识别

1.3.6 关系抽取

1.3.7 文本摘要

1.3.8 机器翻译

1.3.9 自动问答

1.4 文本表示的发展历程

1.4.1 词向量

1.4.2 语言模型

1.4.3 Word2Vec

1.4.4 ELMo

1.5 本章小结

参考资料

第2章 Transformer架构

2.1 注意力机制

2.1.1 什么是注意力机制

2.1.2 深入理解注意力机制

2.1.3 注意力机制的实现

2.1.4 自注意力

2.1.5 掩码自注意力

2.1.6 多头注意力

2.2 编码器-解码器架构

2.2.1 Seq2Seq

2.2.2 全连接神经网络

2.2.3 层归一化

2.2.4 残差连接

2.2.5 编码器

2.2.6 解码器

2.3 搭建一个Transformer模型

2.3.1 嵌入层

2.3.2 位置编码

2.3.3 一个完整的Transformer

参考资料

第3章 PLM

3.1 仅编码器PLM

3.1.1 BERT

3.1.2 RoBERTa

3.1.3 ALBERT

3.2 编码器-解码器PLM

T5

3.3 仅解码器PLM

3.3.1 GPT

3.3.2 LLaMA

3.3.3 GLM

参考资料

第4章 LLM

4.1 什么是LLM

4.1.1 LLM的定义

4.1.2 LLM的能力

4.1.3 LLM的特点

4.2 如何训练一个LLM

4.2.1 预训练

4.2.2 SFT

4.2.3 RLHF

参考资料

第5章 动手搭建大模型

5.1 动手搭建一个LLaMA2大模型

5.1.1 定义超参数

5.1.2 构建RMS归一化

5.1.3 构建LLaMA2 Attention模块

5.1.4 构建LLaMA2 MLP模块

5.1.5 构建LLaMA2的解码器层

5.1.6 构建LLaMA2大模型

5.2 训练分词器

5.2.1 词级分词器

5.2.2 字符级分词器

5.2.3 子词级分词器

5.2.4 训练一个分词器

5.3 预训练一个小型LLM

5.3.1 数据下载

5.3.2 分词器训练实战

5.3.3 数据集

5.3.4 预训练

5.3.5 SFT训练

5.3.6 使用模型生成文本

第6章 大模型训练流程实践

6.1 模型预训练

6.1.1 Transformers框架介绍

6.1.2 初始化LLM

6.1.3 预训练数据处理

6.1.4 使用Trainer类进行训练

6.1.5 使用DeepSpeed实现分布式训练

6.2 模型SFT

6.2.1 预训练与SFT

6.2.2 微调数据处理

6.3 高效微调

6.3.1 高效微调方案

6.3.2 LoRA微调

6.3.3 LoRA微调的原理

6.3.4 LoRA微调的代码实现

6.3.5 使用peft实现LoRA微调

参考资料

第7章 大模型应用

7.1 大模型评测

7.1.1 LLM的评测数据集

7.1.2 主流的大模型评测榜单

7.1.3 特定的大模型评测榜单

7.2 RAG

7.2.1 RAG的基本原理

7.2.2 实现一个RAG框架

7.3 智能体

7.3.1 什么是智能体

7.3.2 智能体的类型

7.3.3 动手构造一个小型智能体

参考资料

累计评论(条) 个书友正在讨论这本书 发表评论

发表评论

发表评论,分享你的想法吧!

买过这本书的人还买过

读了这本书的人还在读

回顶部