万本电子书0元读

万本电子书0元读

顶部广告

大语言模型全链路解析:从架构设计、训练优化到应用开发电子书

(1)作者背景资深:作者曾就职于腾讯和阿里巴巴,主导腾讯游戏广告算法、零售通推荐系统、增长智能建模等核心项目,CIKM国际顶会论文作者,5项发明专利。 (2)专家力荐背书:来自清华大学和中山大学等高校的知名教授、国家杰出青年、腾讯等企业的科学家等9位专家联合推荐。 (3)全路系统讲解:从技术原理到架构设计,从模型训练到应用发,从行业痛到解决方案,为读者构建大模型全条知识闭环。

售       价:¥

纸质售价:¥71.30购买纸书

1人正在读 | 0人评论 6.5

作       者:袁从德

出  版  社:机械工业出版社

出版时间:2026-03-27

字       数:21.6万

所属分类: 科技 > 计算机/网络 > 计算机理论与教程

温馨提示:数字商品不支持退换货,不提供源文件,不支持导出打印

为你推荐

  • 读书简介
  • 目录
  • 累计评论(条)
  • 读书简介
  • 目录
  • 累计评论(条)
这是一本系统讲解大语言模型全路技术的实战指南,以“基础理论—技术实践—产业应用—未来发展”为逻辑主线,覆盖从技术原理、架构设计、训练优化到应用发和产业落地的完整知识体系。 本书是资深人工智能与算法工程专家在腾讯的大模型实战经验总结,内容分为四篇。 第一篇 初识大语言模型。梳理大语言模型发展历程与核心概念,解析预训练与微调机制,对比传统循环神经网络与Transformer架构差异,结合数学知识为零基础读者构建认知框架。 第二篇 大语言模型全解析。遵循“基础架构—训练方法—技术案例—后训练优化—评测体系—性能提升”的逻辑条展,聚焦DeepSeek的技术突破,系统讲解预训练目标设计、后训练优化(SFT/RLHF)、模型评测体系,并深分析推理性能瓶颈及在硬件加速与算法层面的优化方案。 第三篇 大语言模型应用发及实践。紧扣真实场景落地需求,详解提示工程、思维、检索增强生成及智能体发的全流程方法论与工具整合策略。 第四篇 大语言模型的未来发展。前瞻性地探讨多模态融合(如视觉-语言指令微调)、具身智能与通用人工智能(AGI)的演路径,为技术决策者提供战略级行业洞察。 大语言模型正以颠覆性力量重塑人工智能的边界。本书致力于成为连理论探索与工程实践的坚实桥梁——无论你是希望夯实技术根基的工程师,还是谋划未来布局的战略决策者,都能从中获得启发,在通往通用智能的浪潮中,走出属于自己的创新路径。<br/>【推荐语】<br/>(1)作者背景资深:作者曾就职于腾讯和阿里巴巴,主导腾讯游戏广告算法、零售通推荐系统、增长智能建模等核心项目,CIKM国际顶会论文作者,5项发明专利。 (2)专家力荐背书:来自清华大学和中山大学等高校的知名教授、国家杰出青年、腾讯等企业的科学家等9位专家联合推荐。 (3)全路系统讲解:从技术原理到架构设计,从模型训练到应用发,从行业痛到解决方案,为读者构建大模型全条知识闭环。 (4)技术前沿领先:涵盖DeepSeek模型揭秘、混合专家架构、多头潜在注意力、RLHF、低秩适应、智能体等最新技术。 (5)理论实践结合:深阐述数学原理与算法逻辑,配合DeepSeek训练优化、模型测评、推理加速等丰富实战案例。 (6)应用场景全面:覆盖生产力场景与生活娱乐场景,详解提示工程、思维、RAG及单/多智能体发方法论。 (7)面向多重读者:适合AI技术从业者、企业决策者、科研学者及技术爱好者系统学习。<br/>【作者】<br/>袁从德  人工智能与算法工程专家,拥有10余年头部互联网企业技术研发与团队管理经验。曾任职于腾讯、阿里巴巴,主导腾讯游戏广告算法、零售通推荐系统、增长智能建模等核心项目,在广告出价、排序模型预估、预算优化、大模型应用及数据基础设施等领域取得多项技术突破,相关成果发表于 CIKM 等国际顶会,并获中国及中国香港地区发明专利5项。2025年起投身创业,聚焦大语言模型在跨境电商达人营销与青少年心理健康等垂直场景的全路落地。  极客时间《强化学习实战》《大模型应用发》专栏作者,CIKM 2022–2025 连续三年以第一作者身份发表广告与推荐系统方向论文,并担任2025年全国大学生“区块+”应用大赛评委。<br/>
目录展开

Preface 前言

第一篇 初识大语言模型

Chapter 1 第1章 走近大语言模型

1.1 大语言模型的发展历程

1.2 语言模型的核心概念

1.3 预训练和微调

Chapter 2 第2章 探索大语言模型的关键技术

2.1 大语言模型的基础知识

2.2 在Transformer之前的常用模型

2.3 Transformer

2.4 解码策略

2.5 嵌入技术

2.6 扩展法则和涌现能力

第二篇 大语言模型全解析

Chapter 3 第3章 大语言模型的架构及训练方法

3.1 大语言模型的主流架构

3.2 数据准备

3.3 大语言模型训练

3.4 增量训练

3.5 常见的训练策略

Chapter 4 第4章 DeepSeek模型创新揭秘

4.1 DeepSeek是中国AI领域的“斯普特尼克时刻”

4.2 DeepSeek系列模型的技术创新

4.3 基于人类反馈的强化学习

Chapter 5 第5章 模型编辑

5.1 模型编辑简介

5.2 模型编辑的经典方法

5.3 模型编辑的应用

Chapter 6 第6章 大语言模型微调

6.1 微调简介

6.2 参数高效微调——参数附加方法

6.3 参数高效微调——参数选择方法

6.4 参数高效微调——低秩适应方法

Chapter 7 第7章 大语言模型评测

7.1 大语言模型评测概述

7.2 评测平台和评测基准

Chapter 8 第8章 推理性能优化

8.1 问题分析

8.2 大语言模型推理框架

8.3 硬件层面的计算加速

8.4 算法层面的计算加速

第三篇 大语言模型应用开发及实践

Chapter 9 第9章 从应用场景到开发理论框架

9.1 大语言模型的应用

9.2 大语言模型应用的工作流程

9.3 大语言模型应用的开发流程

9.4 大语言模型应用开发面临的挑战

Chapter 10 第10章 提示工程

10.1 提示工程简介

10.2 上下文学习

10.3 提示自适应优化

10.4 设计提示词的准则与模板解析

Chapter 11 第11章 思维链构建

11.1 思维链简介

11.2 思维链的应用

11.3 思维链的变体

11.4 思维链的训练方式

11.5 思维链提示技术的优势和局限性

Chapter 12 第12章 检索增强生成

12.1 检索增强生成简介

12.2 问答场景检索增强生成实践

12.3 检索增强生成与有监督微调对比

12.4 未来趋势

Chapter 13 第13章 智能体开发

13.1 大语言模型和智能体结合的核心价值与技术瓶颈

13.2 大语言模型驱动的智能体

13.3 智能体的技术实现框架

13.4 智能体多元化落地

第四篇 大语言模型的未来发展

Chapter 14 第14章 大语言模型的发展方向

14.1 开源之争和盈利模式

14.2 通往AGI的道路

14.3 技术思考

14.4 大语言模型的核心问题和前景

Chapter 15 第15章 多模态融合

15.1 多模态指令微调

15.2 多模态上下文学习

15.3 多模态思维链

15.4 多模态辅助推理能力

累计评论(条) 个书友正在讨论这本书 发表评论

发表评论

发表评论,分享你的想法吧!

买过这本书的人还买过

读了这本书的人还在读

回顶部