当当云阅读 > 科技 > 计算机/网络 > 计算机理论与教程 > 大语言模型全链路解析:从架构设计、训练优化到应用开发

大语言模型全链路解析:从架构设计、训练优化到应用开发电子书

（1）作者背景资深：作者曾就职于腾讯和阿里巴巴，主导腾讯游戏广告算法、零售通推荐系统、增长智能建模等核心项目，CIKM国际顶会论文作者，5项发明专利。（2）专家力荐背书：来自清华大学和中山大学等高校的知名教授、国家杰出青年、腾讯等企业的科学家等9位专家联合推荐。（3）全路系统讲解：从技术原理到架构设计，从模型训练到应用发，从行业痛到解决方案，为读者构建大模型全条知识闭环。

售价：¥

纸质售价：¥71.30购买纸书

6人正在读 | 0人评论

6.5

作者：袁从德

出版社：机械工业出版社

出版时间：2026-03-27

字数：21.6万

所属分类：科技 > 计算机/网络 > 计算机理论与教程

温馨提示：数字商品不支持退换货，不提供源文件，不支持导出打印

为你推荐

读书简介
目录
累计评论(条)

读书简介
目录
累计评论(条)

这是一本系统讲解大语言模型全路技术的实战指南，以“基础理论—技术实践—产业应用—未来发展”为逻辑主线，覆盖从技术原理、架构设计、训练优化到应用发和产业落地的完整知识体系。本书是资深人工智能与算法工程专家在腾讯的大模型实战经验总结，内容分为四篇。第一篇初识大语言模型。梳理大语言模型发展历程与核心概念，解析预训练与微调机制，对比传统循环神经网络与Transformer架构差异，结合数学知识为零基础读者构建认知框架。第二篇大语言模型全解析。遵循“基础架构—训练方法—技术案例—后训练优化—评测体系—性能提升”的逻辑条展，聚焦DeepSeek的技术突破，系统讲解预训练目标设计、后训练优化（SFT/RLHF）、模型评测体系，并深分析推理性能瓶颈及在硬件加速与算法层面的优化方案。第三篇大语言模型应用发及实践。紧扣真实场景落地需求，详解提示工程、思维、检索增强生成及智能体发的全流程方法论与工具整合策略。第四篇大语言模型的未来发展。前瞻性地探讨多模态融合（如视觉-语言指令微调）、具身智能与通用人工智能（AGI）的演路径，为技术决策者提供战略级行业洞察。大语言模型正以颠覆性力量重塑人工智能的边界。本书致力于成为连理论探索与工程实践的坚实桥梁——无论你是希望夯实技术根基的工程师，还是谋划未来布局的战略决策者，都能从中获得启发，在通往通用智能的浪潮中，走出属于自己的创新路径。 【推荐语】 （1）作者背景资深：作者曾就职于腾讯和阿里巴巴，主导腾讯游戏广告算法、零售通推荐系统、增长智能建模等核心项目，CIKM国际顶会论文作者，5项发明专利。（2）专家力荐背书：来自清华大学和中山大学等高校的知名教授、国家杰出青年、腾讯等企业的科学家等9位专家联合推荐。（3）全路系统讲解：从技术原理到架构设计，从模型训练到应用发，从行业痛到解决方案，为读者构建大模型全条知识闭环。（4）技术前沿领先：涵盖DeepSeek模型揭秘、混合专家架构、多头潜在注意力、RLHF、低秩适应、智能体等最新技术。（5）理论实践结合：深阐述数学原理与算法逻辑，配合DeepSeek训练优化、模型测评、推理加速等丰富实战案例。（6）应用场景全面：覆盖生产力场景与生活娱乐场景，详解提示工程、思维、RAG及单/多智能体发方法论。（7）面向多重读者：适合AI技术从业者、企业决策者、科研学者及技术爱好者系统学习。 【作者】 袁从德人工智能与算法工程专家，拥有10余年头部互联网企业技术研发与团队管理经验。曾任职于腾讯、阿里巴巴，主导腾讯游戏广告算法、零售通推荐系统、增长智能建模等核心项目，在广告出价、排序模型预估、预算优化、大模型应用及数据基础设施等领域取得多项技术突破，相关成果发表于 CIKM 等国际顶会，并获中国及中国香港地区发明专利5项。2025年起投身创业，聚焦大语言模型在跨境电商达人营销与青少年心理健康等垂直场景的全路落地。极客时间《强化学习实战》《大模型应用发》专栏作者，CIKM 2022–2025 连续三年以第一作者身份发表广告与推荐系统方向论文，并担任2025年全国大学生“区块+”应用大赛评委。

目录展开