在人工智能领域快速发展的当下,大模型技术已成为行业焦,而DeepSeek作为大规模产业应用的技术引领者,正发挥着愈发重要的作用。《基于DeepSeek大模型的深度应用实践》一书,将为您启一场从理论到实践全面探索DeepSeek的知识盛宴。 《基于DeepSeek大模型的深度应用实践》详细阐述了DeepSeek的技术细节,并通过丰富的案例分析展现了其在实际中的应用潜力。全书结构清晰,层次分明,共分为三部分,总计11章,内容涵盖从基础理论到行业实践的方方面面,为读者提供了一份全面且系统的学习指南。
售 价:¥
纸质售价:¥129.00购买纸书
6.4
温馨提示:数字商品不支持退换货,不提供源文件,不支持导出打印
为你推荐

作者简介
内容简介
前言
第1部分 理论基础与技术实现
第1章 大模型技术导论
1.1 深度学习与大模型的演进
1.1.1 深度学习的历史背景
1.1.2 Transformer架构的崛起与影响
1.1.3 MoE模型简介
1.2 大模型的核心概念
1.2.1 参数规模与计算复杂度
1.2.2 数据驱动的模型优化
1.2.3 架构创新的推动作用
1.3 生态系统与开源框架
1.3.1 开源模型的价值
1.3.2 DeepSeek系列模型生态概述
1.3.3 应用场景与案例
1.4 面向应用的智能模型构建
1.4.1 从理论到实践的转换
1.4.2 应用开发中的常见挑战
1.4.3 DeepSeek在工业中的应用
1.5 本章小结
1.6 思考题
第2章 DeepSeek核心架构解析
2.1 Transformer与多头注意力机制
2.1.1 基础架构复盘
2.1.2 深度注意力优化
2.1.3 高效解码策略
2.2 MoE模型的深入剖析
2.2.1 动态路由机制详解
2.2.2 专家负载均衡策略
2.2.3 高效通信优化
2.3 FP8混合精度计算
2.3.1 精度与性能的平衡
2.3.2 FP8的实现与实践
2.3.3 面向经济成本的设计原则
2.4 深度优化技术
2.4.1 DualPipe双管道并行算法
2.4.2 上下文窗口扩展技术
2.4.3 数据与模型并行的协同优化
2.5 跨节点通信技术详解
2.5.1 跨节点通信机制:All-to-All
2.5.2 InfiniBand优化
2.5.3 NVLink带宽优化
2.6 本章小结
2.7 思考题
第3章 基于DeepSeek的大模型开发基础
3.1 开发环境与工具链
3.1.1 API配置与调用流程
3.1.2 开源工具与开发框架整合
3.1.3 工程化部署与优化
3.2 数据准备与预处理
3.2.1 数据清洗与标注
3.2.2 多语言处理与兼容性
3.3 模型训练与调优
3.3.1 超参数选择与调整
3.3.2 训练过程的监控与调试
3.3.3 训练瓶颈与解决方案
3.4 模型评估与上线
3.4.1 模型的性能测试与优化指标
3.4.2 部署前验证流程
3.4.3 实时服务与持续改进
3.5 本章小结
3.6 思考题
第4章 对话生成与语义理解
4.1 对话模型的输入与输出设计
4.1.1 对话上下文管理
4.1.2 多轮对话生成优化
4.1.3 对话质量评估方法
4.2 DeepSeek在对话任务中的表现
4.2.1 问答系统的实现
4.2.2 情景模拟与角色扮演
4.2.3 个性化对话的实现
4.3 语义理解的技术路径
4.3.1 基于深度学习的文本分析
4.3.2 深层语义建模
4.3.3 领域适配与语义特化
4.4 基于DeepSeek的对话模型创新
4.4.1 填空生成技术
4.4.2 前缀续写与创意生成
4.4.3 特殊格式输出
4.5 本章小结
4.6 思考题
第2部分 开发实践与技术应用
第5章 智能开发:从文本到代码
5.1 编程智能助手的核心技术
5.1.1 代码生成的基础逻辑
5.1.2 多语言编程支持
5.1.3 算法辅助与优化
5.2 DeepSeek在编程任务中的表现
5.2.1 自动补全与错误检测
5.2.2 算法问题求解
5.2.3 项目开发的辅助能力
5.3 高效代码生成与调试
5.3.1 生成过程的控制技巧
5.3.2 调试能力的技术实现
5.3.3 工程化项目集成
5.4 开发环境集成实战
5.4.1 基于VS Code的插件开发
5.4.2 API与IDE的无缝衔接
5.5 本章小结
5.6 思考题
第6章 DeepSeek的多任务与跨领域应用
6.1 多任务学习的技术架构
6.1.1 多任务模型的基本原理
6.1.2 多任务学习的权重共享策略
6.1.3 DeepSeek在多任务场景下的优化
6.2 任务特化模型的开发与微调
6.2.1 模型微调的核心技术
6.2.2 基于少样本学习的任务适配
6.3 跨领域任务的实际应用
6.3.1 文本生成与内容创作
6.3.2 代码生成与算法优化
6.3.3 科学计算与公式推理
6.4 DeepSeek跨领域应用的案例分析
6.4.1 教育领域的智能问答系统
6.4.2 金融领域的文本挖掘与分析
6.4.3 工程领域的高效文档生成
6.5 本章小结
6.6 思考题
第7章 Prompt设计
7.1 提示工程基础
7.1.1 Prompt优化的基本原理
7.1.2 Prompt格式设计与控制
7.2 高级Prompt设计与应用
7.2.1 长上下文的提示优化
7.2.2 复杂指令的执行路径
7.2.3 模型鲁棒性提示
7.3 Prompt调优技术探索
7.3.1 Few-Shot与Zero-Shot优化
7.3.2 Soft Prompt与Embedding Tuning
7.4 本章小结
7.5 思考题
第3部分 行业应用与定制化开发
第8章 模型深度优化与部署
8.1 资源优化与成本控制
8.1.1 模型轻量化技术
8.1.2 显存与内存优化
8.2 分布式部署技术
8.2.1 数据并行与模型并行
8.2.2 混合并行
8.3 本章小结
8.4 思考题
第9章 数据构建与自监督学习
9.1 高质量训练数据的构建:以医院门诊数据为例
9.1.1 医疗数据的采集与标注
9.1.2 数据特化:门诊数据去重与清洗
9.2 自监督学习技术
9.2.1 自监督学习任务的设计与实现
9.2.2 模型的自适应学习能力
9.3 本章小结
9.4 思考题
第10章 面向工业的定制化模型开发
10.1 企业需求分析与场景识别
10.1.1 业务场景的智能化需求
10.1.2 不同行业的应用特点
10.2 定制化模型开发流程
10.2.1 数据模型设计
10.2.2 任务特化微调与训练
10.2.3 模型集成与系统部署
10.3 定制化案例分析
10.3.1 零售行业的需求预测系统
10.3.2 制造行业的生产效率优化:服装仓库调度问题
10.4 本章小结
10.5 思考题
第11章 全新推理大模型DeepSeek-R1
11.1 DeepSeek-R1的推理能力与计算优化
11.1.1 自回归推理的执行机制与缓存加速策略
11.1.2 长文本上下文跟踪:窗口注意力与KV缓存
11.1.3 低功耗设备上的模型压缩与轻量化推理
11.2 DeepSeek-R1的核心架构解析
11.2.1 计算图优化与Transformer结构改进
11.2.2 MoE动态路由机制与负载均衡
11.2.3 高效训练框架:流水线并行与分布式计算
11.3 API调用与应用开发指南
11.3.1 API请求参数详解
11.3.2 高级API能力:流式推理、多任务指令与函数调用
11.3.3 API吞吐率优化与并发调用管理
11.4 DeepSeek-R1在多任务推理中的表现
11.4.1 数学符号推理、代数计算与公式解析
11.4.2 事实性知识检索:RAG增强与模型幻觉抑制
11.4.3 多轮对话与长程推理:上下文窗口裁剪与动态记忆
11.5 本章小结
11.6 思考题
买过这本书的人还买过
读了这本书的人还在读
同类图书排行榜