万本电子书0元读

万本电子书0元读

顶部广告

DeepSeek原生应用与智能体开发实践电子书

(1)《DeepSeek原生应用与智能体发实践》包括18个应用案例,非常借鉴价值,其中重案例包括美妆GUI Agent、体重管理API Agent、即时金融信息采集与分析平台、智能医疗问诊系统、多Agent跨境电商智能客服系统,读者根据自己的需求稍微修改一下即可应用于生产实践。 (2)即时金融信息采集与分析平台、智能医疗问诊系统、多Agent跨境电商智能客服系统分别代表金融、医疗、电商行业的应用解决方案。特别是多Agent跨境电商智能客服系统,融合了A2A、MCP、RAG技术,其系统分析与代码实现过程的讲解就值书价了,有需要借鉴此案例的读者可以大胆。

售       价:¥

纸质售价:¥122.60购买纸书

4人正在读 | 0人评论 6.5

作       者:王晓华

出  版  社:清华大学出版社

出版时间:2025-06-01

字       数:20.0万

所属分类: 科技 > 计算机/网络 > 软件系统

温馨提示:数字商品不支持退换货,不提供源文件,不支持导出打印

为你推荐

  • 读书简介
  • 目录
  • 累计评论(条)
  • 读书简介
  • 目录
  • 累计评论(条)
《DeepSeek原生应用与智能体发实践》围绕DeepSeek大模型应用发展,深度融合技术创新与工程实践,内容覆盖大模型应用发(在线调用、提示词、推理、Agent、工具调用、MCP、微调、蒸馏、后训练、RAG)技术栈及其案例。书中原理与案例相融合,注重培养读者的大模型原生应用与智能体发能力,并构建从理论到落地的完整知识体系。《DeepSeek原生应用与智能体发实践》配套示例源码、PPT课件、配图PDF文件、读者微信交流群。 《DeepSeek原生应用与智能体发实践》共分16章,内容包括大模型时代、DeepSeek发环境配置与放API使用、提示工程与DeepSeek提示库、思维与DeepSeek推理模型、基于DeepSeek的Agent发详解、DeepSeek的Function Calling与MCP应用实战、大模型驱动的即时金融信息采集与分析平台、KV Cache加持的推理加速、MLA注意力机制、MoE专家模型、MTP与多组件优化、大模型微调技术与应用、大模型蒸馏技术与应用、后训练算法GRPO详解与实战、基于后训练的智能医疗问诊实战,以及基于A2A、MCP与RAG的多Agent跨境电商智能客服实战。 《DeepSeek原生应用与智能体发实践》既适合DeepSeek发初学者、大模型原生应用与智能体发人员、模型优化与工程化工程师、大模型研究人员、行业AI解决方案提供商,也适合高等院校及高职高专院校学习人工智能大模型的学生。<br/>【推荐语】<br/>(1)《DeepSeek原生应用与智能体发实践》包括18个应用案例,非常借鉴价值,其中重案例包括美妆GUI Agent、体重管理API Agent、即时金融信息采集与分析平台、智能医疗问诊系统、多Agent跨境电商智能客服系统,读者根据自己的需求稍微修改一下即可应用于生产实践。 (2)即时金融信息采集与分析平台、智能医疗问诊系统、多Agent跨境电商智能客服系统分别代表金融、医疗、电商行业的应用解决方案。特别是多Agent跨境电商智能客服系统,融合了A2A、MCP、RAG技术,其系统分析与代码实现过程的讲解就值书价了,有需要借鉴此案例的读者可以大胆。 (3)《DeepSeek原生应用与智能体发实践》还可以结合《DeepSeek大模型高性能核心技术与多模态融合发》一书中的案例,对DeepSeek原理与应用发行深研究。 (4)《DeepSeek原生应用与智能体发实践》围绕DeepSeek大模型应用发展,深度融合技术创新与工程实践,内容覆盖大模型应用发(在线调用、提示词、推理、Agent、工具调用、MCP、微调、蒸馏、后训练、RAG)常用技术栈。 (5)《DeepSeek原生应用与智能体发实践》原理与实战案例相融合,注重培养读者的大模型原生应用与AI Agent智能体发能力,并构建从理论到落地的完整知识体系。 (6)《DeepSeek原生应用与智能体发实践》通过代码级详解与量化实验对比,将KV Cache、MLA注意力、MoE专家模型、MTP输出等前沿技术转化为可复现的工程能力,帮助读者深理解大模型的技术逻辑。 (7)配套示例源码、数据文件、PPT课件、配图PDF文件、读者微信交流群。<br/>【作者】<br/>王晓华,高校计算机专业讲师,研究方向为云计算、大数据与人工智能。其著作包括《DeepSeek大模型高性能核心技术与多模态融合发》《深探索Mamba模型架构与应用》《PyTorch深度学习与计算机视觉实践》《PyTorch语音识别实战》《ChatGLM3大模型本地化部署、应用发与微调》《从零始大模型发与微调:基于PyTorch与ChatGLM》《PyTorch 2.0深度学习从零始学》《TensorFlow深度学习应用实践》《OpenCV TensorFlow深度学习与计算机视觉实战》《TensorFlow语音识别实战》《TensorFlow 2.0卷积神经网络实战》《深度学习的数学原理与实现》。<br/>
目录展开

封面页

书名页

版权页

作者简介

内容简介

前言

目录

第1章 大模型时代

1.1 大模型的诞生与发展

1.1.1 大语言模型发展简史与概念

1.1.2 大语言模型的生成策略

1.2 大语言模型发展的里程碑

1.2.1 注意力机制是大模型发展的里程碑

1.2.2 注意力机制的关键创新

1.2.3 注意力机制对语言建模的影响

1.2.4 大模型中的涌现与Scaling Law

1.2.5 大模型的训练方法SFT与RLHF

1.3 大语言模型发展的“DeepSeek时刻”

1.3.1 重塑世界AI格局的DeepSeek-V3

1.3.2 推理能力大飞跃的DeepSeek-R1

1.4 大模型的应用与展望

1.4.1 大模型的实际应用

1.4.2 大模型发展面临的展望

1.5 本章小结

第2章 DeepSeek开发环境配置与开放API使用

2.1 安装Python开发环境

2.1.1 Miniconda的下载与安装

2.1.2 PyCharm的下载与安装

2.2 安装DeepSeek开发框架

2.2.1 不同显卡与运行库的选择

2.2.2 PyTorch GPU版本的安装

2.2.3 测试PyTorch和CUDA安装信息

2.3 在线DeepSeek应用配置详解

2.3.1 DeepSeek简介与免费使用

2.3.2 带有特定格式的DeepSeek在线调用

2.3.3 带有约束的DeepSeek在线调用

2.3.4 将DeepSeek与PyCharm相连

2.4 本章小结

第3章 提示工程与DeepSeek提示库

3.1 提示工程Prompt详解

3.1.1 什么是提示工程

3.1.2 提示工程的关键要素与DeepSeek配置

3.1.3 DeepSeek提示工程化写作技巧与示例

3.1.4 系统、上下文和角色提示的进阶应用

3.2 DeepSeek中的提示库

3.2.1 DeepSeek中提示库介绍与基本使用

3.2.2 带有系统提示的提示对话生成

3.3 本章小结

第4章 思维链与DeepSeek推理模型

4.1 思维链详解

4.1.1 思维链应用场景

4.1.2 思维链的定义与分类

4.2 基于思维链的DeepSeek推理模型实战

4.2.1 通过Prompt提示构建思维链

4.2.2 DeepSeek-Reasoner推理模型实战

4.3 本章小结

第5章 基于DeepSeek的Agent开发详解

5.1 Agent开发概述

5.1.1 Agent的定义与核心机制

5.1.2 API Agent与GUI Agent

5.2 基于DeepSeek的美妆GUI Agent实践

5.2.1 GUI Agent库的安装与使用

5.2.2 使用DeepSeek自动化获取网页端天气信息

5.2.3 根据天气信息给出美妆建议

5.3 基于DeepSeek的体重管理API Agent实践

5.3.1 API Agent的注册与使用

5.3.2 实现卡路里计算与运动建议的功能

5.4 本章小结

第6章 DeepSeek的Function Calling与MCP应用实战

6.1 DeepSeek自带的Function Calling详解

6.1.1 Python使用工具的基本原理

6.1.2 DeepSeek工具使用详解

6.1.3 DeepSeek工具箱的使用

6.1.4 DeepSeek工具调用判定依据

6.2 给大模型插上翅膀的MCP协议详解

6.2.1 MCP协议目的、功能与架构详解

6.2.2 MCP实战1:本地工具服务端搭建

6.2.3 MCP实战2:本地客户端搭建与使用

6.3 在线MCP服务器的搭建与使用实战

6.3.1 在线MCP服务器搭建

6.3.2 在线MCP服务的连接和使用

6.4 本章小结

第7章 大模型驱动的即时金融信息采集与分析平台

7.1 网络爬取工具Crawl4AI详解

7.1.1 大模型传递数据的方式

7.1.2 服务于大模型的Crawl4AI

7.1.3 Crawl4AI的安装与基本使用

7.2 DeepSeek驱动的即时金融信息采集与分析平台实战

7.2.1 使用Crawl4AI爬取金融网站

7.2.2 对链接内容进行解析

7.2.3 使用DeepSeek抽取和分析金融信息

7.2.4 实现DeepSeek驱动的即时金融信息采集与分析平台

7.2.5 将DeepSeek设置不同的人设并对金融信息进行分析

7.3 本章小结

第8章 DeepSeek核心技术1:KV Cache加持的推理加速

8.1 自回归生成模型中的资源计算

8.1.1 自回归模型的计算量

8.1.2 自回归模型的缓存优化

8.2 自回归生成模型中的推理加速详解

8.2.1 模型推理中的“贪心生成”与“采样生成”

8.2.2 模型推理过程中的冗余计算问题解析

8.2.3 初识模型推理中的KV Cache与代码实现

8.3 减少空间占用的自回归模型代码实现与详解

8.3.1 经典自回归模型详解

8.3.2 能够减少空间占用的自回归模型代码完整实现

8.3.3 缓存使用与传递过程详解

8.4 减少空间占用的生成模型实战与推理资源消耗量化对比

8.4.1 模型参数配置与训练数据的准备

8.4.2 带有缓存的生成模型训练

8.4.3 未运行缓存的生成模型推理资源量化展示

8.4.4 在缓存的生成模型推理资源量化展示

8.4.5 使用细精度修正模型输出

8.5 本章小结

第9章 DeepSeek核心技术2:MLA注意力机制

9.1 从推理角度详解MLA注意力模型与代码实现

9.1.1 大模型的推理过程

9.1.2 通用大模型的显存占用量化计算

9.1.3 手把手MLA注意力公式的总体推导

9.2 从缓存角度详解MLA注意力模型与代码实现

9.2.1 优化的MLA模型实现1:压缩低秩空间

9.2.2 优化的MLA模型实现2:核心注意力矩阵计算

9.2.3 优化的MLA模型实现3:对显存KV Cache部分的压缩

9.2.4 带有缓存的MLA注意力模型完整实现

9.3 MLA注意力模型的完整补充讲解

9.3.1 调参、记忆力以及矩阵计算优化

9.3.2 MLA、GQA以及MQA差异详解

9.4 本章小结

第10章 DeepSeek核心技术3:MoE模型

10.1 MoE架构

10.1.1 MoE模型的基本结构

10.1.2 MoE模型中的“专家”与“调控”代码实现

10.1.3 使用MoE模型还是经典的前馈层

10.2 基于MoE模型的情感分类实战

10.2.1 基于MoE模型的评论情感分类实战

10.2.2 MoE模型中负载平衡的实现

10.3 加载MoE架构的注意力模型

10.3.1 注意力机制中的前馈层不足

10.3.2 MoE可作为前馈层的替代

10.3.3 结合MoE的注意力机制

10.4 基于MoE与自注意力的图像分类

10.4.1 基于注意力机制的ViT模型

10.4.2 Patch Embedding与Position Embedding

10.4.3 可视化的Vision-MoE的详解

10.4.4 V-MoE模型的实现

10.4.5 基于图像识别模型V-MoE的训练与验证

10.4.6 使用已有的库实现MoE

10.5 本章小结

第11章 DeepSeek核心技术4:MTP与多组件优化

11.1 深度学习中的精度计算详解与实战

11.1.1 深度学习中的精度详解

11.1.2 不同精度的相互转换与混合精度

11.1.3 PyTorch中混合精度详解

11.1.4 使用混合精度完成模型训练与预测

11.2 生成模型的多词元预测

11.2.1 MTP的经典架构设计与损失函数

11.2.2 DeepSeek中MTP架构

11.2.3 多词元预测模型的完整实现

11.2.4 多词元预测模型的训练与推理

11.3 自回归模型中的单分类与多分类激活函数

11.3.1 生成模型中的单分类激活函数

11.3.2 生成模型中的多分类激活函数

11.4 DeepSeek中的激活函数SwiGLU

11.4.1 SwiGLU激活函数详解

11.4.2 SwiGLU的PyTorch实现

11.4.3 结合经典缩放的SwiGLU

11.5 本章小结

第12章 大模型微调技术与应用

12.1 什么是模型微调

12.1.1 大模型微调的作用

12.1.2 大模型微调技术有哪些

12.1.3 参数高效微调详解

12.2 大模型微调方法LoRA详解

12.2.1 LoRA微调的优势

12.2.2 LoRA基本公式推导

12.2.3 PyTorch获取内部参数的方法

12.3 多模态DeepSeek大模型本地化部署与微调实战

12.3.1 多模态DeepSeek大模型的本地化部署

12.3.2 微调的目的:让生成的结果更聚焦于任务目标

12.3.3 适配DeepSeek微调的辅助库PEFT详解

12.3.4 基于本地化部署的DeepSeek微调实战

12.4 本章小结

第13章 大模型蒸馏技术与应用

13.1 什么是模型蒸馏

13.1.1 模型蒸馏的核心原理与应用价值

13.1.2 在线与离线大模型蒸馏的实施方法

13.2 基于在线DeepSeek大模型的离线蒸馏

13.2.1 模型蒸馏的前置准备

13.2.2 通过在线DeekSeek API进行蒸馏处理

13.3 基于物理信息神经网络的在线蒸馏

13.3.1 在线蒸馏的损失函数与经典微分方程的求解方法

13.3.2 基于PINN蒸馏求解微分方程的实战

13.4 本章小结

第14章 后训练算法GRPO详解与实战

14.1 基于GRPO的平衡车自动控制实战

14.1.1 CartPole强化学习环境设置

14.1.2 基于GRPO的CartPole模型训练

14.1.3 基于GRPO后的CartPole模型演示

14.2 GRPO算法详解

14.2.1 从PPO对比GRPO

14.2.2 GRPO核心原理与案例演示

14.2.3 GRPO原理的补充问答

14.2.4 平衡车中的GRPO控制详解

14.3 本章小结

第15章 基于GRPO后训练的智能医疗问诊实战

15.1 模型的后训练与逻辑能力

15.1.1 大模型的后训练概念与核心目标

15.1.2 结果奖励与过程奖励:奖励建模详解

15.2 带推理的智能医疗问诊实战

15.2.1 推理医疗数据集的准备与处理

15.2.2 奖励函数的完整实现

15.2.3 基于GRPO后训练的智能医疗问诊实战

15.2.4 智能医疗问诊模型的推理展示

15.3 本章小结

第16章 基于A2A、MCP与RAG的跨境电商智能客服实战

16.1 基于A2A跨境电商智能客服基本架构设计

16.1.1 DTC模式的崛起与智能客服的新要求

16.1.2 跨境电商智能客服架构设计

16.1.3 用于复杂任务分配、解决与汇总的A2A架构

16.2 搭建具备商业问答功能的交流客服Agent

16.2.1 基于Qwen3的多语种智能客服基座模型简介

16.2.2 真实客服数据集介绍与使用详解

16.2.3 使用LoRA微调基座模型

16.2.4 使用微调后的智能客服基座模型完成推理

16.2.5 原生Qwen3多语种支持与跨境电商智能客服语言设置

16.3 给交流客服Agent注入垂直领域知识

16.3.1 给客服大模型直接添加知识的方法

16.3.2 更高精度的RAG详解与使用示例

16.3.3 基于BM25算法的RAG实战

16.3.4 基于Conan Embedding向量排序的RAG实战

16.3.5 对于智能客服模型垂直领域知识注入的补充讲解

16.4 搭建基于DeepSeek的调度Agent

16.4.1 使用MCP构建适配智能客服的工具集

16.4.2 基于在线DeepSeek的客户意图识别与工具调度Agent

16.5 水到渠成的A2A架构跨境电商智能客服实现

16.5.1 将交流客服Agent添加到客服工具集

16.5.2 客服化身销售:将智能客服与商品推荐相结合

16.5.3 A2A与MCP的结合与展望

16.6 本章小结

累计评论(条) 个书友正在讨论这本书 发表评论

发表评论

发表评论,分享你的想法吧!

买过这本书的人还买过

读了这本书的人还在读

回顶部