万本电子书0元读

万本电子书0元读

顶部广告

RAG实践权威指南:构建精准、*大模型之道电子书

推荐理由(权威作者):由华大生命科学研究院资深NLP专家宁星星撰写,作者在RAG系统、大模型应用等领域有深厚积累,实战经验丰富。 从零到实战:手把手教学,帮助读者从基础认知阶到企业级RAG系统构建,结合LangChain、FAISS等工具提供可落地的代码实践。 技术体系完整:系统讲解RAG架构、核心组件与全流程技术,覆盖数据处理、语义检索、生成优化、模型推理及评估调优等关键环节。

售       价:¥

纸质售价:¥71.30购买纸书

43人正在读 | 0人评论 6.4

作       者:宁星星

出  版  社:机械工业出版社

出版时间:2025-05-28

字       数:27.9万

所属分类: 科技 > 计算机/网络 > 计算机理论与教程

温馨提示:数字商品不支持退换货,不提供源文件,不支持导出打印

为你推荐

  • 读书简介
  • 目录
  • 累计评论(条)
  • 读书简介
  • 目录
  • 累计评论(条)
本书由华大生命科学研究院资深NLP专家撰写,旨在带你从零构建高效的企业级RAG系统。本书全面解析RAG原理与实战,涵盖架构与组件、高阶技术与实践、检索与问答模块优化策略、模型推理等核心技术,并深讲解三大落地优化技术,以及高阶变体与能力增强措施。 本书共8章。第1章介绍RAG技术基础,帮助读者建立对RAG技术的全面认知。第2章介绍RAG系统的核心组件与实践,帮助读者掌握核心技术与基于Python库的实践。第3章介绍高阶RAG技术与实践的细节,帮助读者掌握阶技术。第4章介绍检索与问答模块的优化,全方位讲解优化策略。第5章介绍模型推理技术,加速RAG技术的落地。第6章介绍RAG系统在实际应用中的鲁棒性、安全性和公平性优化技术,提升RAG系统的整体性能与可信度。第7章介绍RAG技术的高阶变体,以充分挖掘RAG技术的应用潜力。第8章介绍实时知识更新与跨模态能力增强,展望RAG技术未来应用的方向。<br/>【推荐语】<br/>推荐理由(权威作者):由华大生命科学研究院资深NLP专家宁星星撰写,作者在RAG系统、大模型应用等领域有深厚积累,实战经验丰富。 从零到实战:手把手教学,帮助读者从基础认知阶到企业级RAG系统构建,结合LangChain、FAISS等工具提供可落地的代码实践。 技术体系完整:系统讲解RAG架构、核心组件与全流程技术,覆盖数据处理、语义检索、生成优化、模型推理及评估调优等关键环节。 聚焦落地难题:深解析知识库维护、模块协同、资源优化等实际挑战,提供鲁棒性、安全性和实时更新等增强策略,提升系统稳定性与可信度。 面向未来发展:探讨跨模态融合与动态知识更新等前沿方向,为研究者和发者提供技术演路径与创新思路。<br/>【作者】<br/>宁星星:华大生命科学研究院(BGI)生物智能研究所资深NLP算法工程师,目前从事RAG系统、Agent智能系统、生命科学垂直领域大模型等相关研发工作。拥有多年NLP算法相关发经验,擅长大模型、AIGC、智能问答等相关技术,并多次获得全国性NLP与知识图谱相关竞赛奖项。著有《语义解析:自然语言生成SQL与知识图谱问答实战》一书。<br/>
目录展开

前言

第1章 RAG技术基础

1.1 为什么需要RAG技术

1.2 工作流程与核心技术解析

1.2.1 工作流程

1.2.2 核心技术

1.3 工作范式

1.4 价值与实际应用场景

1.5 计算资源与数据存储需求

1.5.1 计算资源的需求

1.5.2 数据存储的需求

1.6 面临的主要挑战

第2章 RAG系统的核心组件与实践

2.1 向量数据库

2.1.1 Elasticsearch

2.1.2 FAISS

2.1.3 Milvus

2.2 检索系统

2.2.1 基于知识图谱查询

2.2.2 基于关系型数据库查询

2.2.3 基于向量数据库查询

2.3 生成系统

2.3.1 Transformer

2.3.2 GPT

2.4 RAG系统基准测试工具

2.4.1 评测数据集

2.4.2 常用的评测基准与步骤

2.5 基于常用Python库的RAG实践

2.5.1 基于Hugging Face Transformers库

2.5.2 基于PyTorch和TensorFlow

2.5.3 基于LlamaIndex

2.5.4 基于LangChain

第3章 高阶RAG技术与实践

3.1 切片与向量化技术

3.1.1 切片

3.1.2 向量化

3.1.3 向量存储与检索

3.1.4 优化切片与向量化策略

3.1.5 实战:从文本到向量

3.2 检索技术

3.2.1 检索流程及优化策略

3.2.2 关键词检索

3.2.3 语义检索

3.2.4 密集段落检索

3.2.5 混合检索

3.2.6 重排序

3.3 高级检索策略

3.3.1 假设性问题和假设性回答策略

3.3.2 扩大检索语境

3.4 生成模型的选型与提示词工程

3.5 检索技术与生成技术的融合

3.5.1 RAG-Token模型

3.5.2 RAG-Sequence模型

第4章 检索与问答模块优化

4.1 数据预处理和管理优化

4.1.1 数据清洗

4.1.2 数据存储和访问优化

4.2 检索模块的优化

4.2.1 嵌入模型的训练优化

4.2.2 文档解析技术的优化

4.2.3 同义词扩展

4.2.4 查询重写

4.3 问答模块的优化

4.3.1 问答能力的优化

4.3.2 增强拒答能力

第5章 模型推理优化

5.1 推理加速技术

5.1.1 量化

5.1.2 剪枝

5.1.3 知识蒸馏

5.2 分布式推理

5.2.1 分布式推理技术

5.2.2 分布式推理算法

5.2.3 常见的分布式推理系统

5.2.4 分布式推理优化策略

5.3 边缘计算优化

第6章 鲁棒性、安全性和公平性优化

6.1 模型鲁棒性优化

6.1.1 对抗训练

6.1.2 模型正则化

6.1.3 随机自我集成

6.1.4 防御模块

6.2 模型安全性优化

6.2.1 数据匿名化和加密

6.2.2 访问控制

6.2.3 验证查询和输出内容

6.2.4 保护向量数据库

6.3 模型公平性优化

6.3.1 检测模型偏见的方法

6.3.2 减少模型偏见的策略

第7章 RAG技术的高阶变体

7.1 长上下文的困境突围:LongRAG

7.1.1 原理解析

7.1.2 源码解析:LongRAG的深度剖析

7.2 知识图谱的优势融合:GraphRAG

7.2.1 原理解析

7.2.2 源码解析:GraphRAG的深度剖析

7.3 垂直领域的定向增强:GeneRAG

7.3.1 原理解析

7.3.2 源码解析:GeneRAG的深度剖析

第8章 实时知识更新与跨模态能力增强

8.1 实时知识更新

8.1.1 数据实时获取的方法

8.1.2 知识库动态更新

8.1.3 自动化数据管道

8.2 跨模态能力增强

8.2.1 多模态向量嵌入

8.2.2 多模态内容生成

附录 相似度计算

累计评论(条) 个书友正在讨论这本书 发表评论

发表评论

发表评论,分享你的想法吧!

买过这本书的人还买过

读了这本书的人还在读

回顶部