万本电子书0元读

万本电子书0元读

顶部广告

自然语言处理:大模型理论与实践电子书

本书以自然语言处理中的语言模型为主线,全面介绍了语言模型的基  础理论、大模型的研究展及实践应用。

售       价:¥

纸质售价:¥54.60购买纸书

0人正在读 | 0人评论 6.5

作       者:赵宇,任福继

出  版  社:机械工业出版社

出版时间:2025-10-14

字       数:31.4万

所属分类: 教育 > 大中专教材 > 研究生/本科/专科教材

温馨提示:数字商品不支持退换货,不提供源文件,不支持导出打印

为你推荐

  • 读书简介
  • 目录
  • 累计评论(条)
  • 读书简介
  • 目录
  • 累计评论(条)
《自然语言处理--大模型:通向AGI之路》是一本全面介绍大语言模型的教材,旨在帮助读者掌握这一前沿人工智能技术。本教材首先从自然语言处理基础和神经网络原理出发,逐步引领读者深了解大语言模型的构建与训练方法。通过系统讲解Transformer架构,使读者能够理解其核心机制。与传统的教材不同,本书强调实践与应用。通过大量实例,读者将学会如何利用大语言模型行自然语言生成、文本分类、情感分析等任务,极大地拓展了应用领域。 本教材内容丰富,步骤详细,解释了基本概念,并提供了实用示例。读者将首先了解NLP是什么以及关键理论技术,特别是如何通过大型模型来完成NLP中的各种任务。随后,读者将学习当前广泛的自然语言处理和大语言模型相关技术,并了解每种技术的最佳应用场景,包括新的大型语言模型(LLMs)。在此过程中,本书将介绍相关的自然语言处理Python库。读者不仅将学习NLP的基础知识,还将了解许多实际问题,如获取数据、评估系统、改善系统结果和部署NLP应用程序。 本教材的独特之处在于深剖析了模型训练和优化的关键步骤,为读者提供了优化模型性能的实用方法。本教材适合不同程度的自然语言处理和深度学习基础的学生、研究人员以及从业者。无论你是计算机科学、人工智能、数据科学等相关领域的学习者,还是希望应用大语言模型于实际场景的专业人士,本教材都将成为你深研究这一领域的得力助手。<br/>【推荐语】<br/>本书以自然语言处理中的语言模型为主线,全面介绍了语言模型的基  础理论、大模型的研究展及实践应用。<br/>【作者】<br/>赵宇,工学博士,西南财经大学教授,金融智能与金融工程四川省重实验室副主任,美国罗切斯特大学联合培养博士,法国巴黎六大高级访问学者,西南财经大学光华百人计划人选,中国人工智能学会自然语言理解专委会委员,四川省计算机学会自然语言理解专委会副主任委员。主要研究方向为大模型、通用人工智能、自然语言处理、金融科技等领域,迄今在高水平期刊和会议发表学术论文30余篇(其中中国计算机学会(CCF)A类/B类推荐论文10篇),包括IEEE Trans.系列(IEEE TKDE、IEEE TNNLS、IEEE TMM、IEEE TMC)以及人工智能顶会ACL、ICME等。主持2项国家自然科学基金(1项面上,1项青年),2项四川省自然科学基金(1项重,1项面上)。撰写《知识图谱》专著1部,参编《金融科技》教材1部。<br/>
目录展开

前折页

书名页

版权

序言

前言

主要符号表

第1章 绪论

1.1 自然语言处理概述

1.2 自然语言处理简史

1.3 自然语言处理传统研究内容

1.4 自然语言处理与大模型发展现状

1.5 本书内容安排

1.6 讨论

1.7 习题

第1部分 语言模型基础

第2章 词向量

2.1 概述

2.2 文本表示方法

2.3 Word2Vec模型

2.4 GloVe模型

2.5 ELMo模型

2.6 讨论

2.7 习题

第3章 统计语言模型

3.1 概述

3.3 平滑技术

3.4 讨论

3.5 习题

第4章 神经语言模型

4.1 概述

4.2 神经概率语言模型

4.3 基于循环神经网络的语言模型

4.4 讨论

4.5 习题

第5章 预训练语言模型

5.1 概述

5.2 Seq2Seq模型

5.3 注意力机制

5.4 Transformer模型

5.5 重要的预训练语言模型

5.6 语言模型使用范式

5.7 讨论

5.8 习题

第2部分 大模型理论

第6章 大语言模型架构

6.1 概述

6.2 基于Transformer的模型架构

6.3 基于非Transformer的模型架构

6.4 大模型架构配置

6.5 讨论

6.6 习题

第7章 多模态大模型架构

7.1 概述

7.2 ViT模型

7.3 CLIP模型

7.4 BLIP模型

7.5 BLIP-2模型

7.6 讨论

7.7 习题

第8章 大模型预训练

8.1 概述

8.2 预训练数据工程

8.3 预训练方法

8.4 讨论

8.5 习题

第9章 大模型微调

9.1 概述

9.2 指令微调

9.3 对齐微调

9.4 微调算法

9.5 讨论

9.6 习题

第10章 提示工程

10.1 概述

10.2 提示工程基础

10.3 情景学习

10.4 思维链

10.5 提示工程安全

10.6 讨论

10.7 习题

第11章 涌现

11.1 概述

11.2 涌现现象

11.3 大模型中的涌现

11.4 缩放法则

11.5 大模型可解释性

11.6 讨论

11.7 习题

第12章 大模型评估

12.1 概述

12.2 评估方式

12.3 评估任务

12.4 评估指标

12.5 讨论

12.6 习题

第13章 探讨

13.1 概述

13.2 基于大模型的智能体和具身智能

13.3 大模型垂直领域应用

13.4 大模型的挑战与局限

13.5 大模型的社会影响

13.6 讨论

13.7 习题

第3部分 大模型实践

第14章 大模型本地开发

14.1 概述

14.2 Transformers编程基础

14.3 大模型微调

14.4 讨论

14.5 习题

第15章 基于大模型的应用开发

15.1 概述

15.2 基于OpenAI的应用开发

15.3 基于通义千问的应用开发

15.4 基于LangChain的应用开发

15.5 讨论

15.6 习题

附录

附录A 预备知识

附录B 缩略语表

附录C 术语表

附录D 相关学术会议与学术组织

参考文献

后折页

累计评论(条) 个书友正在讨论这本书 发表评论

发表评论

发表评论,分享你的想法吧!

买过这本书的人还买过

读了这本书的人还在读

回顶部