(1)作者背景资深:作者是资深AI技术专家,BAT高级算法工程师。 (2)作者经验丰富:作者在NLP、内容理解等领域有多年实践经验。 (3)揭秘大模型:揭秘大模型的底层技术原理,详解文本内容理解和生产的技术细节。 (4)解决6大难题:为内容重复理解、内容通顺度识别及纠正、内容质量、标签体系构建、文本摘要生成、文本纠错6大内容理解难题提供基于NLP的解决方案。
售 价:¥
纸质售价:¥74.20购买纸书
温馨提示:数字商品不支持退换货,不提供源文件,不支持导出打印
为你推荐
PREFACE 前言
CHAPTER 1 第1章 文本特征表示
1.1 语料与语料预处理
1.2 文本特征表示方法
1.3 词向量的评判标准
1.4 本章小结
CHAPTER 2 第2章 内容重复理解
2.1 标题重复
2.2 段落重复识别实例
2.3 基于相似度计算的文章判重
2.4 本章小结
CHAPTER 3 第3章 内容通顺度识别及纠正
3.1 数据增强
3.2 基于FastText算法的句子通顺度识别
3.3 基于TextCNN算法的分类任务实现
3.4 基于TextRNN算法的分类任务实现
3.5 基于Seq2Seq模型的纠正策略
3.6 本章小结
CHAPTER 4 第4章 内容质量
4.1 GBDT算法
4.2 XGBoost算法
4.3 知识问答质量体系的搭建
4.4 本章小结
CHAPTER 5 第5章 标签体系构建
5.1 标签体系
5.2 TF-IDF算法
5.3 PageRank算法
5.4 TextRank算法
5.5 本章小结
CHAPTER 6 第6章 文本摘要生成
6.1 文本摘要相关介绍
6.2 基于无监督的抽取式文本摘要
6.3 基于有监督的抽取式文本摘要
6.4 基于深度神经网络的生成式文本摘要
6.5 文本摘要常用数据集
6.6 文本摘要评价方法
6.7 本章小结
CHAPTER 7 第7章 文本纠错
7.1 错误来源及类型
7.2 文本纠错的3种传统方法
7.3 文本纠错深度学习方法
7.4 工业界解决方法
7.5 文本纠错工具
7.6 本章小结
推荐阅读
买过这本书的人还买过
读了这本书的人还在读
同类图书排行榜