自然语言处理(NLP)属于人工智能与计算机语言学的交叉领域,处理的是计算机与人类语言之间的交互问题。随着人机交互需求的日益增长,计算机具备处理当前主要自然语言的能力已经成为了一个必然趋势。NLTK正是这一领域中一个强大而稳健的工具包。 在这本书中,我们首先会介绍一些与NLP相关的知识。然后,我们会探讨一些与数据科学相关的任务,通过这些任务来学习如何从零始构建自定义的标识器和解析器。在此过程中,我们将会深度探索NLP领域的基本概念,为这一领域各种源的Python工具和库提供具有实践意义的见解。下来,我们将会介绍如何分析社交媒体网站,发现热门话题,行舆情分析。zui后,我们还会介绍一些用于处理大规模文本的工具。
售 价:¥
纸质售价:¥33.80购买纸书
温馨提示:数字商品不支持退换货,不提供源文件,不支持导出打印
为你推荐
内容提要
作者简介
审阅者简介
译者序
前言
本书所涵盖的内容
前期准备
本书的适用读者
编写体例
读者反馈
客户支持
实例代码的下载
勘误
版权
如有疑问
第1章 自然语言处理简介
1.1 为什么要学习NLP
1.2 先从Python开始吧
1.2.1 列表
1.2.2 自助功能
1.2.3 正则表达式
1.2.4 字典
1.2.5 编写函数
1.3 向NLTK迈进
1.4 练习
1.5 小结
第2章 文本的歧义及其清理
2.1 何谓文本歧义
2.2 文本清理
2.3 语句分离器
2.4 标识化处理
2.5 词干提取
2.6 词形还原
2.7 停用词移除
2.8 罕见词移除
2.9 拼写纠错
2.10 练习
2.11 小结
第3章 词性标注
3.1 何谓词性标注
3.1.1 Stanford标注器
3.1.2 深入了解标注器
3.1.3 顺序性标注器
3.1.4 Brill标注器
3.1.5 基于机器学习的标注器
3.2 命名实体识别(NER)
NER标注器
3.3 练习
3.4 小结
第4章 文本结构解析
4.1 浅解析与深解析
4.2 两种解析方法
4.3 为什么需要进行解析
4.4 不同的解析器类型
4.4.1 递归下降解析器
4.4.2 移位-归约解析器
4.4.3 图表解析器
4.4.4 正则表达式解析器
4.5 依存性文本解析
4.6 语块分解
4.7 信息提取
4.7.1 命名实体识别(NER)
4.7.2 关系提取
4.8 小结
第5章 NLP应用
5.1 构建第一个NLP应用
5.2 其他NLP应用
5.2.1 机器翻译
5.2.2 统计型机器翻译
5.2.3 信息检索
5.2.4 语音识别
5.2.5 文本分类
5.2.6 信息提取
5.2.7 问答系统
5.2.8 对话系统
5.2.9 词义消歧
5.2.10 主题建模
5.2.11 语言检测
5.2.12 光符识别
5.3 小结
第6章 文本分类
6.1 机器学习
6.2 文本分类
6.3 取样操作
6.3.1 朴素贝叶斯法
6.3.2 决策树
6.3.3 随机梯度下降法
6.3.4 逻辑回归
6.3.5 支持向量机
6.4 随机森林算法
6.5 文本聚类
K均值法
6.6 文本中的主题建模
安装gensim
6.7 参考资料
6.8 小结
第7章 Web爬虫
7.1 Web爬虫
7.2 编写第一个爬虫程序
7.3 Scrapy库中的数据流
7.3.1 Scrapy库的shell
7.3.2 目标项
7.4 生成网站地图的蜘蛛程序
7.5 目标项管道
7.6 参考资料
7.7 小结
第8章 NLTK与其他Python库的搭配运用
8.1 NumPy
8.1.1 多维数组
8.1.2 基本运算
8.1.3 从数组中提取数据
8.1.4 复杂矩阵运算
8.2 SciPy
8.2.1 线性代数
8.2.2 特征值与特征向量
8.2.3 稀疏矩阵
8.2.4 优化措施
8.3 pandas
8.3.1 读取数据
8.3.2 数列
8.3.3 列转换
8.3.4 噪声数据
8.4 matplotlib
8.4.1 子图绘制
8.4.2 添加坐标轴
8.4.3 散点图绘制
8.4.4 条形图绘制
8.4.5 3D绘图
8.5 参考资料
8.6 小结
第9章 Python中的社交媒体挖掘
9.1 数据收集
9.2 数据提取
热门话题
9.3 地理可视化
9.3.1 影响力检测
9.3.2 Facebook
9.3.3 有影响力的朋友
9.4 小结
第10章 大规模文本挖掘
10.1 在Hadoop上使用Python的不同方式
10.1.1 Python的流操作
10.1.2 Hive/Pig下的UDF
10.1.3 流封装器
10.2 Hadoop上的NLTK
10.2.1 用户定义函数(UDF)
10.2.2 Python的流操作
10.3 Hadoop上的Scikit-learn
10.4 PySpark
10.5 小结
买过这本书的人还买过
读了这本书的人还在读
同类图书排行榜