万本电子书0元读

万本电子书0元读

顶部广告

自然语言处理Python进阶电子书

售       价:¥

纸质售价:¥42.60购买纸书

34人正在读 | 0人评论 6.3

作       者:(印)克里希纳·巴夫萨(Krishna Bhavsar)

出  版  社:机械工业出版社

出版时间:2019-01-01

字       数:8.8万

所属分类: 科技 > 计算机/网络 > 软件系统

温馨提示:数字商品不支持退换货,不提供源文件,不支持导出打印

为你推荐

  • 读书简介
  • 目录
  • 累计评论(0条)
  • 读书简介
  • 目录
  • 累计评论(0条)
第1章教你使用内置的NLTK语料库和频率分布。我们还将学习什么是WordNet,并探索其特和用法。 第2章演示如何从各种格式的数据源中提取文本。我们还将学习如何从网络源提取原始文本。*后,我们将从这些异构数据源中对原始文本行规范并构建语料库。 第3章介绍一些关键的预处理步骤,如分词、词干提取、词形还原和编辑距离。 第4章介绍正则表达式,它是*基本、*简单、*重要和*强大的工具之一。在本章中,你将学习模式匹配的概念,它是文本分析的一种方式,基于此概念,没有比正则表达式更方便的工具了。 第5章将学习如何使用和编写自己的词性标注器和文法规则。词性标注是一步句法分析的基础,而通过使用词性标记和组块标记可以产生或改文法规则。 第6章帮助你了解如何使用内置分块器以及训练或编写自己的分块器,即依存句法分析器。在本章中,你将学习评估自己训练的模型。 第7章介绍信息抽取和文本分类,告诉你关于命名实体识别的更多信息。我们将使用内置的命名实体识别工具,并使用字典创建自己的命名实体。我们将学会使用内置的文本分类算法和一些简单的应用实例。 第8章介绍高阶自然语言处理方法,该方法将目前为止你所学的所有课程结合到一起,并创建应对你现实生活中各种问题的适用方法。我们将介绍诸如文本相似度、摘要、情感分析、回指消解等任务。 第9章介绍深度学习应用于自然语言处理所必需的各种基本原理,例如利用卷积神经网络(CNN)和长短型记忆网络(LSTM)行邮件分类、情感分类等,*后在低维空间中可视化高维词汇。 第10章描述如何利用深度学习解决*前沿的问题,包括文本自动生成、情景数据问答,预测下一个*词的语言模型以及生成式聊天机器人的发。<br/>【作者】<br/>克里希纳·巴夫萨(Krishna Bhavsar)花了大约10年时间在各行业领域如酒店业、银行业、医疗行业等行自然语言处理、社交媒体分析和文本挖掘方面的研究。他致力于用不同的NLP语料库如Stanford CoreNLP、IBM的 SystemText和BigInsights、GATE和NLTK来解决与文本分析有关的行业问题。克里希纳还致力于分析社交媒体给热门电视节目和流行零售品牌以及产品带来的效应。2010年,他在NAACL上发表了一篇关于情感分析增强技术的论文。近期,他创建了一个NLP管道/工具集并源以便公众使用。除了学术和科技,克里希纳还热衷于摩托车和足球,空闲时间喜欢旅行和探索。他骑摩托车参加过环印度公路旅行并在东南亚和欧洲大部分国家徒步旅行过。 纳雷什·库马尔(Naresh Kumar)曾为财富500强企业设计、实施和运行超大型因特网应用程序,在这方面他拥有超过十年的专业经验。他是一位全栈架构师,在电子商务、网络托管、医疗、大数据及分析、数据流、广告和数据库等领域拥有丰富的实践经验。他依赖源并积极为其做贡献。纳雷什一直走在新兴技术的前沿,从Linux系统内部技术到前端技术。他曾在拉贾斯坦邦的BITS-Pilani学习,获得了计算机科学和经济学的双学位。 普拉塔普·丹蒂(Pratap Dangeti)在班加罗尔的研究和创新实验室发机器学习和深度学习方法,以用于结构化、图像和TCS文本数据。他在分析和数据科学领域拥有丰富的经验,并在IIT Bombay获得了工业工程和运筹学项目的硕士学位。普拉塔普是一名人工智能爱好者。闲暇时,他喜欢阅读下一代技术和创新方法。他还是Packt出版的《Statistics for Machine Learning》一书的作者。<br/>
目录展开

译者序

前言

作者简介

审校者简介

第1章 语料库和WordNet

1.1 引言

1.2 访问内置语料库

1.3 下载外部语料库,加载并访问

1.3.1 准备工作

1.3.2 如何实现

1.3.3 工作原理

1.4 计算布朗语料库中三种不同类别的特殊疑问词

1.4.1 准备工作

1.4.2 如何实现

1.4.3 工作原理

1.5 探讨网络文本和聊天文本的词频分布

1.5.1 准备工作

1.5.2 如何实现

1.5.3 工作原理

1.6 使用WordNet进行词义消歧

1.6.1 准备工作

1.6.2 如何实现

1.6.3 工作原理

1.7 选择两个不同的同义词集,使用WordNet探讨上位词和下位词的概念

1.7.1 准备工作

1.7.2 如何实现

1.7.3 工作原理

1.8 基于WordNet计算名词、动词、形容词和副词的平均多义性

1.8.1 准备工作

1.8.2 如何实现

1.8.3 工作原理

第2章 针对原始文本,获取源数据和规范化

2.1 引言

2.2 字符串操作的重要性

2.2.1 准备工作

2.2.2 如何实现

2.2.3 工作原理

2.3 深入实践字符串操作

2.3.1 如何实现

2.3.2 工作原理

2.4 在Python中读取PDF文件

2.4.1 准备工作

2.4.2 如何实现

2.4.3 工作原理

2.5 在Python中读取Word文件

2.5.1 准备工作

2.5.2 如何实现

2.5.3 工作原理

2.6 使用PDF、DOCX和纯文本文件,创建用户自定义的语料库

2.6.1 准备工作

2.6.2 如何实现

2.6.3 工作原理

2.7 读取RSS信息源的内容

2.7.1 准备工作

2.7.2 如何实现

2.7.3 工作原理

2.8 使用BeautifulSoup解析HTML

2.8.1 准备工作

2.8.2 如何实现

2.8.3 工作原理

第3章 预处理

3.1 引言

3.2 分词——学习使用NLTK内置的分词器

3.2.1 准备工作

3.2.2 如何实现

3.2.3 工作原理

3.3 词干提取——学习使用NLTK内置的词干提取器

3.3.1 准备工作

3.3.2 如何实现

3.3.3 工作原理

3.4 词形还原——学习使用NLTK中的WordnetLemmatizer函数

3.4.1 准备工作

3.4.2 如何工作

3.4.3 工作原理

3.5 停用词——学习使用停用词语料库及其应用

3.5.1 准备工作

3.5.2 如何工作

3.5.3 工作原理

3.6 编辑距离——编写计算两个字符串之间编辑距离的算法

3.6.1 准备工作

3.6.2 如何实现

3.6.3 工作原理

3.7 处理两篇短文并提取共有词汇

3.7.1 准备工作

3.7.2 如何操作

3.7.3 工作原理

第4章 正则表达式

4.1 引言

4.2 正则表达式——学习使用*、+和?

4.2.1 准备工作

4.2.2 如何实现

4.2.3 工作原理

4.3 正则表达式——学习使用$和^,以及如何在单词内部(非开头与结尾处)进行模式匹配

4.3.1 准备工作

4.3.2 如何实现

4.3.3 工作原理

4.4 匹配多个字符串和子字符串

4.4.1 准备工作

4.4.2 如何实现

4.4.3 工作原理

4.5 学习创建日期正则表达式和一组字符集合或字符范围

4.5.1 如何实现

4.5.2 工作原理

4.6 查找句子中所有长度为5的单词,并进行缩写

4.6.1 如何实现

4.6.2 工作原理

4.7 学习编写基于正则表达式的分词器

4.7.1 准备工作

4.7.2 如何实现

4.7.3 工作原理

4.8 学习编写基于正则表达式的词干提取器

4.8.1 准备工作

4.8.2 如何实现

4.8.3 工作原理

第5章 词性标注和文法

5.1 引言

5.2 使用内置的词性标注器

5.2.1 准备工作

5.2.2 如何实现

5.2.3 工作原理

5.3 编写你的词性标注器

5.3.1 准备工作

5.3.2 如何实现

5.3.3 工作原理

5.4 训练你的词性标注器

5.4.1 准备工作

5.4.2 如何实现

5.4.3 工作原理

5.5 学习编写你的文法

5.5.1 准备工作

5.5.2 如何实现

5.5.3 工作原理

5.6 编写基于概率的上下文无关文法

5.6.1 准备工作

5.6.2 如何实现

5.6.3 工作原理

5.7 编写递归的上下文无关文法

5.7.1 准备工作

5.7.2 如何实现

5.7.3 工作原理

第6章 分块、句法分析、依存分析

6.1 引言

6.2 使用内置的分块器

6.2.1 准备工作

6.2.2 如何实现

6.2.3 工作原理

6.3 编写你的简单分块器

6.3.1 准备工作

6.3.2 如何实现

6.3.3 工作原理

6.4 训练分块器

6.4.1 准备工作

6.4.2 如何实现

6.4.3 工作原理

6.5 递归下降句法分析

6.5.1 准备工作

6.5.2 如何实现

6.5.3 工作原理

6.6 shift-reduce句法分析

6.6.1 准备工作

6.6.2 如何实现

6.6.3 工作原理

6.7 依存句法分析和主观依存分析

6.7.1 准备工作

6.7.2 如何实现

6.7.3 工作原理

6.8 线图句法分析

6.8.1 准备工作

6.8.2 如何实现

6.8.3 工作原理

第7章 信息抽取和文本分类

7.1 引言

7.2 使用内置的命名实体识别工具

7.2.1 准备工作

7.2.2 如何实现

7.2.3 工作原理

7.3 创建字典、逆序字典和使用字典

7.3.1 准备工作

7.3.2 如何实现

7.3.3 工作原理

7.4 特征集合选择

7.4.1 准备工作

7.4.2 如何实现

7.4.3 工作原理

7.5 利用分类器分割句子

7.5.1 准备工作

7.5.2 如何实现

7.5.3 工作原理

7.6 文本分类

7.6.1 准备工作

7.6.2 如何实现

7.6.3 工作原理

7.7 利用上下文进行词性标注

7.7.1 准备工作

7.7.2 如何实现

7.7.3 工作原理

第8章 高阶自然语言处理实践

8.1 引言

8.2 创建一条自然语言处理管道

8.2.1 准备工作

8.2.2 如何实现

8.2.3 工作原理

8.3 解决文本相似度问题

8.3.1 准备工作

8.3.2 如何实现

8.3.3 工作原理

8.4 主题识别

8.4.1 准备工作

8.4.2 如何实现

8.4.3 工作原理

8.5 文本摘要

8.5.1 准备工作

8.5.2 如何实现

8.5.3 工作原理

8.6 指代消解

8.6.1 准备工作

8.6.2 如何实现

8.6.3 工作原理

8.7 词义消歧

8.7.1 准备工作

8.7.2 如何实现

8.7.3 工作原理

8.8 情感分析

8.8.1 准备工作

8.8.2 如何实现

8.8.3 工作原理

8.9 高阶情感分析

8.9.1 准备工作

8.9.2 如何实现

8.9.3 工作原理

8.10 创建一个对话助手或聊天机器人

8.10.1 准备工作

8.10.2 如何实现

8.10.3 工作原理

第9章 深度学习在自然语言处理中的应用

9.1 引言

9.1.1 卷积神经网络

9.1.2 循环神经网络

9.2 利用深度神经网络对电子邮件进行分类

9.2.1 准备工作

9.2.2 如何实现

9.2.3 工作原理

9.3 使用一维卷积网络进行IMDB情感分类

9.3.1 准备工作

9.3.2 如何实现

9.3.3 工作原理

9.4 基于双向LSTM的IMDB情感分类模型

9.4.1 准备工作

9.4.2 如何实现

9.4.3 工作原理

9.5 利用词向量实现高维词在二维空间的可视化

9.5.1 准备工作

9.5.2 如何实现

9.5.3 工作原理

第10章 深度学习在自然语言处理中的高级应用

10.1 引言

10.2 基于莎士比亚的著作使用LSTM技术自动生成文本

10.2.1 准备工作

10.2.2 如何实现

10.2.3 工作原理

10.3 基于记忆网络的情景数据问答

10.3.1 准备工作

10.3.2 如何实现

10.3.3 工作原理

10.4 使用循环神经网络LSTM进行语言建模以预测最优词

10.4.1 准备工作

10.4.2 如何实现

10.4.3 工作原理

10.5 使用循环神经网络LSTM构建生成式聊天机器人

10.5.1 准备工作

10.5.2 如何实现

10.5.3 工作原理

累计评论(0条) 0个书友正在讨论这本书 发表评论

发表评论

发表评论,分享你的想法吧!

买过这本书的人还买过

读了这本书的人还在读

回顶部