万本电子书0元读

万本电子书0元读

顶部广告

文本挖掘:基于R语言的整洁工具电子书 租阅

售       价:¥

纸质售价:¥55.50购买纸书

393人正在读 | 2人评论 6.2

作       者:(美)茱莉亚·斯拉格(Julia Silge),(美)戴维·罗宾逊(David Robinson)

出  版  社:机械工业出版社

出版时间:2018-01-01

字       数:14.6万

所属分类: 科技 > 计算机/网络 > 程序设计

温馨提示:此类商品不支持退换货,不支持下载打印

为你推荐

  • 读书简介
  • 目录
  • 累计评论(2条)
  • 读书简介
  • 目录
  • 累计评论(2条)
文本挖掘是一种从文本数据中抽取有价值的信息和知识的计算机处理 技术,也是自然语言处理的热门话题。本书主要介绍整洁数据的文本挖掘 与分析。整洁数据具有简单且新颖的结构,对其进行分析会更有效、更容 易。本书的所有代码都是基于R语言来编写的,采用tidytext软件包以及其 他整洁工具来挖掘文件中的有用信息,并用图形展示出来,这对理解文本 内容非常有帮助。本书提供了非常有用的真实案例,这会为对文本分析工 作感兴趣的人提供有价值的信息。 Array
目录展开

O'Reilly Media,Inc.介绍

译者序

前言

第1章 整洁文本格式

比较整洁文本结构与其他数据结构

unnest_tokens函数

整理Jane Austen的作品

gutenbergr包

词频

总结

第2章 基于整洁数据的情感分析

情感数据集

内连接的情感分析

比较三个情感词典

最常见的正面单词和负面单词

Wordclouds模块

除单词外的其他文本单元

总结

第3章 分析词和文件频率:tf-111df

Jane Austen小说中的词项频率

Zipf定律

bind_tf_idf函数

物理学语料库

总结

第4章 词之间的关系:n-gram及相关性

n-gram词条化

用widyr包对单词对计数并计算相关性

总结

第5章 非整洁格式转换

使文档–词项矩阵整洁

将整洁文本数据转换为矩阵

总结

第6章 主题建模

LDA

示例:博大的图书馆馆藏

LDA方法的替代实现

总结

第7章 案例研究:Twitter归档文件比较

单词使用情况的比较

单词使用情况的变化

收藏和转发

总结

第8章 案例研究:NASA元数据挖掘

NASA如何组织数据

共现单词与相关单词

计算描述字段的tf-111df

总结

第9章 案例研究:分析Usenet文本

预处理

新闻组中的单词

情感分析

总结

参考文献

作者简介

封面简介

累计评论(2条) 2个书友正在讨论这本书 发表评论

发表评论

发表评论,分享你的想法吧!

买过这本书的人还买过

读了这本书的人还在读

回顶部