万本电子书0元读

万本电子书0元读

顶部广告

探寻数据背后的逻辑:R语言数据挖掘之道电子书

售       价:¥

纸质售价:¥61.40购买纸书

218人正在读 | 1人评论 6.2

作       者:宋云生,张坚洪

出  版  社:电子工业出版社

出版时间:2018-07-01

字       数:42.2万

所属分类: 科技 > 计算机/网络 > 计算机理论与教程

温馨提示:此类商品不支持退换货,不支持下载打印

为你推荐

  • 读书简介
  • 目录
  • 累计评论(1条)
  • 读书简介
  • 目录
  • 累计评论(1条)
数据分析、数据挖掘的本质是探寻数据背后的逻辑,挖掘人们的欲望、需求、态度等。本书不仅仅教会读者如何掌握数据挖掘相关技能,更教会读者如何从数据挖掘结果中分析出更深层次的逻辑。本书主要介绍使用R语言进行数据挖掘的过程。具体内容包括R软件的安装及R语言基础知识、数据探索、数据可视化、回归预测分析、时间序列分析、算法选择流程及十大算法介绍、数据抓取、社交网络关系分析、情感分析、话题模型、推荐系统,以及数据挖掘在生物信息学中的应用。另外,本书还介绍了R脚本优化相关内容,使读者的数据挖掘技能更上一层楼。本书适合从事数据挖掘、数据分析、市场研究的工作者及学生群体,以及对数据挖掘和数据分析感兴趣的初级读者。 数据分析、数据挖掘的本质是探寻数据背后的逻辑,挖掘人们的欲望、需求、态度等。本书不仅仅教会读者如何掌握数据挖掘相关技能,更教会读者如何从数据挖掘结果中分析出更深层次的逻辑。 《探寻数据背后的逻辑:R语言数据挖掘之道》主要介绍使用R语言行数据挖掘的过程。具体内容包括R软件的安装及R语言基础知识、数据探索、数据可视化、回归预测分析、时间序列分析、算法选择流程及十大算法介绍、数据抓取、社交网络关系分析、情感分析、话题模型、推荐系统,以及数据挖掘在生物信息学中的应用。另外,本书还介绍了R脚本优化相关内容,使读者的数据挖掘技能更上一层楼。 《探寻数据背后的逻辑:R语言数据挖掘之道》适合从事数据挖掘、数据分析、市场研究的工作者及学生群体,以及对数据挖掘和数据分析感兴趣的初级读者。
【推荐语】
√不只介绍R语言,更深数据挖掘的本质:探寻数据背后的逻辑,挖掘人们的欲望、需求及态度 √深浅出介绍R语言数据挖掘,以及数据挖掘和机器学习中的常见算法 √枚举了很多有趣的实例及其在商务领域的应用 √涉及多种数据类型和不同的挖掘任务 就R语言而言,书中详述了R语言的特和一些弊端的经验性克服方法。 就数据挖掘而言,书中详细演示了从数据清洗、变量转换、筛选、构建模型、调优、监控及代码部署等一系列完整的流程。
【作者】
宋云生,中山大学生命科学学院硕士毕业,混迹于医药商业、汽车制造等多个行业,先后从事市场研究、BI(商业智能)、质量控制等多个领域的数据研究和落地应用,现主攻自然语言理解领域的实际应用。  张坚洪,华南农业大学数学与应用数学本科毕业,先后从事汽车、金融等行业,主要工作方向为数据仓库、数据挖掘在互联网金融领域的应用。  黎新年,中山大学生命科学学院博士毕业,主要研究方向为基因组的化、群体演化和系统发育。
目录展开

作者简介

序言 提纲挈领式心诀:一名数据挖掘工程师的成长之路

前言 什么是规范化的数据挖掘流程

其他

第1章 万事不只开头难

1.1 工欲善其事,必先利其器:安装

1.2 了解R的对象

1.3 R语言的重器:函数

1.4 控制流在R语言里只是一种辅助工具

1.5 数据的读入与输出

第2章 数据探索,招招都是利器

2.1 不要在工作后才认识“脏数据”

2.2 数据透视、数据整形、关联融合与批量处理

2.3 一招完成数据探索报告

2.4 拯救你的很多时候是基础理论

第3章 从商务气质的数据可视化说起

3.1 说说数据可视化的专业素养

3.2 ggplot2包:一个价值8万美元的态度

3.3 将静态图转为D3交互图表:plotly

3.4 从基础到进阶的变形图表

第4章 分位数回归模拟股票指数风险通道

4.1 用线性回归预测医院的药品销售额

4.2 多项式回归及常见回归方程的书写

4.3 Lasso回归和回归评价的常见指标

4.4 分位数回归拟合上证指数风险通道

第5章 时间序列分析

5.1 时间序列分析:分析带有时间属性的数列

5.2 不是所有序列都叫时间序列

5.3 时间序列三件宝:趋势、周期、随机波动

5.4 预测分析

第6章 选择什么算法也有一套流程

6.1 重新审视一下这几个模型

6.2 银行信用卡评估模型之变量筛选

6.3 必须面对的模型评估

第7章 深入浅出十大算法

7.1 C5.0算法

7.2 K-means算法

7.3 支持向量机(SVM)算法

7.4 Apriori算法

7.5 EM算法

7.6 PageRank算法

7.7 AdaBoost算法

7.8 KNN算法与K-means算法有什么不同

7.9 Naive Bayes(朴素贝叶斯)算法

7.10 CART算法

第8章 数据抓取

8.1 数据挖掘工程师不可抱怨“巧妇难为无米之炊”

8.2 抓取股市龙虎榜数据,碰碰运气

8.3 抓取某家医药信息网站全站药品销售数据

第9章 不可不说的社交网络关系

9.1 社交网络图

9.2 你还要装备几个评价指标

9.3 全球某货物贸易中的亲密关系

9.4 中国电影演艺圈到底有没有“圈”

第10章 情感分析:一种准确率高达90%的新方法?

10.1 情感分析及其应用:这是老生常谈

10.2 文本分析的基本武器:R

10.3 基于词典的情感分析的效果好过瞎猜吗

10.4 监督式情感分析:挑选训练数据集是所有人心中的痛

10.5 一种准确率高达90%的新方法

10.6 谈谈情感分析的下一步思考

第11章 话题模型:很多牛人过不去的坎儿

11.1 话题模型与文案文本集

11.2 话题模型中几个重要的数据处理步骤

11.3 上帝有多少个色子:话题数量估计

11.4 LDA话题模型竟然能输出这么多关系

11.5 话题之间也有社交(衍生)关系吗

11.6 话题模型的几个强大衍生品

第12章 排名就是简单的推荐系统吗?

12.1 全球宜居城市综合实力排行

12.2 协同过滤推荐系统

第13章 生物信息学中的数据挖掘案例

13.1 生物信息学与R语言

13.2 生物信息学中常用的软件包

第14章 产品化:关于内存、速度和自动化

14.1 不同终端调用、自动化执行R脚本及参数传递

14.2 与速度、内存、并行相关的程序优化

累计评论(1条) 1个书友正在讨论这本书 发表评论

发表评论

发表评论,分享你的想法吧!

买过这本书的人还买过

读了这本书的人还在读

回顶部