为你推荐
作者简介
序言 提纲挈领式心诀:一名数据挖掘工程师的成长之路
前言 什么是规范化的数据挖掘流程
其他
第1章 万事不只开头难
1.1 工欲善其事,必先利其器:安装
1.2 了解R的对象
1.3 R语言的重器:函数
1.4 控制流在R语言里只是一种辅助工具
1.5 数据的读入与输出
第2章 数据探索,招招都是利器
2.1 不要在工作后才认识“脏数据”
2.2 数据透视、数据整形、关联融合与批量处理
2.3 一招完成数据探索报告
2.4 拯救你的很多时候是基础理论
第3章 从商务气质的数据可视化说起
3.1 说说数据可视化的专业素养
3.2 ggplot2包:一个价值8万美元的态度
3.3 将静态图转为D3交互图表:plotly
3.4 从基础到进阶的变形图表
第4章 分位数回归模拟股票指数风险通道
4.1 用线性回归预测医院的药品销售额
4.2 多项式回归及常见回归方程的书写
4.3 Lasso回归和回归评价的常见指标
4.4 分位数回归拟合上证指数风险通道
第5章 时间序列分析
5.1 时间序列分析:分析带有时间属性的数列
5.2 不是所有序列都叫时间序列
5.3 时间序列三件宝:趋势、周期、随机波动
5.4 预测分析
第6章 选择什么算法也有一套流程
6.1 重新审视一下这几个模型
6.2 银行信用卡评估模型之变量筛选
6.3 必须面对的模型评估
第7章 深入浅出十大算法
7.1 C5.0算法
7.2 K-means算法
7.3 支持向量机(SVM)算法
7.4 Apriori算法
7.5 EM算法
7.6 PageRank算法
7.7 AdaBoost算法
7.8 KNN算法与K-means算法有什么不同
7.9 Naive Bayes(朴素贝叶斯)算法
7.10 CART算法
第8章 数据抓取
8.1 数据挖掘工程师不可抱怨“巧妇难为无米之炊”
8.2 抓取股市龙虎榜数据,碰碰运气
8.3 抓取某家医药信息网站全站药品销售数据
第9章 不可不说的社交网络关系
9.1 社交网络图
9.2 你还要装备几个评价指标
9.3 全球某货物贸易中的亲密关系
9.4 中国电影演艺圈到底有没有“圈”
第10章 情感分析:一种准确率高达90%的新方法?
10.1 情感分析及其应用:这是老生常谈
10.2 文本分析的基本武器:R
10.3 基于词典的情感分析的效果好过瞎猜吗
10.4 监督式情感分析:挑选训练数据集是所有人心中的痛
10.5 一种准确率高达90%的新方法
10.6 谈谈情感分析的下一步思考
第11章 话题模型:很多牛人过不去的坎儿
11.1 话题模型与文案文本集
11.2 话题模型中几个重要的数据处理步骤
11.3 上帝有多少个色子:话题数量估计
11.4 LDA话题模型竟然能输出这么多关系
11.5 话题之间也有社交(衍生)关系吗
11.6 话题模型的几个强大衍生品
第12章 排名就是简单的推荐系统吗?
12.1 全球宜居城市综合实力排行
12.2 协同过滤推荐系统
第13章 生物信息学中的数据挖掘案例
13.1 生物信息学与R语言
13.2 生物信息学中常用的软件包
第14章 产品化:关于内存、速度和自动化
14.1 不同终端调用、自动化执行R脚本及参数传递
14.2 与速度、内存、并行相关的程序优化
买过这本书的人还买过
读了这本书的人还在读
同类图书排行榜