为你推荐
封面页
书名页
版权页
作者简介
内容简介
前言
目录
第1章 数据分析项目的流程
1.1 数据分析项目中的角色
1.2 数据分析项目的阶段
1.2.1 制定目标
1.2.2 收集数据
1.2.3 数据处理和分析
1.2.4 构建模型
1.2.5 评估模型
1.2.6 展示结果
1.2.7 部署与维护模型
1.3 总结
第2章 数据的读取
2.1 RData数据
2.2 readr高效读取数据
2.3 读取Excel数据
2.4 读取SPSS、SAS、STATA数据
2.5 R语言操作数据库
2.6 总结
第3章 数据探索
3.1 缺失值的识别与处理
3.1.1 缺失值的识别与描述性统计
3.1.2 缺失值的可视化展示
3.1.3 缺失值的处理方法
3.2 异常值
3.3 dlookr数据处理包
3.3.1 所有变量的一般性诊断
3.3.2 数值型变量的诊断
3.3.3 分类变量的诊断
3.3.4 异常值的诊断
3.3.5 创建诊断报告
3.3.6 数据处理
3.3.7 缺失值处理
3.3.8 异常值处理
3.3.9 数据转换
3.3.10 数据分箱
3.3.11 创建数据转换报告
3.4 数据相关性
3.5 自动化创建数据探索报告
3.6 总结
第4章 生存分析
4.1 生存分析的基本内容
4.2 使用R语言进行生存分析
4.3 非参数模型
4.3.1 使用Kaplan-Meier方法拟合数据
4.3.2 Kaplan-Meier方法的可视化
4.4 半参数模型生存分析方法
4.4.1 构建Cox模型
4.4.2 检查 假设
4.4.3 Coxph模 型可视化
4.4.4 预测
4.4.5 分层
4.5 参数模型
4.6 随机生存森林模型
4.7 总结
第5章 主成分分析
5.1 概述
5.1.1 维度相关的问题
5.1.2 检测多重共线性
5.1.3 方差膨胀因子
5.2 主成分分析详解
5.2.1 主成分分析的定义
5.2.2 主成分分析的简单原理
5.2.3 主成分分析的算法
5.3 使用R语言进行主成分分析
5.3.1 主成分分析的实现
5.3.2 主成分分析案例
5.4 总结
第6章 多维缩放
6.1 MDS的工作原理
6.2 在R语言中实现MDS
6.3 MDS的优点
6.4 总结
第7章 线性回归模型
7.1 线性回归模型概述
7.2 在R语言中实现回归模型
7.2.1 图形分析
7.2.2 建立线性模型
7.2.3 回归模型的图形诊断
7.2.4 预测模型
7.2.5 抽样方法
7.3 总结
第8章 逻辑回归模型
8.1 逻辑回归的原理
8.2 在R语言中实现逻辑回归模型
8.2.1 数据探索
8.2.2 构建逻辑回归模型
8.2.3 逻辑回归预测
8.2.4 逻辑回归模型评估
8.3 总结
第9章 聚类模型
9.1 概述
9.1.1 聚类算法
9.1.2 K均值聚类的原理
9.2 在R语言中实现聚类模型
9.2.1 K均值聚类
9.2.2 层次聚类
9.2.3 Medoids聚类(PAM)
9.3 总结
第10章 关联规则
10.1 关联规则概述
10.2 关联规则的基本概念
10.3 在R语言中实现关联规划
10.3.1 训练模型
10.3.2 模型的评估
10.3.3 提升关联规则的效果
10.3.4 关联规则的可视化
10.4 总结
第11章 随机森林
11.1 随机森林的基本概念
11.2 在R语言中实现随机森林
11.3 总结
第12章 支持向量机
12.1 概述
12.2 在R语言中实现支持向量机
12.3 总结
第13章 神经网络
13.1 概述
13.2 在R语言中实现神经网络
13.2.1 构建神经网络模型
13.2.2 评估模型效果
13.3 总结
第14章 文本挖掘
14.1 概述
14.2 text2vec背景及其基本原理
14.3 DTM与TFIDF的原理和实现
14.3.1 DTM和TFIDF的原理
14.3.2 DTM的实现
14.3.3 TFIDF的实现
14.4 情感分析
14.5 LDA主题模型及其实现
14.6 构建自动问答系统
14.7 总结
第15章 社交网络分析
15.1 社交网络概述
15.2 igraph简介
15.2.1 准备工作
15.2.2 图的指标计算
15.3 社交网络的常见结构
15.4 社交网络分析算法
15.4.1 Girvan-Newman
15.4.2 基于传播标签的社区检测
15.4.3 基于贪婪优化模块的社区检测
15.4.4 自旋转玻璃社群
15.5 微博社交群体分析
15.5.1 自旋转玻璃社群
15.5.2 社群检测
15.6 总结
第16章 H2O机器学习
16.1 H2O机器学习平台
16.2 在R语言中使用H2O
16.2.1 H2O的安装
16.2.2 案例应用
16.2.3 H2O常用API
16.2.4 模型的通用参数
16.2.5 参数调整
16.3 H2O Flow
16.3.1 H2O Flow的安装
16.3.2 H2O Flow的基本使用方法
16.4 总结
第17章 R语言爬虫
17.1 快速爬取网页数据
17.2 rvest简介
17.2.1 rvest API
17.2.2 rvest API 详解
17.3 爬取BOSS直聘数据
17.4 模拟登录
17.5 总结
买过这本书的人还买过
读了这本书的人还在读
同类图书排行榜