该书深浅出地介绍 R 语言在大数据分析应用中的相关知识及编程。 基础篇:讨论数据处理的R环境,包括R数据结构(数据框、列表等)、数据导/导出、数据清洗(处理数据的缺失值、不一致、异常值)、数据变换(汇总、集成、透视表、规约等)、可视化、高级语言编程、数据分析常用建模方法和原理,涵盖了目前数据挖掘的主要算法,包括分类与预测、聚类分析、关联规则、智能推荐和时序模式,利用可视化数据挖掘包Rattle行试验指导。
售 价:¥
纸质售价:¥43.20购买纸书
温馨提示:数字商品不支持退换货,不提供源文件,不支持导出打印
为你推荐
内容简介
总主编简介
本书主编简介
总 序
前 言
第1章 绪 论
1.1 为什么学习R语言
1.2 正确的数据思维观
习题
基础篇
第2章 R语言入门
2.1 新手上路
2.2 R语言开发环境部署
2.3 获取帮助
2.4 工作空间
2.5 脚本
2.6 R包
习题
第3章 数据类型
3.1 变量与常量
3.2 结构类型
3.3 字符串操作
3.4 用于数据处理和转换的常用函数
习题
第4章 数据准备
4.1 数据导入
4.2 数据导出
习题
第5章 数据可视化
5.1 低水平绘图命令
5.2 高水平绘图命令
5.3 交互式绘图命令
习题
第6章 数据探索
6.1 缺失值分析
6.2 异常值分析
6.3 不一致值分析
6.4 数据的统计特征分析
习题
第7章 数据变换
7.1 数据清洗
7.2 数据选择
7.3 数据集成
习题
第8章 高级编程
8.1 控制结构
8.2 用户自定义函数
习题
第9章 数据建模
9.1 Rattle包
9.2 聚类模型
9.3 关联分析模型
9.4 传统决策树模型
9.5 随机森林决策树模型
9.6 自适应选择决策树模型
9.7 SVM
9.8 线性回归模型
9.9 神经网络模型
习题
第10章 模型评估
10.1 数据集
10.2 混淆矩阵
10.3 风险图
10.4 ROC曲线
习题
应用篇
第11章 影响大学平均录取分数线因素分析
11.1 背景与目标
11.2 数据说明
11.3 描述性分析
11.4 总结与建议
第12章 收视率分析
12.1 背景介绍
12.2 数据说明
12.3 描述性分析
12.4 总结与建议
进阶篇
第13章 RHadoop
13.1 认识RHadoop
13.2 RHadoop安装
13.3 综合练习
习题
第14章 SparkR
14.1 认识SparkR
14.2 SparkDataFrame
14.3 SparkR支持的机器学习算法
14.4 综合练习
习题
参考文献
附录 大数据和人工智能实验环境
买过这本书的人还买过
读了这本书的人还在读
同类图书排行榜