为你推荐
前言
1 大数据采集处理方法
1.1 爬虫程序设计方案
1.2 爬虫程序实现方法
1.3 数据清洗
2 大数据存储方法
2.1 分布式文件系统存储大数据
2.1.1 HDFS体系结构
2.1.2 HDFS数据存储方式
2.1.3 HDFS读写方式
2.2 分布式数据库存储大数据
2.2.1 Hbase体系结构
2.2.2 配置Hbase
2.2.3 Hbase表操作
2.2.4 访问Hbase数据资源
3 大数据计算方法
3.1 分布式计算平台构建方法
3.2 分布式计算框架构建方法
3.3 分布式计算程序设计方法
4 大数据分析模型构建方法
4.1 准备训练数据
4.2 机器学习路径和算法设计方法
4.3 数据可视化辅助建模方法
4.4 构建大数据分析模型
5 大数据分析模型检验方法
5.1 回归诊断
5.2 交叉验证
6 大数据分析模型优化方法
6.1 Feature Scaling优化法
6.2 逐步回归优化法
6.3 PCA主成分分析优化方法
6.4 神经网络优化大数据分析模型
参考文献
买过这本书的人还买过
读了这本书的人还在读
同类图书排行榜