为你推荐
内容提要
前言
第1章 大数据概论
1.1 大数据的学习基础
1.2 大数据的背景
1.3 对大数据的不同认识
1.4 大数据的行业案例
1.5 大数据的基本概念
1.6 大数据技术生态圈
本章总结
本章习题
第2章 搭建Hadoop分布式集群
2.1 云平台
2.2 安装CentOS 6
2.3 Linux系统配置
2.4 Hadoop的配置部署
本章总结
本章习题
第3章 HDFS入门
3.1 Hadoop分布式文件系统HDFS
3.2 HDFS核心设计
3.3 HDFS体系结构
本章总结
本章习题
第4章 HDFS接口
4.1 HDFS命令行接口
4.2 HDFS Java接口
本章总结
本章习题
第5章 HDFS的运行机制
5.1 HDFS中数据流的读写
5.2 HA机制
5.3 Federation机制
本章总结
本章习题
第6章 Hadoop I/O流操作
6.1 数据完整性
6.2 压缩
6.3 序列化
6.4 基于文件的数据结构SequenceFile
本章总结
本章习题
第7章 初识MapReduce编程模型
7.1 MapReduce编程框架
7.2 WordCount编程实例
7.3 Hadoop MapReduce架构
本章总结
本章习题
第8章 MapReduce应用编程开发
8.1 MapReduce编程开发
8.2 MapReduce在集群上的运作
8.3 MapReduce的类型与格式
本章总结
本章习题
第9章 MapReduce编程案例
9.1 数据去重
9.2 数据排序
9.3 平均成绩
9.4 多表关联
9.5 二次排序
本章总结
本章习题
第10章 MapReduce运行机制与YARN平台
10.1 剖析MapReduce作业运行机制
10.2 Shuffle和排序
10.3 任务的执行
10.4 作业的调度
10.5 YARN平台简介
10.6 YARN平台架构
本章总结
本章习题
第11章 汽车销售数据统计分析项目
11.1 数据概况
11.2 项目实战
本章总结
本章习题
买过这本书的人还买过
读了这本书的人还在读
同类图书排行榜