为你推荐
内容简介
前言
第1章 大数据概论
1.1 大数据的特征
1.2 大数据的发展前景
1.3 大数据生态体系与Hadoop
1.4 本章总结
第2章 环境准备
2.1 安装VMware
2.2 安装CentOS
2.3 安装远程终端
2.4 虚拟机配置
2.5 本章总结
第3章 Hadoop快速上手
3.1 集群角色
3.2 本地模式
3.3 完全分布式模式
3.4 本章总结
第4章 分布式文件系统HDFS
4.1 HDFS概述
4.2 HDFS的shell操作
4.3 HDFS的API操作
4.4 HDFS的读/写流程
4.5 HDFS的工作机制
4.6 本章总结
第5章 分布式计算MapReduce
5.1 MapReduce概述
5.2 MapReduce编程入门
5.3 Hadoop的序列化
5.4 MapReduce框架原理之InputFormat数据输入
5.5 MapReduce框架原理之shuffle机制
5.6 MapReduce框架原理之OutputFormat数据输出
5.7 MapReduce工作流程
5.8 Join
5.9 数据清洗
5.10 Hadoop中的数据压缩
5.11 本章总结
第6章 资源调度器YARN
6.1 YARN概述
6.2 YARN的资源调度器和调度算法
6.3 YARN实操
6.4 本章总结
第7章 高可用HA
7.1 ZooKeeper详解
7.2 HA概述
7.3 Hadoop HA集群的搭建
7.4 本章总结
第8章 生产调优手册
8.1 HDFS的核心参数
8.2 HDFS集群压测
8.3 HDFS的多目录配置
8.4 HDFS集群的扩容及缩容
8.5 HDFS的存储优化策略
8.6 HDFS的故障排除
8.7 MapReduce的生产经验
8.8 Hadoop的综合调优
8.9 本章总结
第9章 源码解析
9.1 RPC通信原理
9.2 NameNode启动源码解析
9.3 DataNode启动源码解析
9.4 HDFS写数据流程的源码解析
9.5 YARN源码解析
9.6 Hadoop的源码编译
9.7 本章总结
买过这本书的人还买过
读了这本书的人还在读
同类图书排行榜