万本电子书0元读

万本电子书0元读

顶部广告

剑指大数据——Hadoop学习精要电子书

本书基于Hadoop 3.1.3编写,从大数据的特点和处理难点入手,逐步讲解Hadoop的起源和发展。

售       价:¥

纸质售价:¥44.10购买纸书

14人正在读 | 0人评论 6.6

作       者:尚硅谷教育

出  版  社:电子工业出版社

出版时间:2022-10-01

字       数:14.8万

所属分类: 科技 > 计算机/网络 > 计算机理论与教程

温馨提示:数字商品不支持退换货,不提供源文件,不支持导出打印

为你推荐

  • 读书简介
  • 目录
  • 累计评论(0条)
  • 读书简介
  • 目录
  • 累计评论(0条)
Hadoop是使用广泛的大数据处理框架之一,在大数据领域有着极其重要的地位,掌握Hadoop可以让学习者对大数据的理解更一步。本书是基于Hadoop 3.1.3编写的,从大数据的特和处理难手,逐步讲解Hadoop的起源和发展。从搭建Hadoop的学习环境始,依次对Hadoop的三大功能模块行重讲解,并且结合大量案例,细致地讲解HDFS、MapReduce、YARN的内核原理和调优方法,还会扩展讲解Hadoop的高可用实现、在生产环境中的调优方法及源码解读。本书广泛适用于大数据的学习者与从业人员,是大数据学习的书籍。<br/>【作者】<br/>尚硅谷教育是一家专业的IT教育培训机构,设了JavaEE、大数据、HTML5前端等多门学科,在互联网上发布的JavaEE、大数据、HTML5前端、区块、C语言、Python等技术视频教程广受赞誉。<br/>
目录展开

内容简介

前言

第1章 大数据概论

1.1 大数据的特征

1.2 大数据的发展前景

1.3 大数据生态体系与Hadoop

1.4 本章总结

第2章 环境准备

2.1 安装VMware

2.2 安装CentOS

2.3 安装远程终端

2.4 虚拟机配置

2.5 本章总结

第3章 Hadoop快速上手

3.1 集群角色

3.2 本地模式

3.3 完全分布式模式

3.4 本章总结

第4章 分布式文件系统HDFS

4.1 HDFS概述

4.2 HDFS的shell操作

4.3 HDFS的API操作

4.4 HDFS的读/写流程

4.5 HDFS的工作机制

4.6 本章总结

第5章 分布式计算MapReduce

5.1 MapReduce概述

5.2 MapReduce编程入门

5.3 Hadoop的序列化

5.4 MapReduce框架原理之InputFormat数据输入

5.5 MapReduce框架原理之shuffle机制

5.6 MapReduce框架原理之OutputFormat数据输出

5.7 MapReduce工作流程

5.8 Join

5.9 数据清洗

5.10 Hadoop中的数据压缩

5.11 本章总结

第6章 资源调度器YARN

6.1 YARN概述

6.2 YARN的资源调度器和调度算法

6.3 YARN实操

6.4 本章总结

第7章 高可用HA

7.1 ZooKeeper详解

7.2 HA概述

7.3 Hadoop HA集群的搭建

7.4 本章总结

第8章 生产调优手册

8.1 HDFS的核心参数

8.2 HDFS集群压测

8.3 HDFS的多目录配置

8.4 HDFS集群的扩容及缩容

8.5 HDFS的存储优化策略

8.6 HDFS的故障排除

8.7 MapReduce的生产经验

8.8 Hadoop的综合调优

8.9 本章总结

第9章 源码解析

9.1 RPC通信原理

9.2 NameNode启动源码解析

9.3 DataNode启动源码解析

9.4 HDFS写数据流程的源码解析

9.5 YARN源码解析

9.6 Hadoop的源码编译

9.7 本章总结

累计评论(0条) 0个书友正在讨论这本书 发表评论

发表评论

发表评论,分享你的想法吧!

买过这本书的人还买过

读了这本书的人还在读

回顶部