当当云阅读 > 科技 > 计算机/网络 > 程序设计 > 高可用性的HDFS：Hadoop分布式文件系统深度实践(光盘内容另行下载，地址见书封底)

| | 手机阅读

扫描下载当当云阅读App

高可用性的HDFS：Hadoop分布式文件系统深度实践(光盘内容另行下载，地址见书封底)电子书

Hadoop是目前主流的开源云计算系统，它实现了一个高可扩展的分布式文件系统——HDFS（Hadoop Distributed File System），HDFS作为Hadoop底层基础设施，为云计算提供高可靠、高性能的存储服务。

售价：¥

纸质售价：¥44.20购买纸书

182人正在读 | 0人评论

6.5

作者：文艾,王磊

出版社：清华大学出版社

出版时间：2012-05-01

字数：12.0万

所属分类：科技 > 计算机/网络 > 程序设计

温馨提示：数字商品不支持退换货，不提供源文件，不支持导出打印

为你推荐

读书简介
目录
累计评论(1条)

读书简介
目录
累计评论(1条)

《高可用性的hdfs—hadoop分布式文件系统深度实践》专注于hadoop分布式文件系统（hdfs）的主流ha解决方案，内容包括：hdfs元数据解析、hadoop元数据备份方案、hadoopbackup node方案、avatarnode解决方案以及*的ha解决方案cloudrea ha namenode等。其中有关backupnode方案及avatarnode方案的内容是本书重，尤其是对avatarnode方案从运行机制到异常处理方案的步骤行了详尽介绍，同时还总结了各种异常情况下avatarnode的各种处理方案。《高可用性的hdfs—hadoop分布式文件系统深度实践》从代码手并结合情景分析、案例解说对hdfs的元数据以及主流的hdfsha解决方案的运行机制行了深剖析，力求使读者在解决问题时做到心中有数，不仅知其然还知其所以然。本书光盘包含本书部分操作的视频教程以及所有源代码、脚本等发文件。《高可用性的hdfs—hadoop分布式文件系统深度实践》读者主要为云计算相关领域的研发人员、云计算系统管理维护人员，也适合作为高校研究生和高年级本科生的专业课辅助教材。 【推荐语】 有人抄概念，有人潜心做技术，本书就是这样一本让“云”地气的实际操作指南。 【作者】 文艾解放军理工大学讲师，7年Linux分布式系统发经验，完成科研项目10余项，发表学术论文9篇，获得部级科技步奖3项。自2008年关注云计算方向以来，参与完成了《云计算》教材编写，负责首届全国高校教师暑期云计算培训班实验课程教学，与国内外知名企业合作，完成多项云计算科研项目及培训任务，其中《面向3G视频监控的云存储系统》在2009年中国首届云计算大会上作了大会演示。对GFS、HDFS、MooseFS等云存储系统的运行原理和实现机制行过深研究，此外感兴趣的方向还包括分布式智能视频处理，目前的主要研究方向为云计算高可用性及云存储系统。王磊王磊南京云创存储科技有限公司云计算工程师，专注于分布式平台下任务调度和可靠性。发表多篇分布式环境下任务调度和可靠性论文。深度分析Hadoop源代码，熟悉运行机制和原理，掌握HDFS具体流程细节，深理解分布式计算理论及Hadoop的运行机制和原理，熟悉HDFS、MapReduce和Hbase的具体实现方式。在HDFS、MapReduce的数据一致性方面和故障恢复上也有深研究，并提供高效自动恢复方案。参与发了多个与Hadoop相关的大型项目和产品，热衷于改Hadoop代码以及研究如何提高Hadoop的可靠性。

目录展开

前言

第1章　HDFS HA及解决方案

1.1　HDFS系统架构

1.2　HA定义

1.3　HDFS HA原因分析及应对措施

1.3.1　可靠性

1.3.2　可维护性

1.4　现有HDFS HA解决方案

1.4.1　Hadoop的元数据备份方案

1.4.2　Hadoop的Secondary NameNode方案

1.4.3　Hadoop的Checkpoint Node方案

1.4.4　Hadoop的Backup Node方案

1.4.5　DRDB方案

1.4.6　FaceBook的AvatarNode方案

1.5　方案优缺点比较

第2章　HDFS元数据解析

2.1　概述

2.2　内存元数据结构

2.2.1　INode

2.2.2　Block

2.2.3　BlockInfo和DatanodeDescriptor

2.2.4　小结

2.2.5　代码分析——元数据结构

2.3　磁盘元数据文件

2.4　Format情景分析

2.5　元数据应用场景分析

第3章　Hadoop的元数据备份方案

3.1　运行机制分析

3.1.1　NameNode启动加载元数据情景分析

3.1.2　元数据更新及日志写入情景分析

3.1.3　Checkpoint过程情景分析

3.1.4　元数据可靠性机制

3.1.5　元数据一致性机制

3.2　使用说明

第4章　Hadoop的Backup Node方案

4.1　Backup Node概述

4.1.1　系统架构

4.1.2　使用原则

4.1.3　优缺点

4.2　运行机制分析

4.2.1　启动流程

4.2.2　元数据操作情景分析

4.2.3　日志池（journal spool）机制

4.2.4　故障切换机制

4.3　实验方案说明

4.4　构建实验环境

4.4.1　网络拓扑

4.4.2　系统安装及配置

4.4.3　安装JDK

4.4.4　虚拟机集群架设

4.4.5　NameNode安装及配置

4.4.6　Backup Node安装及配置

4.4.7　Data Node安装及配置

4.4.8　Clients安装及配置

4.5　异常解决方案

4.5.1　异常情况分析

4.5.2　NameNode配置

4.5.3　Backup Node配置

4.5.4　Data Node配置

4.5.5　NameNode宕机切换实验

4.5.6　NameNode宕机读写测试

第5章　AvatarNode运行机制

5.1　方案说明

5.1.1　系统架构

5.1.2　思路分析

5.1.3　性能数据

5.2　元数据分析

5.2.1　类FSNamesystem

5.2.2　类FSDirectory

5.2.3　AvatarNode的磁盘元数据文件

5.3　AvatarNode Primary启动过程

5.4　AvatarNode Standby启动过程

5.4.1　AvatarNode的构造方法

5.4.2　Standby线程的run()方法

5.4.3　Ingest 线程的run()方法

5.4.4　Ingest 线程的ingestFSEdits()方法

5.4.5　Standby 线程的doCheckpoint()方法

5.5　用户操作情景分析

5.5.1　创建目录情景分析

5.5.2　创建文件情景分析

5.6　AvatarNode Standby故障切换过程

5.7　元数据一致性保证机制

5.7.1　元数据目录树信息

5.7.2　Data Node与Block数据块映射信息

5.8　Block更新同步问题

5.8.1　问题描述

5.8.2　结论

5.8.3　源码分析

第6章　AvatarNode使用

6.1　方案说明

6.1.1　网络拓扑

6.1.2　操作系统安装及配置

6.2　使用Avatar打补丁版本

6.2.1　Hadoop源码联机Build

6.2.2　Hadoop源码本地Build

6.2.3　NFS服务器构建

6.2.4　Avatar分发与部署

6.2.5　Primary（namenode0）节点配置

6.2.6　Standby（namenode1）节点配置

6.2.7　Data Node节点配置

6.2.8　Client节点配置

6.2.9　创建目录

6.2.10　挂载NFS

6.2.11　启动Ucarp

6.2.12　格式化

6.2.13　系统启动

6.2.14　检查

6.2.15　NameNode失效切换写文件实验

6.2.16　NameNode失效切换读文件实验

6.3　Avatar FaceBook版本的使用

6.3.1　Hadoop FaceBook版本安装

6.3.2　节点配置

6.3.3　启动HDFS

6.3.4　NameNode失效切换

第7章　AvatarNode异常解决方案

7.1　测试环境

7.2　Primary失效

7.2.1　解决方案

7.2.2　写操作实验步骤

7.2.3　改进写操作机制

7.2.4　读操作实验步骤

7.2.5　小结

7.3　Standby失效

7.4　NFS失效（数据未损坏）

7.4.1　解决方案

7.4.2　写操作实验步骤

7.4.3　读操作实验步骤

7.4.4　小结

7.5　NFS失效（数据已损坏）

7.5.1　解决方案

7.5.2　写操作实验步骤

7.5.3　读操作实验步骤

7.5.4　小结

7.6　Primary先失效，NFS后失效（数据未损坏）

7.6.1　解决方案

7.6.2　写操作实验步骤

7.6.3　读操作实验步骤

7.6.4　小结

7.7　Primary先失效（数据未损坏），NFS后失效（数据损坏）

7.7.1　解决方案

7.7.2　写操作实验步骤

7.7.3　读操作实验步骤

7.7.4　小结

7.8　NFS先失效（数据未损坏），Primary后失效

7.8.1　解决方案

7.8.2　写操作实验步骤

7.8.3　读操作实验步骤

7.8.4　小结

7.9　NFS先失效（数据损坏），Primary后失效（数据未损坏）

7.9.1　解决方案

7.9.2　写操作实验步骤

7.9.3　读操作实验步骤

7.9.4　小结

7.10　实验结论

第8章　Cloudera HA NameNode使用

8.1　HA NameNode说明

8.2　CDH4B1 版本HDFS集群配置

8.2.1　虚拟机安装

8.2.2　nn1配置

8.2.3　dn1～dn3配置

8.2.4　HDFS集群构建

8.3　HA NameNode配置

8.3.1　nn1配置

8.3.2　其他节点配置

8.4　HA NameNode使用

8.4.1　启动HA HDFS集群

8.4.2　第1次failover

8.4.3　模拟写操作

8.4.4　模拟Active Name Node失效，第2次failover

8.3.5　模拟新的Standby NameNode加入

8.5　小结

累计评论(1条) 0个书友正在讨论这本书 发表评论

发表评论

发表评论，分享你的想法吧！

发表评论

买过这本书的人还买过

读了这本书的人还在读

支持设备

图解Skill:AI提效实战指南￥39.90

宝玉著

￥39.90

Python从入门到全栈开发￥70.00

钱超

￥70.00

大模型应用开发动手做AI Agent ￥57.47

黄佳著

￥57.47

Python网络爬虫与数据分析从入门到实践￥55.86

马国俊

￥55.86

Python编程:从入门到实践(第3版) ￥54.90

[美]埃里克·马瑟斯(Eric Matthes) 著

￥54.90

程序员必会的40种算法￥59.40

(加)伊姆兰·艾哈迈德(Imran Ahmad)

￥59.40

量化投资：策略与技术￥22.00

丁鹏

￥22.00

懒人“养虾”攻略:OpenClaw+豆包+扣子+飞书落地实战指南￥45.00

林园编著

￥45.00

Python+Office:轻松实现Python办公自动化￥55.30

王国平

￥55.30

Python完全自学教程￥57.54

明日科技编著

￥57.54

更多同类图书 >

高可用性的HDFS：Hadoop分布式文件系统深度实践(光盘内容另行下载，地址见书封底)电子书

支持设备

图解Skill:AI提效实战指南 ￥39.90

Python从入门到全栈开发 ￥70.00

大模型应用开发 动手做AI Agent ￥57.47

Python网络爬虫与数据分析从入门到实践 ￥55.86

Python编程:从入门到实践(第3版) ￥54.90

程序员必会的40种算法 ￥59.40

量化投资：策略与技术 ￥22.00

懒人“养虾”攻略:OpenClaw+豆包+扣子+飞书 落地实战指南 ￥45.00

Python+Office:轻松实现Python办公自动化 ￥55.30

Python完全自学教程 ￥57.54

当当云阅读