万本电子书0元读

万本电子书0元读

顶部广告

Hadoop MapReduce性能优化电子书 租阅

  《Hadoop MapReduce性能优化》详细描述了Hadoop MapReduce作业性能的优化过程。书中通过大量清晰而实用的步骤,帮助读者充分利用集群的节点资源。   《Hadoop MapReduce性能优化》从MapReduce工作原理以及影响MapReduce性能的因素出发,让读者对Hadoop性能指标以及几个性能工具有大致的了解。接下来,本书探索了性能计数器,帮读者判断资源瓶颈、检查集群的健康状况、量化Hadoop集群并学习常用的性能调优手段。读者还会学到通过对map和reduce任务进行性能分析并使用Combiner和压缩技术对map和reduce任务进行性能优化。

售       价:¥

纸质售价:¥24.10购买纸书

50人正在读 | 0人评论 6.2

作       者:[法]卡勒德·坦尼尔(Khaled Tannir)

出  版  社:信息技术第一出版分社

出版时间:2015-02-01

字       数:5.4万

所属分类: 科技 > 计算机/网络 > 软件系统

温馨提示:此类商品不支持退换货,不支持下载打印

为你推荐

  • 读书简介
  • 目录
  • 累计评论(0条)
  • 读书简介
  • 目录
  • 累计评论(0条)
  大数据时代,MapReduce的重要性不言而喻。Hadoop作为MapReduce框架的一个实现,受到业界广泛的认同,并被广泛部署和应用。尽管Hadoop为数据开发工程师入门和编程提供了极大便利,但构造一个真正满足性能要求的MapReduce程序并不简单。数据量巨大是大数据工作的现实问题,而对低响应时间的要求则时常困扰着数据开发工程师。   《Hadoop MapReduce性能优化》采用原理与实践相结合的方式,通过原理讲解影响MapReduce性能的因素,透过实例一步步地教读者如何发现性能瓶颈并消除瓶颈,如何识别系统薄弱环节并改善薄弱环节,讲解过程中融合了作者在优化实践过程中积累的丰富经验,具有很强的针对性。读完本书,能让读者对Hadoop具有更强的驾驭能力,从而构造出性能*的MapReduce程序。   Hadoop性能问题既是程序层面的问题,也是系统层面的问题。本书既覆盖了系统层面的优化又覆盖了程序层面的优化,非常适合Hadoop管理员和有经验的数据开发工程师阅读。对于初学者,本书第1章也作了必要的技术铺垫,避免对后面章节的理解产生梯度。 大数据时代,MapReduce的重要性不言而喻。Hadoop作为MapReduce框架的一个实现,受到业界广泛的认同,并被广泛部署和应用。尽管Hadoop为数据发工程师门和编程提供了极大便利,但构造一个真正满足性能要求的MapReduce程序并不简单。数据量巨大是大数据工作的现实问题,而对低响应时间的要求则时常困扰着数据发工程师。 《Hadoop MapReduce性能优化》采用原理与实践相结合的方式,通过原理讲解影响MapReduce性能的因素,透过实例一步步地教读者如何发现性能瓶颈并消除瓶颈,如何识别系统薄弱环节并改善薄弱环节,讲解过程中融合了作者在优化实践过程中积累的丰富经验,具有很强的针对性。读完本书,能让读者对Hadoop具有更强的驾驭能力,从而构造出性能*的MapReduce程序。 Hadoop性能问题既是程序层面的问题,也是系统层面的问题。本书既覆盖了系统层面的优化又覆盖了程序层面的优化,非常适合Hadoop管理员和有经验的数据发工程师阅读。对于初学者,本书第1章也作了必要的技术铺垫,避免对后面章节的理解产生梯度。
【推荐语】
《Hadoop MapReduce性能优化》详细描述了Hadoop MapReduce作业性能的优化过程。书中通过大量清晰而实用的步骤,帮助读者充分利用集群的节资源。 《Hadoop MapReduce性能优化》从MapReduce工作原理以及影响MapReduce性能的因素出发,让读者对Hadoop性能指标以及几个性能工具有大致的了解。下来,本书探索了性能计数器,帮读者判断资源瓶颈、检查集群的健康状况、量化Hadoop集群并学习常用的性能调优手段。读者还会学到通过对map和reduce任务行性能分析并使用Combiner和压缩技术对map和reduce任务行性能优化。 以Hadoop集群的**实践和建议结尾,讲述如何**地使用Hadoop集群。 通过本书读者将掌握: 量化Hadoop集群的节配置; 利用Hadoop MapReduce性能计数器判断资源瓶颈; 正确设置mapper和reducer的数量; 使用压缩技术和Combiner优化map和reduce任务的吞吐量和代码量; 理解各种调优属性以及优化集群的**实践; 判断Hadoop集群的薄弱环节; 了解影响MapReduce性能的因素。
【作者】
作者介绍 Khaled Tannirhas从1980年始从事计算机相关工作。他是微软认证的发人员(MCSD),他在领导软件解决方案的发和实施以及技术演说方面,拥有20多年技术经验。如今,他是一名独立IT咨询师,并在法国、加拿大的许多大公司担任基础设施工程师、高级研发工程师、企业/解决方案架构师等职务。 他在Microsoft .NET、Microsoft服务器系统、Oracle Java技术等领域拥有丰富的经验,并且熟练驾驭在线和离线应用系统设计、系统转换以及多语言的互联网/桌面应用程序发。 Khaled Tnnirhas总是热衷于探索和学习新的技术,并基于这些技术在法国、北美、中东等地区寻求商机。他现在拥有一个IT电子实验室,实验室中配备了很多服务器、监控器、源电子板(如Arduino、Netduino、RaspBerry Pi和.Net Gadgeteer),还有一些装有Windows Phone、Android和iOS操作系统的智能设备。 2012年,他协助组织并出席了法国波尔多大学的复杂数据挖掘国际论坛——EGC 2012。 他还是《RavenDB 2.x Beginner’s Guide》一书的作者。 译者简介 范欢动 信息技术领域的一名老兵。1994年获得电力系统及其自动化专业学士学位。1997年获得信号与信息处理专业硕士学位。兴趣广泛,涉及技术领域和非技术领域,但大多浅尝辄止。参与过航天、通信、电子出版和金融领域的信息处理、软件架构与发,以第一作者或合作者身份拥有三项实用新型专利,并获得第十八届北京市优秀青年工程师称号。曾在佳讯飞鸿电气股份有限公司、英国雅讯(xarios)北京代表处、博云科技等公司担任产品技术总监。目前,终于把全部的兴趣聚焦到了数据分析,尤其是大数据分析上,主要目标是利用数据分析手段发现模式,从而降低决策风险、改善产业价值。冀望在大数据时代与读者一起学习并分享大数据相关技术,共同发掘大数据带来的价值。
目录展开

内容提要

译者序

译者简介

前言

致谢

作者简介

技术审稿人简介

第1章 了解Hadoop MapReduce

1.1 MapReduce模型

1.2 Hadoop MapReduce概述

1.3 Hadoop MapReduce的工作原理

1.4 影响MapReduce性能的因素

1.5 小结

第2章 Hadoop参数概述

2.1 研究Hadoop参数

2.2 Hadoop MapReduce性能指标

2.3 性能监测工具

2.4 用Apache Ambari监测Hadoop

2.5 小结

第3章 检测系统瓶颈

3.1 性能调优

3.2 创建性能基线

3.3 识别资源瓶颈

3.4 小结

第4章 识别资源薄弱环节

4.1 识别集群薄弱环节

4.2 量化Hadoop集群

4.3 正确配置集群

4.4 小结

第5章 强化map和reduce任务

5.1 强化map任务

5.2 强化reduce任务

5.3 调优map和reduce参数

5.4 小结

第6章 优化MapReduce任务

6.1 使用Combiner

6.2 使用压缩技术

6.3 使用正确Writable类型

6.4 明智地复用类型

6.5 优化mapper和reducer的代码

6.6 小结

第7章 最佳实践与建议

7.1 硬件调优与操作系统推荐

7.2 Hadoop最佳实践与建议

7.3 小结

累计评论(0条) 0个书友正在讨论这本书 发表评论

发表评论

发表评论,分享你的想法吧!

买过这本书的人还买过

读了这本书的人还在读

回顶部