万本电子书0元读

万本电子书0元读

顶部广告

MapReduce设计模式电子书

  到目前为止,基于MapReduce框架的设计模式散见于各种研究论文、博客和书籍中。这本书将各种有价值的MapReduce设计模式汇集在一起,形成一本独特的合集,可以帮读者节省大量的时间和精力,无论读者身处哪个领域,使用哪种编程语言,使用什么开发框架。   书中对每一种模式都会详细解释其使用的上下文、可能存在的陷阱及使用的注意事项,以帮助读者在对大数据问题架构建模时避免常见的设计错误。本书还提供了MapReduce的一个完整综述,解释其起源和实现,并说明设计模式如此重要的原因。书中的所有示例代码都是基于Hadoop平台编写的。

售       价:¥

纸质售价:¥36.40购买纸书

184人正在读 | 0人评论 6.2

作       者:[美]Donald Miner,Adam Shook

出  版  社:信息技术第一出版分社

出版时间:2014-09-01

字       数:21.8万

所属分类: 科技 > 计算机/网络 > 程序设计

温馨提示:数字商品不支持退换货,不提供源文件,不支持导出打印

为你推荐

  • 读书简介
  • 目录
  • 累计评论(0条)
  • 读书简介
  • 目录
  • 累计评论(0条)
MapReduce作为一种分布式海量数据处理的编程框架,已经得到业界的广泛关注。随着Hadoop的普及,MapReduce目前已经成为海量数据处理的基础但也是重要的方法之一。 《MapReduce设计模式》是一本关于设计模式的书,为读者提供解决问题的模板或通用指南。书中主要介绍编程模式,即如何利用MapReduce框架解决一类问题,重在提供解决问题的方法和思路。作者花大量篇幅介绍各种模式的原理及实现机制,并给出相应的应用实例,让读者对每种模式能有更直观的理解。 由于本书不会过多涉及底层框架及MapReduce API,所以希望读者阅读《MapReduce设计模式》之前,能够对Hadoop系统有所了解,知道如何编写MapReduce程序,并了解MapReduce程序框架的工作原理。《MapReduce设计模式》面向中高级MapReduce发者,涵盖了绝大部分MapReduce编程可能面对的场景,相信初学者和专家同样可以在本书中得到一些启示。<br/>【推荐语】<br/>到目前为止,基于MapReduce框架的设计模式散见于各种研究论文、博客和书籍中。这本书将各种有价值的MapReduce设计模式汇集在一起,形成一本独特的合集,可以帮读者节省大量的时间和精力,无论读者身处哪*领域,使用哪种编程语言,使用什么发框架。 书中对每一种模式都会详细解释其使用的上下文、可能存在的陷阱及使用的注意事项,以帮助读者在对大数据问题架构建模时避免常见的设计错误。本书还提供了MapReduce的一*完整综述,解释其起源和实现,并说明设计模式如此重要的原因。书中的所有示例代码都是基于Hadoop平台编写的。  <br/>【作者】<br/>Donald Miner目前是EMC Greenplum的解决方案架构师,为实现与使用基于Greenplum的大数据系统的用户提供咨询和帮助。在加Greenplum之前,Miner*作为承包商为美国政府部署和构建了多*规模巨大且涉及关键任务的Hadoop集*。他还参与了教学,在马里兰大学巴尔的摩分校(UMBC)讲授Hadoop方面的业界前沿相关的课程以及各种人工智能课程。Miner*在UMBC获得了计*机科学的*学位,读*期间他的研究主题为机器学*,*论文的主题是多智能体系统。 Adam Shook是ClearEdge IT Solutions公司的软件工程师,从事一些大数据技术工作,如Hadoop、Accumulo、Pig以及ZooKeeper。Shook在马里兰大学巴尔的摩分校(UMBC)获得了计*机科学的学士学位,并得到了一份为游戏工作室构建一*全新的高性能图像引擎的工作。为了寻求新的挑战,他在UMBC就读研究生,主要专注的研究方向是分布式计*的相关技术。他很快找到了一份发工作,作为美国政府承包商,从事大规模的Hadoop部署。Shook参与了Hadoop和Pig的发及培训课程的指导。在繁忙工作的间隙他喜欢参与相关项目,玩视频游戏。  <br/>
目录展开

内容提要

作者简介

第1章 设计模式与MapReduce

1.1 设计模式

1.2 MapReduce简史

1.3 MapReduce和Hadoop简介

1.4 Hadoop示例:单词计数

1.5 Pig和Hive

第2章 概要模式

2.1 数值概要

2.2 倒排索引概要

2.3 计数器计数

第3章 过滤模式

3.1 过滤

3.2 布隆过滤

3.3 Top 10

3.4 去重

第4章 数据组织模式

4.1 分层结构

4.2 分区

4.3 分箱

4.4 全排序

4.5 混排

第5章 连接模式

5.1 连接简介

5.2 reduce端连接

5.3 复制连接

5.4 组合连接

5.5 笛卡儿积

第6章 元模式

6.1 作业链

6.2 链折叠

6.3 作业归并

第7章 输入和输出模式

7.1 在Hadoop中自定义输入和输出

7.2 生成数据

7.3 外部源输出

7.4 外部源输入

7.5 分区裁剪

第8章 最后的思考与设计模式的未来

8.1 数据的本质趋势

8.2 YARN的影响

8.3 作为库或者组件的模式

8.4 读者可以帮到什么

附录A 布隆过滤器

A.1 综述

A.2 用例

A.3 缺点

A.4 调整你的布隆过滤器

累计评论(0条) 0个书友正在讨论这本书 发表评论

发表评论

发表评论,分享你的想法吧!

买过这本书的人还买过

读了这本书的人还在读

回顶部