到目前为止,基于MapReduce框架的设计模式散见于各种研究论文、博客和书籍中。这本书将各种有价值的MapReduce设计模式汇集在一起,形成一本独特的合集,可以帮读者节省大量的时间和精力,无论读者身处哪个领域,使用哪种编程语言,使用什么开发框架。 书中对每一种模式都会详细解释其使用的上下文、可能存在的陷阱及使用的注意事项,以帮助读者在对大数据问题架构建模时避免常见的设计错误。本书还提供了MapReduce的一个完整综述,解释其起源和实现,并说明设计模式如此重要的原因。书中的所有示例代码都是基于Hadoop平台编写的。
售 价:¥
纸质售价:¥36.40购买纸书
温馨提示:数字商品不支持退换货,不提供源文件,不支持导出打印
为你推荐
内容提要
作者简介
第1章 设计模式与MapReduce
1.1 设计模式
1.2 MapReduce简史
1.3 MapReduce和Hadoop简介
1.4 Hadoop示例:单词计数
1.5 Pig和Hive
第2章 概要模式
2.1 数值概要
2.2 倒排索引概要
2.3 计数器计数
第3章 过滤模式
3.1 过滤
3.2 布隆过滤
3.3 Top 10
3.4 去重
第4章 数据组织模式
4.1 分层结构
4.2 分区
4.3 分箱
4.4 全排序
4.5 混排
第5章 连接模式
5.1 连接简介
5.2 reduce端连接
5.3 复制连接
5.4 组合连接
5.5 笛卡儿积
第6章 元模式
6.1 作业链
6.2 链折叠
6.3 作业归并
第7章 输入和输出模式
7.1 在Hadoop中自定义输入和输出
7.2 生成数据
7.3 外部源输出
7.4 外部源输入
7.5 分区裁剪
第8章 最后的思考与设计模式的未来
8.1 数据的本质趋势
8.2 YARN的影响
8.3 作为库或者组件的模式
8.4 读者可以帮到什么
附录A 布隆过滤器
A.1 综述
A.2 用例
A.3 缺点
A.4 调整你的布隆过滤器
买过这本书的人还买过
读了这本书的人还在读
同类图书排行榜