万本电子书0元读

万本电子书0元读

顶部广告

大数据猩球:海量数据处理实践指南电子书

从超大规模的事件流中发现模式可能很困难,但是学习如何发现这些模式却不见得很难。这本实战指南告诉我们如何利用Apache Hadoop,使用简单、有趣、精致的工具,解决大规模数据处理中的模式发现以及很多其他问题。通过处理真实数据、解决现实问题,你将对大数据有一个实用的、可操作的认识。本书非常适合Hadoop新手,也很适合那些想要提升技能的有经验的实践家。其中,*部分解释了Hadoop和MapReduce的工作原理,第二部分讲述了很多数据处理用到的分析模式。通过一些练习,你还将学会如何使用Apache Pig行数据处理。

售       价:¥

纸质售价:¥51.70购买纸书

22人正在读 | 0人评论 6.2

作       者:唐李洋

出  版  社:电子工业出版社

出版时间:2016-08-01

字       数:14.3万

所属分类: 科技 > 计算机/网络 > 计算机理论与教程

温馨提示:数字商品不支持退换货,不提供源文件,不支持导出打印

为你推荐

  • 读书简介
  • 目录
  • 累计评论(0条)
  • 读书简介
  • 目录
  • 累计评论(0条)
本书以实用的、可操作的视角解释了大数据——采用黑猩猩和大象的隐喻,基于棒球统计数据集,使用Apache Hadoop和Pig等工具展示了如何处理大规模数据。此外,通过处理真实数据、解决现实问题,作者还以实例的形式总结了一些实践分析模式,为有创造力的分析人员提供了强大、有价值的方法。本书特别适合那些需要大数据工具箱来解决实际问题的人们。<br/>【推荐语】<br/>从超大规模的事件流中发现模式可能很困难,但是学习如何发现这些模式却不见得很难。这本实战指南告诉我们如何利用Apache Hadoop,使用简单、有趣、精致的工具,解决大规模数据处理中的模式发现以及很多其他问题。通过处理真实数据、解决现实问题,你将对大数据有一个实用的、可操作的认识。本书非常适合Hadoop新手,也很适合那些想要提升技能的有经验的实践家。其中,*部分解释了Hadoop和MapReduce的工作原理,第二部分讲述了很多数据处理用到的分析模式。通过一些练习,你还将学会如何使用Apache Pig行数据处理。 ■ 学习使用Hadoop的必要原理,包括数据和计算在集群中的移动行为 ■ 深理解MapReduce机制,用Python创建你的*个MapReduce作业 ■ 理解如何以Pig脚本的形式运行MapReduce作业 ■ 全书使用真实数据集,即棒球统计数据集 ■ 提供分析模式的示例,并学习何时何地使用这些分析模式<br/>
目录展开

O'Reilly Media,Inc.介绍

前言

第一部分 入门:理论和工具

第1章 Hadoop基础

第2章 MapReduce

第3章 棒球数据集速览

第4章 Pig入门

第二部分 战术:分析模式

第5章 Map-Only操作

第6章 分组操作

第7章 表连接

第8章 排序操作

第9章 重复记录和唯一记录

索引

关于作者

封面介绍

累计评论(0条) 0个书友正在讨论这本书 发表评论

发表评论

发表评论,分享你的想法吧!

买过这本书的人还买过

读了这本书的人还在读

回顶部