万本电子书0元读

万本电子书0元读

顶部广告

Hadoop大数据处理电子书

差异性。兼顾理论基础与发案例,便于自学和教学,且实用性强。 系统性。以北邮研究生教材为雏形,经过数年应用修改完善,成熟度高。

售       价:¥

纸质售价:¥40.70购买纸书

93人正在读 | 1人评论 6.2

作       者:刘军 编著

出  版  社:人民邮电出版社

出版时间:2013-09-01

字       数:27.7万

所属分类: 科技 > 计算机/网络 > 计算机理论与教程

温馨提示:数字商品不支持退换货,不提供源文件,不支持导出打印

为你推荐

  • 读书简介
  • 目录
  • 累计评论(1条)
  • 读书简介
  • 目录
  • 累计评论(1条)
《Hadoop大数据处理》以大数据处理系统的三大关键要素——“存储”、“计算”与“容错”为起,深浅出地介绍了如何使用Hadoop这一高性能分布式技术完成大数据处理任务。本书不仅包含了使用Hadoop行大数据处理的实践性知识和示例,还以图文并茂的形式系统性地揭示了Hadoop技术族中关键组件的运行原理和优化手段,为读者一步提升Hadoop使用技巧和运行效率提供了颇具价值的参考。 《Hadoop大数据处理》共10章,涉及的主题包括大数据处理概论、基于Hadoop的大数据处理框架、MapReduce计算模式、使用HDFS存储大数据、HBase大数据库、大数据的分析处理、Hadoop环境下的数据整合、Hadoop集群的管理与维护、基于MapReduce的数据挖掘实践及面向未来的大数据处理技术。后附有一个在Windows环境下搭建Hadoop发及调试环境的参考手册。 《Hadoop大数据处理》适合需要使用Hadoop处理大数据的程序员、架构师和产品经理作为技术参考和培训资料,也可作为高校研究生和本科生教材。<br/>【推荐语】<br/>差异性。兼顾理论基础与发案例,便于自学和教学,且实用性强。 系统性。以北邮研究生教材为雏形,经过数年应用修改完善,成熟度高。<br/>【作者】<br/>刘军,1994年至2003年,就读于北京邮电大学信息工程学院,获得博士学位。2003年至2007年,IBM中国研究院担任高级研究员及部门经理,研究方向为电信放业务平台及IP融合网络管理。2007年至2012年,创办欢城(北京)科技有限公司,为中国网页游戏产业创者之一,研发的产品曾多次获得互联网业界奖项。2012年至今,北邮任教,在宽带网络监控教研中心从事电信网络数据分析相关教学与研究工作。<br/>
目录展开

前言

第1章 大数据处理概论

1.1 什么是大数据

1.2 数据处理平台的基础架构

1.3 大数据处理的存储

1.4 大数据处理的计算模式

1.5 大数据处理系统的容错性

1.6 大数据处理的云计算变革

本章参考文献

第2章 基于Hadoop的大数据处理架构

2.1 Google核心云计算技术

2.2 Hadoop云计算技术及发展

2.3 基于云计算的大数据处理架构

2.4 基于云计算的大数据处理技术的应用

2.5 Hadoop运行实践

本章参考文献

第3章 MapReduce计算模式

3.1 MapReduce原理

3.2 MapReduce工作机制

3.3 MapReduce应用开发

3.4 MapReduce设计模式

3.5 MapReduce算法实践

3.6 MapReduce性能调优

本章参考文献

第4章 使用HDFS存储大数据

4.1 大数据的云存储需求

4.2 HDFS架构与流程

4.3 文件访问与控制

4.4 HDFS性能优化

4.5 HDFS的小文件存储问题

4.6 HDFS的高可用性问题

本章参考文献

第5章 HBase大数据库

5.1 大数据环境下的数据库

5.2 HBase架构与原理

5.3 管理HBase中的数据

5.4 从RDBMS到HBase

5.5 在HBase上运行MapReduce

5.6 HBase性能优化

本章参考文献

第6章 大数据的分析处理

6.1 大数据的分析处理概述

6.2 Hive

6.3 Pig

6.4 Hive与Pig的对比

本章参考文献

第7章 Hadoop环境下的数据整合

7.1 Hadoop计算环境下的数据整合问题

7.2 数据库整合工具Sqoop

7.3 Hadoop平台内部数据整合工具HCatalog

本章参考文献

第8章 Hadoop集群的管理与维护

8.1 云计算平台的管理体系

8.2 ZooKeeper——集群中的配置管理与协调者

8.3 Hadoop集群监控的基础组件

8.4 Ambari——Hadoop集群部署与监控集成工具

8.5 基于Cacti的Hadoop集群服务器监控

8.6 Chukwa——集群日志收集及分析

8.7 基于Kerberos的Hadoop安全管理

8.8 Hadoop集群管理工具分析

本章参考文献

第9章 基于MapReduce的数据挖掘

9.1 数据挖掘及其分布式并行化

9.2 基于MapReduce的数据挖掘与Mahout

9.3 经典数据挖掘算法的MapReduce实例

9.4 基于云计算的数据挖掘实践及面临的挑战

本章参考文献

第10章 面向未来的大数据处理

10.1 下一代计算框架YARN

10.2 大数据的实时交互式分析

10.3 大数据的图计算

本章参考文献

附录 基于Cygwin的Hadoop环境搭建

附录A 安装和配置Cygwin

附录B 安装和配置Hadoop

附录C 运行示例程序验证Hadoop安装

附录D 安装和配置Eclipse下的Hadoop开发环境

累计评论(1条) 1个书友正在讨论这本书 发表评论

发表评论

发表评论,分享你的想法吧!

买过这本书的人还买过

读了这本书的人还在读

回顶部