万本电子书0元读

万本电子书0元读

顶部广告

大数据Hadoop 3.X分布式处理实战电子书

售       价:¥

158人正在读 | 3人评论 6.2

作       者:北京源智天下科技有限公司

出  版  社:人民邮电出版社有限公司

出版时间:2019-11-01

字       数:28.3万

所属分类: 科技 > 计算机/网络 > 程序设计

温馨提示:数字商品不支持退换货,不提供源文件,不支持导出打印

为你推荐

  • 读书简介
  • 目录
  • 累计评论(2条)
  • 读书简介
  • 目录
  • 累计评论(2条)
本书共14章,前4章主要讲解和演示大数据与Hadoop概述、Hadoop伪分布式安装、HDFS分布式文件系统、MapReduce分布式计算框架。第5到11章讲解了Hadoop生态的常用组件,包括NoSQL数据库HBase、分布式数据仓库Hive、数据转换工具Sqoop、内存计算框架Spark。后3章讲解了3个企业级的大型大数据综合实战项目。
目录展开

内容提要

前言

第一篇 Hadoop技术

第1章 大数据与Hadoop概述

1.1 大数据概述

1.2 Hadoop概述

1.3 小结

1.4 配套视频

第2章 Hadoop伪分布式安装

2.1 Hadoop伪分布式安装前的准备

2.2 Hadoop伪分布式安装

2.3 Hadoop验证

2.4 小结

2.5 配套视频

第3章 Hadoop分布式文件系统——HDFS

3.1 HDFS原理

3.2 HDFS Shell

3.3 HDFS Java API

3.4 小结

3.5 配套视频

第4章 分布式计算框架MapReduce

4.1 MapReduce原理

4.2 MapReduce编程基础

4.3 MapReduce综合实例——数据去重

4.4 MapReduce综合实例——数据排序

4.5 MapReduce综合实例——求学生平均成绩

4.6 MapReduce综合实例——WordCount高级示例

4.7 小结

4.8 配套视频

第二篇 Hadoop生态系统的主要大数据工具整合应用

第5章 NoSQL数据库HBase

5.1 HBase原理

5.2 HBase伪分布式安装

5.3 HBase Shell

5.4 小结

5.5 配套视频

第6章 HBase高级特性

6.1 HBase Java API

6.2 HBase与MapReduce的整合

6.3 小结

6.4 配套视频

第7章 分布式数据仓库Hive

7.1 Hive概述

7.2 Hive伪分布式安装

7.3 Hive QL的基础功能

7.4 Hive QL的高级功能

7.5 小结

7.6 配套视频

第8章 Hive高级特性

8.1 Beeline

8.2 Hive JDBC

8.3 Hive函数

8.4 Hive表的高级特性

8.5 小结

8.6 配套视频

第9章 数据转换工具Sqoop

9.1 Sqoop概述与安装

9.2 Sqoop导入数据

9.3 Sqoop导出数据

9.4 深入理解Sqoop的导入与导出

9.5 小结

9.6 配套视频

第10章 内存计算框架Spark

10.1 Spark入门

10.2 Spark Streaming

10.3 Spark SQL

10.4 小结

10.5 配套视频

第11章 Hadoop及其常用组件集群安装

11.1 Hadoop集群安装

11.2 HBase集群安装

11.3 Hive集群安装

11.4 Spark集群安装

11.5 小结

11.6 配套视频

第三篇 实战篇

第12章 海量Web日志分析系统

12.1 案例介绍

12.2 案例分析

12.3 案例实现

12.4 小结

12.5 配套视频

第13章 电商商品推荐系统

13.1 案例介绍

13.2 案例设计

13.3 案例实现

13.4 小结

13.5 配套视频

第14章 分布式垃圾消息识别系统

14.1 案例介绍

14.2 RPC远程方法调用的设计

14.3 数据分析设计

14.4 案例实现

14.5 小结

14.6 配套视频

累计评论(2条) 2个书友正在讨论这本书 发表评论

发表评论

发表评论,分享你的想法吧!

买过这本书的人还买过

读了这本书的人还在读

回顶部