为你推荐
前言
为什么要写这本书
本书特色
第一篇 基础篇
第1章 浅谈大数据
1.1 大数据概述
1.2 大数据平台
1.3 本章小结
第2章 大数据存储与运算利器—Hadoop
2.1 Hadoop概述
2.1.1 Hadoop简介
2.2 Hadoop配置及IDE配置
2.2.1 准备工作
2.3 Hadoop集群命令
2.3.1 HDFS常用命令hdfs dfs
2.3.2 动手实践:hdfs dfs命令实战
2.3.3 MapReduce常用命令mapred job
2.3.4 YARN常用命令yarn jar
2.3.5 动手实践:运行MapReduce任务
2.4 Hadoop编程开发
2.4.1 HDFS Java API操作
2.5 K-Means算法原理及Hadoop MapReduce实现
2.5.1 K-Means算法原理
2.6 TF-IDF算法原理及Hadoop MapReduce实现
2.6.1 TF-IDF算法原理
2.6.2 Hadoop TF-IDF编程思路
2.7 本章小结
第3章 大数据查询—Hive
3.1 Hive概述
3.1.1 Hive体系架构
3.2 HiveQL语句
3.2.1 数据库操作
3.2.2 Hive表定义
3.3 动手实践:基于Hive的学生信息查询
3.4 基于Hive的航空公司客户价值数据预处理及分析
3.4.1 背景与挖掘目标
3.5 本章小结
第4章 大数据快速读写—HBase
4.1 HBase概述
4.2 配置HBase集群
4.2.1 Zookeeper简介及配置
4.3 HBase原理与架构组件
4.3.1 HBase架构与组件
4.4 HBase Shell操作
4.4.1 HBase常用Shell命令
4.5 Java API&MapReduce与HBase交互
4.5.1 搭建HBase开发环境
4.6 基于HBase的冠字号查询系统
4.6.1 案例背景
4.7 本章小结
第5章 大数据处理—Pig
5.1 Pig概述
5.1.1 Pig Latin简介
5.2 配置运行Pig
5.2.1 Pig配置
5.2.2 Pig运行模式
5.3 常用Pig Latin操作
5.3.1 数据加载
5.4 综合实践
5.4.1 动手实践:访问统计信息数据处理
5.4.2 动手实践:股票交易数据处理
5.5 本章小结
第6章 大数据快速运算与挖掘—Spark
6.1 Spark概述
6.2 Spark安装集群
6.2.1 3种运行模式
6.2.2 动手实践:配置Spark独立集群
6.3 Spark架构与核心原理
6.3.1 Spark架构
6.4 Spark编程技巧
6.4.1 Scala基础
6.4.2 Spark基础编程
6.5 如何学习Spark MLlib
6.5.1 确定应用
6.5.2 ALS算法直观描述
6.5.3 编程实现
6.5.4 问题解决及模型调优
6.6 动手实践:基于Spark ALS电影推荐系统
6.6.1 动手实践:生成算法包
6.6.2 动手实践:完善推荐系统
6.7 本章小结
第7章 大数据工作流—Oozie
7.1 Oozie简介
7.2 编译配置并运行Oozie
7.2.1 动手实践:编译Oozie
7.3 Oozie WorkFlow实践
7.3.1 定义及提交工作流
7.4 Oozie Coordinator实践
7.4.1 动手实践:基于时间调度
7.5 本章小结
第二篇 挖掘实战篇
第8章 法律服务大数据智能推荐
8.1 背景
8.2 目标
8.3 系统架构及流程
8.4 分析过程及实现
8.4.1 数据传输
8.5 构建法律服务大数据智能推荐系统
8.5.1 动手实践:构建推荐系统JavaEE
8.6 本章小结
买过这本书的人还买过
读了这本书的人还在读
同类图书排行榜