为你推荐
内容简介
前言
第1章 大数据概述
1.1 大数据的概念
1.1.1 什么是大数据
1.1.2 大数据的产生和来源
1.1.3 大数据的技术
1.1.4 大数据的特征
1.1.5 数据、信息与知识
1.2 大数据的价值与挑战
1.2.1 大数据的潜在价值
1.2.2 大数据对业务的挑战
1.2.3 大数据对技术架构的挑战
1.2.4 大数据对管理策略的挑战
1.3 大数据与相关领域的关系
1.3.1 大数据与统计分析
1.3.2 大数据与数据挖掘
1.3.3 大数据与云计算
1.4 大数据发展状况
参考文献
第2章 大数据挖掘技术
2.1 数据挖掘与过程
2.1.1 数据挖掘的七大功能
2.1.2 数据挖掘的实质
2.2 数据挖掘过程
2.2.1 定义挖掘目标
2.2.2 数据取样
2.2.3 数据探索
2.2.4 数据预处理
2.2.5 数据模式发现
2.2.6 模型评价
2.3 常用算法
2.3.1 决策树
2.3.2 回归
2.3.3 关联规则
2.3.4 聚类
2.3.5 贝叶斯分类方法
2.3.6 神经网络
2.3.7 支持向量机(SVM)
2.3.8 假设检验
2.3.9 遗传算法
参考文献
第3章 大规模存储与处理技术
3.1 Hadoop概述
3.1.1 什么是Hadoop
3.1.2 Hadoop发展简史
3.1.3 Hadoop的优势
3.1.4 Hadoop的子项目
3.2 HDFS
3.2.1 HDFS的设计目标
3.2.2 HDFS文件系统的原型GFS
3.2.3 HDFS文件的基本结构
3.2.4 HDFS的文件读/写操作
3.2.5 HDFS的存储过程
3.3 MapReduce编程框架
3.3.1 MapReduce的发展历史
3.3.2 MapReduce的基本工作过程
3.3.3 MapReduce的特点
3.4 建立Hadoop开发环境
3.4.1 相关准备工作
3.4.2 JDK的安装配置
3.4.3 SSH无钥登录
3.4.4 安装、配置Hadoop环境变量
3.5 大数据处理系统分类
3.5.1 批量数据处理系统
3.5.2 流式数据处理系统
3.5.3 交互式数据处理
3.5.4 图数据处理系统
3.6 大数据查询和分析技术:SQL on Hadoop
3.6.1 数据库简介
3.6.2 图数据库
3.6.3 Hive:基本的Hadoop分析
3.6.4 实时互动的SQL:Impala和Drill
3.7 以通信业务分析为例的大数据的技术环境部署
3.7.1 应用架构规划与设计
3.7.2 技术环境部署与配置
第4章 大数据应用的总体架构和关键技术
4.1 大数据的业务分析
4.2 大数据的总架体构模型
4.3 大数据高级分析
4.3.1 数据仓库与联机分析处理技术
4.3.2 大数据分析与传统分析
4.3.3 非结构化复杂数据分析
4.3.4 实时预测分析
4.4 可视化分析
4.4.1 可视化技术
4.4.2 可视化工具
参考文献
第5章 运营商数据分析
5.1 案例背景
5.1.1 大数据运营已为大势所趋
5.1.2 采取大数据运营的原因
5.1.3 大数据分析如何提升电信行业绩效
5.1.4 大数据的社会价值
5.2 挖掘目标的提出
5.3 案例分析
5.3.1 体系架构
5.3.2 Hadoop集群抽取模块
5.3.3 数据处理模块
5.3.4 数据分发
5.4 MapReduce操作
5.5 结果分析
第6章 互联网电影推荐系统
6.1 背景描述
6.2 业务目标
6.3 业务需求
6.4 协同过滤推荐系统建模
6.4.1 推荐系统概述
6.4.2 基于对立用户的协同过滤模型
6.5 项目处理过程
6.5.1 项目数据
6.5.2 数据预处理
6.5.3 Hadoop并行算法
6.6 总结
买过这本书的人还买过
读了这本书的人还在读
同类图书排行榜