1、本书由Spark项目经验丰富的作者编写,作者之一为加米谷大数据公司张安文(国家大数据标准组成员、大数据架构师,大数据实战发者),项目发经验丰富。 2、本书主要讲Spark SQL的深度理论知识及实践,市面上关于Spark的书籍绝大多数讲整个Spark的知识,在有广度的情况下很难兼顾到深度。本书的特是只关注Spark整套理论中的Spark SQL细分技术领域,关于Spark SQL的所有知识会行讲解,并有针对性的代码实践,从理论到实践让读者掌握深层次的Spark SQL技术,做到精通这门技术。
售 价:¥
纸质售价:¥35.20购买纸书
温馨提示:数字商品不支持退换货,不提供源文件,不支持导出打印
为你推荐
内容提要
前言
第1章 Spark SQL基础知识
1.1 Spark SQL背景
1.2 Spark SQL简介
1.3 为什么要学习Spark SQL
1.4 Spark SQL的原理
1.5 Spark SQL的运行模式
第2章 Spark SQL安装部署
2.1 运行环境说明
2.2 运行环境准备
2.3 部署Spark SQL
第3章 第一个Spark SQL应用程序
3.1 搭建开发环境
3.2 编写Spark SQL应用程序
第4章 Spark SQL编程基础
4.1 RDD概述
4.2 深入剖析RDD
4.3 创建RDD
4.4 RDD操作
4.5 RDD持久化
4.6 RDD容错机制
第5章 Spark SQL编程进阶
5.1 概述
5.2 SparkSession
5.3 DataFrame
5.4 DataSet
5.5 数据抽象的共性与区别
5.6 数据抽象的相互转换
第6章 Spark SQL函数
6.1 用户定义函数
6.2 用户定义聚合函数
6.3 常用内置函数
第7章 Spark SQL性能调优
7.1 概述
7.2 并行度调优
7.3 内存调优
7.4 磁盘I/O调优
7.5 网络I/O调优
第8章 Spark SQL编程实践
8.1 Spark SQL实践一——学生考试信息分析
8.2 Spark SQL实践二——生鲜电商交易数据分析
8.3 Spark SQL实践三——四川省新生婴儿信息分析
附录
附录1 常用内置函数
附录2 常用高阶函数
附录3 术语解释
买过这本书的人还买过
读了这本书的人还在读
同类图书排行榜