万本电子书0元读

万本电子书0元读

顶部广告

Spark大数据实时计算:基于Scala开发实战电子书

1.贴近实战场景 深度剖析企业级实时运营指标项目案例,快速掌握实战发经验。 2.掌握实战技术 详细解读Scala 函数式编程,SparkCore、Spark SQL、Spark Streaming 关键原理。 3.附赠丰富资源 随书附赠实例源代码、ppt和数据资源,方便读者学习。

售       价:¥

纸质售价:¥59.80购买纸书

29人正在读 | 0人评论 6.6

作       者:杨力 著

出  版  社:人民邮电出版社有限公司

出版时间:2022-10-01

字       数:23.3万

所属分类: 科技 > 计算机/网络 > 计算机理论与教程

温馨提示:数字商品不支持退换货,不提供源文件,不支持导出打印

为你推荐

  • 读书简介
  • 目录
  • 累计评论(0条)
  • 读书简介
  • 目录
  • 累计评论(0条)
本书从大数据实时计算框架Spark的编程语言Scala手,第1~4章重介绍函数式编程语言Scala的基础语法、面向对象编程以及函数式编程等,再通过编程训练案例介绍Scala这门语言的实际发应用,为读者后面学习Spark框架下牢固的编程基础。第5~10章重介绍Spark的安装部署、SparkCore编程、Spark SQL结构化数据处理以及Spark Streaming实时数据处理等,对它们行详细的剖析和解读。后,在第11章中通过网站运营指标统计和IP经纬度热力图分析两个实战发项目,让读者充分掌握Spark大数据实时计算框架技术的应用与实操方法。 本书适合所有对大数据技术感兴趣的读者。<br/>【推荐语】<br/>1.贴近实战场景 深度剖析企业级实时运营指标项目案例,快速掌握实战发经验。 2.掌握实战技术 详细解读Scala 函数式编程,SparkCore、Spark SQL、Spark Streaming 关键原理。 3.附赠丰富资源 随书附赠实例源代码、ppt和数据资源,方便读者学习。<br/>【作者】<br/>杨 力 曾任北大青鸟学术部经理兼教学总监、中信国安创客霸王课特聘讲师、兄弟连IT教育大数据讲师,致力于大数据技术的推广与普及,通过了Apache Hadoop、OCM等多项技术认证,在大中型企业的信息系统设计与实施方面有丰富的实践经验。<br/>
目录展开

内容提要

前言

致谢

服务与支持

提交勘误信息

与我们联系

关于异步社区和异步图书

第1章 Scala入门基础

1.1 Scala语言的特色

1.2 搭建Scala开发环境

1.3 Scala解释器

1.4 Scala语法基础

1.5 Scala控制结构和函数

1.6 方法

1.7 数组

1.8 元组和列表

1.9 Map映射

1.10 函数式编程

1.11 本章总结

1.12 本章习题

第2章 Scala面向对象编程

2.1 类与对象

2.2 定义和访问成员变量

2.3 使用下画线初始化成员变量

2.4 定义成员方法

2.5 访问修饰符

2.6 类的构造器

2.7 单例对象

2.8 main方法

2.9 伴生对象

2.10 继承

2.11 类型判断

2.12 抽象类

2.13 匿名内部类

2.14 特质

2.15 本章总结

2.16 本章习题

第3章 Scala编程高级应用

3.1 样例类

3.2 模式匹配

3.3 Option类型

3.4 偏函数

3.5 正则表达式

3.6 异常处理

3.7 提取器

3.8 泛型

3.9 Actor

3.10 Actor编程案例

3.11 本章总结

3.12 本章习题

第4章 Scala函数式编程思想

4.1 作为值的函数

4.2 匿名函数

4.3 柯里化

4.4 闭包

4.5 隐式转换

4.6 隐式参数

4.7 Akka并发编程框架

4.8 Akka编程入门案例

4.9 Akka定时任务

4.10 实现两个进程之间的通信

4.11 本章总结

4.12 本章习题

第5章 Spark安装部署与入门

5.1 Spark简介

5.2 Spark环境搭建

5.3 编写Spark应用程序

5.4 本章总结

5.5 本章习题

第6章 SparkCore编程

6.1 RDD概念与详解

6.2 RDD API应用程序

6.3 RDD的方法(算子)分类

6.4 基础练习

6.5 实战案例

6.6 RDD持久化缓存

6.7 持久化缓存API详解

6.8 RDD容错机制Checkpoint

6.9 本章总结

6.10 本章习题

第7章 SparkCore运行原理

7.1 RDD依赖关系

7.2 DAG的生成和划分阶段

7.3 Spark原理初探

7.4 RDD累加器和广播变量

7.5 RDD的数据源

7.6 本章总结

7.7 本章习题

第8章 Spark SQL结构化数据处理入门

8.1 数据分析方式

8.2 Spark SQL的发展

8.3 数据分类和Spark SQL适用场景

8.4 Spark SQL特点

8.5 Spark SQL数据抽象

8.6 DataFrame简介

8.7 Dataset简介

8.8 RDD、DataFrame和Dataset的区别

8.9 Spark SQL初体验

8.10 本章总结

8.11 本章习题

第9章 Spark SQL结构化数据处理高级应用

9.1 使用IDEA开发Spark SQL

9.2 Spark SQL多数据源交互

9.3 Spark SQL自定义函数

9.4 Spark on Hive

9.5 本章总结

9.6 本章习题

第10章 Spark Streaming核心编程

10.1 场景需求

10.2 Spark Streaming概述

10.3 Spark Streaming原理

10.4 DStream相关的API

10.5 Spark Streaming原理总结

10.6 Spark Streaming实战

10.7 updateStateByKey算子

10.8 reduceByKeyAndWindow算子

10.9 统计一定时间内的热搜词

10.10 整合Kafka

10.11 本章总结

10.12 本章习题

第11章 Spark综合项目实战

11.1 网站运营指标统计项目

11.2 热力图分析项目

11.3 本章总结

11.4 本章习题

累计评论(0条) 0个书友正在讨论这本书 发表评论

发表评论

发表评论,分享你的想法吧!

买过这本书的人还买过

读了这本书的人还在读

回顶部