万本电子书0元读

万本电子书0元读

顶部广告

Spark Streaming实时流式大数据处理实战电子书 租阅

售       价:¥

纸质售价:¥47.60购买纸书

245人正在读 | 0人评论 6.2

作       者:肖力涛

出  版  社:机械工业出版社

出版时间:2019-04-01

字       数:24.6万

所属分类: 科技 > 计算机/网络 > 程序设计

温馨提示:此类商品不支持退换货,不支持下载打印

为你推荐

  • 读书简介
  • 目录
  • 累计评论(0条)
  • 读书简介
  • 目录
  • 累计评论(0条)
本书以透彻的原理分析和充实的实例代码详解,全面阐述了Spark Streaming流式处理平台的相关知识,能够让读者快速掌握如何搭建Spark平台,然后在此基础上学习流式处理框架,并动手实践进行Spark Streaming流式应用的开发,包括与主流平台框架的对接应用,以及项目实战中的一些开发和调优策略等。本书共10章,分为3篇。第1篇为Spark基础,主要阐述了Spark的基本原理、平台搭建及实例应用;第2篇为Spark Streaming详解,阐述了Spark Streaming的基本原理,并重点介绍了Spark Streaming与Kafka、ZooKeeper、MySQL、HBase和Redis的配合使用、相关调优策略及实际应用;第3篇为Spark Streaming案例实战,主要介绍了实时词频统计处理、用户行为统计和监控报警系统3个实战案例,帮助读者进行实战演练,提升读者的实际项目开发水平。另外,本书附录还对Scala语言基础做了简要讲解。本书内容理论结合实战,特别适合大数据技术爱好者及相关从业人员阅读,也可作为他们的常备工具书使用。另外,本书也适合作为大数据培训机构及高校相关专业的教材使用。 本书以透彻的原理分析和充实的实例代码详解,全面阐述了Spark Streaming流式处理平台的相关知识,能够让读者快速掌握如何搭建Spark平台,然后在此基础上学习流式处理框架,并动手实践行Spark Streaming流式应用的发,包括与主流平台框架的对应用,以及项目实战中的一些发和调优策略等。 本书共10章,分为3篇。第1篇为Spark基础,主要阐述了Spark的基本原理、平台搭建及实例应用;第2篇为Spark Streaming详解,阐述了Spark Streaming的基本原理,并重介绍了Spark Streaming与Kafka、ZooKeeper、MySQL、HBase和Redis的配合使用、相关调优策略及实际应用;第3篇为Spark Streaming案例实战,主要介绍了实时词频统计处理、用户行为统计和监控报警系统3个实战案例,帮助读者行实战演练,提升读者的实际项目发水平。另外,本书附录还对Scala语言基础做了简要讲解。 本书内容理论结合实战,特别适合大数据技术爱好者及相关从业人员阅读,也可作为他们的常备工具书使用。另外,本书也适合作为大数据培训机构及高校相关专业的教材使用。
【推荐语】
前腾讯优图实验室及WeTest研究员/现拼多多资深算法工程师力作 腾讯WeTest总监等5位技术大咖力荐 快速搭建Spark平台,从0到1动手实践Spark Streaming流式大数据处理 对Spark及Spark Streaming所涉及的大数据平台做了重阐述 对涉及的知识详细阐述了基本原理,并给出了大量的应用实践 每个章节之后基本上都安排了典型实例,手把手带领读者动手演练 详细介绍了3个项目实战案例,帮助读者提高实际的项目发水平 给出了大量的真实工作经验总结,对相关从业者有较高的参考价值 业内5位大咖力荐: 腾讯WeTest总监  方亮 上海场鲸科技有限公司CTO/19年老程序员  张景龙 腾讯深海实验室创始人  辛愿 腾讯云人工智能产品负责人/博士  余祖坤 腾讯WeTest舆情算法负责人  刘绩刚 本书精华内容: Spark基础知识 Spark Streaming基础知识 动手搭建Spark集群 Spark编程模型 Spark Streaming编程模型 Spark Streaming结合ZooKeeper Spark Streaming结合Kafka Spark Streaming结合MySQL Spark Streaming结合HBase Spark Streaming结合Redis Spark Streaming调优实践 Scala语言基础精编 Scala语言基础精编 3个经典实战案例: 实时词频统计处理系统实战 用户行为统计实战 监测报警系统实战 赠送:完整的实例源代码(需要下载)
【作者】
肖力涛  浙江大学计算机硕士,前腾讯优图实验室及WeTest研究员,现拼多多资深算法工程师。长期行大数据处理、自然语言处理、深度学习、推荐算法的研究与实践,有丰富的项目经验。善于归纳和总结,所撰写的博客文章得到了大量读者的好评。擅长数据分析与处理、算法实践落地、用户行为数据挖掘、大规模数据处理等技术。运营《互联网技术猿》公众号。
目录展开

前言

第1篇 Spark基础

第1章 初识Spark

1.1 Spark由来

1.2 流式处理与Spark Streaming

1.3 本章小结

第2章 Spark运行与开发环境

2.1 Spark的下载与安装

2.2 Spark运行模式

2.3 搭建开发环境

2.4 实例——Spark文件词频统计

2.5 本章小结

第3章 Spark编程模型

3.1 RDD概述

3.2 RDD存储结构

3.3 RDD操作

3.4 RDD间的依赖方式

3.5 从RDD看集群调度

3.6 RDD持久化(Cachinng/Persistence)

3.7 共享变量

3.8 实例——Spark RDD操作

3.9 本章小结

第2篇 Spark Streaming详解

第4章 Spark Streaming编程模型及原理

4.1 DStream数据结构

4.2 DStream操作

4.3 Spark Streaming初始化及输入源

4.4 持久化、Checkpointing和共享变量

4.5 实例——Spark Streaming流式词频统计

4.6 本章小结

第5章 Spark Streaming与Kafka

5.1 ZooKeeper简介

5.2 Kafka简介

5.3 Spark Streaming接收Kafka数据

5.4 Spark Streaming向Kafka中写入数据

5.5 实例——Spark Streaming分析Kafka数据

5.6 本章小结

第6章 Spark Streaming与外部存储介质

6.1 将DStream输出到文件中

6.2 使用foreachRDD设计模式

6.3 将DStream输出到MySQL中

6.4 将DStream输出到HBase中

6.5 将DStream数据输出到Redis中

6.6 实例——日志分析

6.7 本章小结

第7章 Spark Streaming调优实践

7.1 数据序列化

7.2 广播大变量

7.3 数据处理和接收时的并行度

7.4 设置合理的批处理间隔

7.5 内存优化

7.6 实例——项目实战中的调优示例

7.7 本章小结

第3篇 Spark Streaming案例实战

第8章 实时词频统计处理系统实战

8.1 背景与设计

8.2 代码实现

8.3 环境配置与运行

8.4 本章小结

第9章 用户行为统计实战

9.1 背景与设计

9.2 代码实现

9.3 环境配置与运行

9.4 本章小结

第10章 监控报警系统实战

10.1 背景与设计

10.2 代码实现

10.3 环境配置与查看

10.4 本章小结

附录A Scala语言基础

A.1 安装及环境配置

A.2 Scala语法独特性

A.3 Scala集合

A.4 其他常用特性

累计评论(0条) 0个书友正在讨论这本书 发表评论

发表评论

发表评论,分享你的想法吧!

买过这本书的人还买过

读了这本书的人还在读

回顶部