万本电子书0元读

万本电子书0元读

顶部广告

Flink SQL与DataStream:入门、进阶与实战电子书

(1)作者背景资深:某头部短视频平台Flink专家,拥有多年流式计算发、优化、保障和治理经验,对Flink大数据计算引擎有着深的理解。 (2)作者经验丰富:有从0到1使用Flink SQL建设实时数仓的经验,在Flink场景化应用方面有丰富的经验,能够使用Flink等技术组件解决千万级别QPS的实时数据场景下的痛问题。 (3)双重视角展:从Flink使用和定制发双重视角,循序渐讲解Flink的分布式系统架构设计、流计算API设计、时间处理、状态管理等核心技术的原理和实现。

售       价:¥

纸质售价:¥90.30购买纸书

31人正在读 | 0人评论 6.6

作       者:羊艺超

出  版  社:机械工业出版社

出版时间:2023-12-07

字       数:37.8万

所属分类: 科技 > 计算机/网络 > 计算机理论与教程

温馨提示:数字商品不支持退换货,不提供源文件,不支持导出打印

为你推荐

  • 读书简介
  • 目录
  • 累计评论(0条)
  • 读书简介
  • 目录
  • 累计评论(0条)
内容简介 这是一本从使用和定制发双重视角,循序渐地讲解Flink的分布式系统架构设计、流计算API设计、时间处理、状态管理等核心技术的原理和实现的著作。 它面向Flink的初学者,内容沿着基础知识、实际问题和解决方案这条主线展,不仅层层剖析了Flink学习中的重和难,而且还通过大量案例展示了如何快速获得工程化实践能力。 全书共11章,主要内容如下: (1)Flink基础知识(第1、2章) 主要介绍了Flink的定位、核心特性、API分类,演示了如何搭建Flink作业的基础环境、如何创建一个Flink项目以及如何发门应用程序WordCount,并结合该应用程序说明了常见Flink作业的骨架结构。 (2)Flink分布式架构及核心概念(第3章) 主要内容包括Flink作业的运行时架构、部署模式、资源提供框架,以及发 Flink作业时涉及的核心概念,对于后续学习Flink DataStream API和Flink SQL API很有帮助。 (3)Flink DataStream API(第4~6章) 讲解了Flink DataStream API的核心知识,包括执行环境、数据源、数据简单转换、数据分组与聚合、数据汇等,并讲解了Flink DataStream API中的时间语义、时间窗口、有状态计算和检查这四大“王*牌武器”的由来与实现原理。 (4)Flink有状态流处理API(第7章) Flink DataStream API不能优雅地解决窗口使用不灵活和分流成本高这两个问题,于是Flink提供了有状态流处理API。本章主要讲解了Flink有状态流处理API解决上述两个问题的方法。 (5)Flink Table API与SQL API(第8~11章) Flink Table API和Flink SQL API的底层原理相同,可以相互转换,但Flink SQL API更为简单和常用。这4章分别介绍了Flink Table API、Flink SQL API 的功能,以及使用SQL实现流处理的核心技术,结合大量代码示例着重介绍了Flink SQL API的语法、函数、参数配置及性能优化方法。<br/>【推荐语】<br/>(1)作者背景资深:某头部短视频平台Flink专家,拥有多年流式计算发、优化、保障和治理经验,对Flink大数据计算引擎有着深的理解。 (2)作者经验丰富:有从0到1使用Flink SQL建设实时数仓的经验,在Flink场景化应用方面有丰富的经验,能够使用Flink等技术组件解决千万级别QPS的实时数据场景下的痛问题。 (3)双重视角展:从Flink使用和定制发双重视角,循序渐讲解Flink的分布式系统架构设计、流计算API设计、时间处理、状态管理等核心技术的原理和实现。 (4)理论深详细:除了Flink的架构设计和核心技术的原理外,本书还详细讲解了SQL API、Table API、DataStream API 和有状态流处理 API四大API的细节。 (5)注重工程实战:用大量案例和图表详解用Java和Flink SQL发Flink流处理作业的方法和过程,掌握工程化实践能力。<br/>【作者】<br/>羊艺超 资深大数据发工程师,现就职于某头部短视频公司。拥有多年流式计算发、优化、保障和治理经验,以及从0到1使用Flink SQL建设实时数仓的经验。对Flink大数据计算引擎有着深的理解,在Flink的场景化应用方面有丰富的经验,能够使用Flink等技术组件解决千万级别QPS的实时数据场景下的痛问题。源了自己的 Flink 学习项目 https://github.com/yangyichao-mango/flink-study。对Redis、Kafka、ClickHouse等实时数仓构建过程中依赖的引擎都较为熟悉。个人微信公众号:大数据羊说。发表了数十篇关于实时数仓建设的原创文章,深受读者喜爱。<br/>
目录展开

Preface 前言

第1章 初识Flink

1.1 Flink定位

1.2 Flink的核心特性

1.3 Flink的API

1.4 与Flink搭配使用的引擎

1.5 本章小结

第2章 Flink WordCount作业开发及运行

2.1 基础环境准备

2.2 创建一个Flink项目

2.3 Flink WordCount代码案例

2.4 Flink作业的骨架结构

2.5 本章小结

第3章 Flink分布式架构及核心概念

3.1 分布式应用与非分布式应用的异同

3.2 Flink作业的运行时架构

3.3 Flink作业的3种部署模式

3.4 Flink作业的2种资源提供框架

3.5 开发Flink作业时涉及的核心概念

3.6 Flink Web UI

3.7 本章小结

第4章 Flink DataStream API

4.1 什么是DataStream

4.2 执行环境

4.3 数据源

4.4 数据简单转换

4.5 数据分组与聚合

4.6 数据汇

4.7 算子间数据传输的8种策略

4.8 数据异步I/O处理

4.9 RichFunction

4.10 数据序列化

4.11 工具类及Debug建议

4.12 本章小结

第5章 Flink的时间语义和时间窗口

5.1 时间语义和时间窗口概述

5.2 时间窗口

5.3 时间语义

5.4 Watermark

5.5 双流数据时间窗口关联

5.6 计数窗口

5.7 生产中的常见问题及解决方案

5.8 本章小结

第6章 Flink状态原理及异常容错机制

6.1 Flink有状态计算

6.2 Flink状态接口

6.3 Flink状态管理

6.4 Flink状态后端

6.5 Flink故障重启策略

6.6 本章小结

第7章 Flink有状态流处理API

7.1 ProcessFunction

7.2 5种不同应用场景下的处理函数

7.3 KeyedProcessFunction

7.4 本章小结

第8章 Flink Table API和SQL API

8.1 直接上手Table API和SQL API

8.2 Table API和SQL API的核心API及功能

8.3 使用SQL实现流处理的核心技术

8.4 本章小结

第9章 Flink SQL API语法

9.1 SQL数据类型

9.2 CREATE TABLE

9.3 WITH

9.4 SELECT和WHERE

9.5 SELECT DISTINCT

9.6 时间窗口聚合

9.7 GROUP BY分组聚合

9.8 流关联

9.9 维表关联

9.10 TopN排序

9.11 Deduplication去重

9.12 窗口TopN

9.13 Over聚合

9.14 其他操作

9.15 EXPLAIN

9.16 SQL Hints

9.17 本章小结

第10章 Flink SQL API函数

10.1 函数的使用案例

10.2 函数的分类

10.3 开发用户自定义函数

10.4 本章小结

第11章 Flink SQL API参数配置及性能调优

11.1 参数配置

11.2 性能调优

11.3 本章小结

累计评论(0条) 0个书友正在讨论这本书 发表评论

发表评论

发表评论,分享你的想法吧!

买过这本书的人还买过

读了这本书的人还在读

回顶部