万本电子书0元读

万本电子书0元读

顶部广告

Airflow实战电子书

1.掌握Airflow,启高效工作流新时代!揭示Airflow的奥秘,让您轻松搭建和管理高效的工作流,实现业务目标! 2.走Airflow的世界,掌握源调度系统的核心!资深专家倾力造,深浅出地讲解Airflow的安装、部署、核心概念和架构组件,助您成为Airflow领域的佼佼者! 3.实战经验,让您轻松驾驭Airflow!丰富的实践经验和技巧,助您在生产环境中游刃有余地使用Airflow,优化集群性能,排查问题,轻松应对各种挑战!

售       价:¥

纸质售价:¥63.00购买纸书

10人正在读 | 0人评论 6.6

作       者:朱鹏程 著

出  版  社:人民邮电出版社有限公司

出版时间:2023-12-01

字       数:18.7万

所属分类: 科技 > 计算机/网络 > 程序设计

温馨提示:数字商品不支持退换货,不提供源文件,不支持导出打印

为你推荐

  • 读书简介
  • 目录
  • 累计评论(0条)
  • 读书简介
  • 目录
  • 累计评论(0条)
本书由浅深地介绍了如何快速搭建Airflow集群,包括不同操作系统的快速搭建方法、Airflow的安装方法、Airflow集群的部署方法、Airflow中的核心概念和其他重要概念、Airflow的架构和组件、Airflow的系统管理、实践经验以及其他常见的调度系统。附录提供了Docker和Kubernetes的简介。此外,本书还提供了在生产环境中使用Airflow的诸多实践与经验,无论是对研发工程师创建工作流、排查工作流问题,还是对运维工程师维护集群运转、优化集群性能,都有极其重要的借鉴价值。 本书图文并茂,理论翔实,示例丰富,适合正在使用或者即将使用Airflow作为调度系统的研发工程师、Airflow平台的运维工程师以及对Airflow感兴趣的读者阅读。<br/>【推荐语】<br/>1.掌握Airflow,启高效工作流新时代!揭示Airflow的奥秘,让您轻松搭建和管理高效的工作流,实现业务目标! 2.走Airflow的世界,掌握源调度系统的核心!资深专家倾力造,深浅出地讲解Airflow的安装、部署、核心概念和架构组件,助您成为Airflow领域的佼佼者! 3.实战经验,让您轻松驾驭Airflow!丰富的实践经验和技巧,助您在生产环境中游刃有余地使用Airflow,优化集群性能,排查问题,轻松应对各种挑战!<br/>【作者】<br/>朱鹏程,本科毕业于复旦大学软件工程系,现于亿贝软件工程(上海)有限公司担任高级软件工程师,负责Hadoop平台的支持和维护,同时负责源调度系统Airflow在全公司的推广和落地。精通Java语言,对HBase、Elasticsearch、Airflow等项目有深了解。<br/>
目录展开

内容提要

前言

资源与支持

第1章 快速搭建Airflow集群

1.1 准备工作

1.1.1 安装kubectl

1.1.2 安装Docker和kind

1.1.3 安装Helm

1.2 创建Kubernetes集群

1.3 使用Helm部署Airflow集群

1.4 运行示例

1.5 本章小结

第2章 安装Airflow

2.1 在非容器化环境中基于PyPI安装Airflow

2.1.1 准备工作

2.1.2 安装Airflow

2.1.3 升级Airflow

2.2 在容器化环境中扩展Airflow官方的镜像

2.3 本章小结

第3章 部署Airflow集群

3.1 在非容器化生产环境中部署Airflow

3.1.1 基于Celery Executor的部署

3.1.2 基于Dask Executor的部署

3.2 在容器化生产环境中部署Airflow

3.2.1 基于Celery Executor的部署

3.2.2 基于Kubernetes Executor的部署

3.2.3 基于CeleryKubernetes Executor的部署

3.3 本章小结

第4章 DAG相关概念

4.1 DAG简介

4.1.1 构造DAG

4.1.2 加载DAG

4.1.3 运行DAG

4.2 Task

4.2.1 Task的类型

4.2.2 TaskGroup

4.2.3 Task的超时处理

4.3 DAG Run和Task Instance

4.4 本章小结

第5章 其他概念

5.1 XCom

5.1.1 XCom的使用场景

5.1.2 如何使用XCom

5.2 Variable

5.2.1 通过Webserver UI配置Variable

5.2.2 通过环境变量配置Variable

5.2.3 通过其他方式配置Variable

5.3 Connection和Hook

5.3.1 基本概念

5.3.2 Connection的配置

5.3.3 Connection和Hook的使用

5.3.4 SSHHook源代码分析

5.4 Pool

5.4.1 Pool的设置

5.4.2 Pool的使用

5.5 Priority Weight

5.6 Cluster Policy

5.6.1 Cluster Policy的使用场景和类型

5.6.2 具体示例

5.7 Deferrable Operator和Trigger

5.7.1 使用Deferrable Operator和Trigger

5.7.2 从源代码分析Deferrable Operator和Trigger

5.8 本章小结

第6章 架构和组件

6.1 架构

6.2 Scheduler

6.2.1 解析DAG文件

6.2.2 调度DAG和Task

6.2.3 运行Task Instance

6.3 Webserver

6.3.1 UI

6.3.2 REST API

6.4 Triggerer

6.5 本章小结

第7章 系统管理

7.1 配置

7.1.1 如何管理配置

7.1.2 特殊的配置

7.1.3 配置的优先级

7.2 安全

7.2.1 访问控制

7.2.2 API认证

7.2.3 Webserver UI安全

7.2.4 数据安全

7.3 日志和监控

7.3.1 日志和监控的架构

7.3.2 日志

7.3.3 监控

7.4 插件

7.4.1 插件的安装和加载

7.4.2 如何实现插件

7.5 模块管理

7.5.1 如何添加Python模块

7.5.2 如何排查问题

7.6 CLI

7.6.1 全部命令

7.6.2 自动补齐

7.7 时区

7.7.1 datetime对象与时区

7.7.2 Airflow是如何处理时区的

7.7.3 Webserver UI的时区显示

7.8 本章小结

第8章 Airflow集群实践

8.1 Executor调优

8.1.1 Celery Executor 调优

8.1.2 Kubernetes Executor调优

8.1.3 Dask Executor调优

8.2 高可用

8.2.1 高可用的Scheduler

8.2.2 高可用的Webserver

8.2.3 高可用的Triggerer

8.3 鲁棒的数据库访问

8.3.1 PostgreSQL优化

8.3.2 MySQL优化

8.3.3 数据库通用优化

8.4 简化DAG文件发布和解析

8.4.1 简化DAG文件发布

8.4.2 通过配置控制DAG文件解析的行为

8.5 用插件扩展集群的能力

8.5.1 编写插件

8.5.2 安装插件

8.5.3 测试插件

8.6 加强REST API的能力

8.7 其他

8.7.1 让集群更安全

8.7.2 监控必不可少

8.7.3 为DAG和Task添加说明文档

8.7.4 配置邮件通知

8.7.5 控制调度的并发度

8.8 本章小结

第9章 Airflow的新功能

9.1 Airflow 2.3版本的新功能

9.1.1 动态Task映射

9.1.2 网格视图

9.1.3 其他功能

9.2 Airflow 2.4版本的新功能

9.2.1 数据感知调度

9.2.2 其他功能

9.3 Airflow 2.5版本的新功能

9.4 本章小结

第10章 其他调度系统

10.1 DolphinScheduler

10.1.1 DolphinScheduler的架构

10.1.2 DolphinScheduler的特点和优势

10.1.3 DolphinScheduler与Airflow的对比

10.2 AWS Step Functions

10.2.1 AWS Step Functions的特点和优势

10.2.2 AWS Step Functions与Airflow的对比

10.3 Google Workflows

10.3.1 Google Workflows的特点和优势

10.3.2 Google Workflows与Airflow的对比

10.4 Azkaban

10.4.1 Azkaban的特点和优势

10.4.2 Azkaban与Airflow的对比

10.5 Kubeflow

10.5.1 Kubeflow的特点和优势

10.5.2 Kubeflow与Airflow的对比

10.6 本章小结

附录A Docker简介

A.1 什么是Docker

A.1.1 Docker的定义

A.1.2 Docker的前世今生

A.2 Docker的核心概念

A.2.1 Docker引擎

A.2.2 Docker镜像

A.2.3 Docker容器

A.2.4 Docker仓库

A.2.5 Docker网络

A.2.6 Docker存储

A.3 Docker的优点

A.3.1 更高的可移植性

A.3.2 更快的部署和启动时间

A.3.3 更好的资源利用率

A.3.4 更简单的维护和更新操作

A.4 Docker的局限性

A.4.1 对于某些应用程序不适用

A.4.2 安全性不够

A.4.3 性能问题

A.5 Docker的应用

A.5.1 应用程序的开发、测试和部署

A.5.2 微服务架构的实现

A.5.3 多云部署的实现

A.5.4 安全性的提高

A.6 Docker的未来发展

A.6.1 Docker在容器编排方面的竞争

A.6.2 Docker与云计算的结合

A.6.3 Docker与大数据的结合

A.6.4 Docker与人工智能的结合

附录B Kubernetes简介

B.1 什么是Kubernetes

B.1.1 Kubernetes的定义

B.1.2 Kubernetes的起源和发展历程

B.1.3 Kubernetes的特性

B.2 Kubernetes的重要概念

B.2.1 Cluster

B.2.2 Master

B.2.3 Node

B.2.4 Pod

B.2.5 Controller

B.2.6 Namespace

B.2.7 Service

B.2.8 Ingress

B.2.9 PersistentVolume和PersistentVolumeClaim

B.2.10 ConfigMap

B.2.11 Secret

B.2.12 Label和Selector

B.3 Kubernetes的生态系统

B.3.1 Kubernetes的插件和扩展

B.3.2 Kubernetes的社区

B.3.3 Kubernetes与云原生生态系统

B.4 Kubernetes的未来展望

B.4.1 Kubernetes的发展趋势和未来方向

B.4.2 Kubernetes的应用前景

累计评论(0条) 0个书友正在讨论这本书 发表评论

发表评论

发表评论,分享你的想法吧!

买过这本书的人还买过

读了这本书的人还在读

回顶部