当当云阅读 > 科技 > 计算机/网络 > 计算机理论与教程 > Kafka入门与实践

Kafka入门与实践电子书

Kafka*初是由LinkedIn公司发的消息系统，现在已成为Apache的源项目。早期版本的Kafka主要是作为一个分布式、可分区和具有副本的消息系统，随着版本的不断迭代，在0.10.x版本之后Kafka已成为一个分布式流数据处理平台，特别是Kafka Streams的出现，使得Kafka对流数据处理变得更加简单。 Kafka发展至今已具备很多特性，如分布式、高吞吐量、低延迟、高水平扩展性、高容错性等，也正是由于Kafka具备这些特性，使Kafka在大数据处理、日志收集、实时监控、离线统计分析等应用场景都被广泛使用。

售价：¥

纸质售价：¥65.60购买纸书

1020人正在读 | 3人评论

6.8

作者：牟大恩

出版社：人民邮电出版社

出版时间：2017-11-01

字数：39.8万

所属分类：科技 > 计算机/网络 > 计算机理论与教程

温馨提示：数字商品不支持退换货，不提供源文件，不支持导出打印

为你推荐

读书简介
目录
累计评论(3条)

读书简介
目录
累计评论(3条)

《Kafka门与实践》以Kafka 0.10.1.1版本以基础，对Kafka的基本组件的实现细节及其基本应用行了详细介绍，同时，通过对Kafka与当前大数据主流框架整合应用案例的讲解，一步展现了Kafka在实际业务中的作用和地位。本书共10章，按照从抽象到具体、从到线再到面的学习思维模式，由浅深，理论与实践相结合，对Kafka行了分析讲解。《Kafka门与实践》中的大量实例来源于作者在实际工作中的实践，具有现实指导意义。相信读者阅读完本书之后，能够全面掌握Kafka的基本实现原理及其基本操作，能够根据书中的案例举一反三，解决实际工作和学习中的问题。此外，在阅读本书时，读者可以根据本书对Kafka理论的分析，再结合Kafka源码行定位学习，了解Kafka的设计和思想以及更多的编码技巧。《Kafka门与实践》适合应用Kafka的专业技术人员阅读，包括但不限于大数据相关应用的发者、运维者和爱好者，也适合高等院校、培训结构相关专业的师生使用。 【推荐语】 Kafka*初是由LinkedIn公司发的消息系统，现在已成为Apache的源项目。早期版本的Kafka主要是作为一个分布式、可分区和具有副本的消息系统，随着版本的不断迭代，在0.10.x版本之后Kafka已成为一个分布式流数据处理平台，特别是Kafka Streams的出现，使得Kafka对流数据处理变得更加简单。 Kafka发展至今已具备很多特性，如分布式、高吞吐量、低延迟、高水平扩展性、高容错性等，也正是由于Kafka具备这些特性，使Kafka在大数据处理、日志收集、实时监控、离线统计分析等应用场景都被广泛使用。本书内容按照从抽象到具体、从到线再到面的学习思维模式行编排，由浅深、理论与实践相结合地对Kafka行了讲解和分析。剖析Kafka实现原理时，Kafka核心组件各成一节；讲解Kafka基本操作及应用实践时，从简单操作拓展到高级应用。全书的各章之间没有很强的依赖关系，读者可以从其中任何一章始阅读。本书虽适合作为门书籍，但其内容丰富又不失深度，既深剖析了Kafka核心原理，又侧重实际操作实战。阅读本书读者不仅可以掌握如何应用Kafka，更重要的是还可以了解Kafka性能优化和Kafka相关功能改造方面的方法和理论。本书是基于Kafka的0.10.1.1版本编写的。 【作者】 牟大恩，武汉大学硕士，曾先后在网易杭州研究院、掌门科技、优酷土豆集团担任高级发工程师和资深发工程师职务，目前就职于海通证券总部。有多年的Java发及系统设计经验，专注于互联网金融及大数据应用相关领域。

目录展开

内容提要

前言

为什么要写这本书

如何阅读本书

读者对象

参考资料

读者反馈

致谢

第1章 Kafka简介

1.1 Kafka背景

1.2 Kafka基本结构

1.3 Kafka基本概念

1.4 Kafka设计概述

1.4.1 Kafka设计动机

1.4.2 Kafka特性

1.4.3 Kafka应用场景

1.5 本书导读

1.6 小结

第2章 Kafka安装配置

2.1 基础环境配置

2.1.1 JDK安装配置

2.1.2 SSH安装配置

2.1.3 ZooKeeper环境

2.2 Kafka单机环境部署

2.2.1 Windows环境安装Kafka

2.2.2 Linux环境安装Kafka

2.3 Kafka伪分布式环境部署

2.4 Kafka集群环境部署

2.5 Kafka Manager安装

2.6 Kafka源码编译

2.6.1 Scala安装配置

2.6.2 Gradle安装配置

2.6.3 Kafka源码编译

2.6.4 Kafka导入Eclipse

2.7 小结

第3章 Kafka核心组件

3.1 延迟操作组件

3.1.1 DelayedOperation

3.1.2 DelayedOperationPurgatory

3.1.3 DelayedProduce

3.1.4 DelayedFetch

3.1.5 DelayedJoin

3.1.6 DelayedHeartbeat

3.1.7 DelayedCreateTopics

3.2 控制器

3.2.1 控制器初始化

3.2.2 控制器选举过程

3.2.3 故障转移

3.2.4 代理上线与下线

3.2.5 主题管理

3.2.6 分区管理

3.3 协调器

3.3.1 消费者协调器

3.3.2 组协调器

3.4 网络通信服务

3.4.1 Acceptor

3.4.2 Processor

3.4.3 RequestChannel

3.4.4 SocketServer启动过程

3.5 日志管理器

3.5.1 Kafka日志结构

3.5.2 日志管理器启动过程

3.5.3 日志加载及恢复

3.5.4 日志清理

3.6 副本管理器

3.6.1 分区

3.6.2 副本

3.6.3 副本管理器启动过程

3.6.4 副本过期检查

3.6.5 追加消息

3.6.6 拉取消息

3.6.7 副本同步过程

3.6.8 副本角色转换

3.6.9 关闭副本

3.7 Handler

3.8 动态配置管理器

3.9 代理健康检测

3.10 Kafka内部监控

3.11 小结

第4章 Kafka核心流程分析

4.1 KafkaServer启动流程分析

4.2 创建主题流程分析

4.2.1 客户端创建主题

4.2.2 分区副本分配

4.3 生产者

4.3.1 Eclipse运行生产者源码

4.3.2 生产者重要配置说明

4.3.3 OldProducer执行流程

4.3.4 KafkaProducer实现原理

4.4 消费者

4.4.1 旧版消费者

4.4.2 KafkaConsumer初始化

4.4.3 消费订阅

4.4.4 消费消息

4.4.5 消费偏移量提交

4.4.6 心跳探测

4.4.7 分区数与消费者线程的关系

4.4.8 消费者平衡过程

4.5 小结

第5章 Kafka基本操作实战

5.1 KafkaServer管理

5.1.1 启动Kafka单个节点

5.1.2 启动Kafka集群

5.1.3 关闭Kafka单个节点

5.1.4 关闭Kafka集群

5.2 主题管理

5.2.1 创建主题

5.2.2 删除主题

5.2.3 查看主题

5.2.4 修改主题

5.3 生产者基本操作

5.3.1 启动生产者

5.3.2 创建主题

5.3.3 查看消息

5.3.4 生产者性能测试工具

5.4 消费者基本操作

5.4.1 消费消息

5.4.2 单播与多播

5.4.3 查看消费偏移量

5.4.4 消费者性能测试工具

5.5 配置管理

5.5.1 主题级别配置

5.5.2 代理级别设置

5.5.3 客户端/用户级别配置

5.6 分区操作

5.6.1 分区Leader平衡

5.6.2 分区迁移

5.6.3 增加分区

5.6.4 增加副本

5.7 连接器基本操作

5.7.1 独立模式

5.7.2 REST风格API应用

5.7.3 分布式模式

5.8 Kafka Manager应用

5.9 Kafka安全机制

5.9.1 利用SASL/PLAIN进行身份认证

5.9.2 权限控制

5.10 镜像操作

5.11 小结

第6章 Kafka API编程实战

6.1 主题管理

6.1.1 创建主题

6.1.2 修改主题级别配置

6.1.3 增加分区

6.1.4 分区副本重分配

6.1.5 删除主题

6.2 生产者API应用

6.2.1 单线程生产者

6.2.2 多线程生产者

6.3 消费者API应用

6.3.1 旧版消费者API应用

6.3.2 新版消费者API应用

6.4 自定义组件实现

6.4.1 分区器

6.4.2 序列化与反序列化

6.5 Spring与Kafka整合应用

6.5.1 生产者

6.5.2 消费者

6.6 小结

第7章 Kafka Streams

7.1 Kafka Streams简介

7.2 Kafka Streams基本概念

7.2.1 流

7.2.2 流处理器

7.2.3 处理器拓扑

7.2.4 时间

7.2.5 状态

7.2.6 KStream和KTable

7.2.7 窗口

7.3 Kafka Streams API介绍

7.3.1 KStream与KTable

7.3.2 窗口操作

7.3.3 连接操作

7.3.4 变换操作

7.3.5 聚合操作

7.4 接口恶意访问自动检测

7.4.1 应用描述

7.4.2 具体实现

7.5 小结

第8章 Kafka数据采集应用

8.1 Log4j集成Kafka应用

8.1.1 应用描述

8.1.2 具体实现

8.2 Kafka与Flume整合应用

8.2.1 Flume简介

8.2.2 Flume与Kafka比较

8.2.3 Flume的安装配置

8.2.4 Flume采集日志写入Kafka

8.3 Kafka与Flume和HDFS整合应用

8.3.1 Hadoop安装配置

8.3.2 Flume采集Kafka消息写入HDFS

8.4 小结

第9章 Kafka与ELK整合应用

9.1 ELK环境搭建

9.1.1 Elasticsearch安装配置

9.1.2 Logstash安装配置

9.1.3 Kibana安装配置

9.2 Kafka与Logstash整合

9.2.1 Logstash收集日志到Kafka

9.2.2 Logstash从Kafka消费日志

9.3 日志采集分析系统

9.3.1 Flume采集日志配置

9.3.2 Logstash拉取日志配置

9.3.3 Kibana日志展示

9.4 服务器性能监控系统

9.4.1 Metricbeat安装

9.4.2 采集信息存储到Elasticsearch

9.4.3 加载beats-dashboards

9.4.4 服务器性能监控系统具体实现

9.5 小结

第10章 Kafka与Spark整合应用

10.1 Spark简介

10.2 Spark基本操作

10.2.1 Spark安装

10.2.2 Spark shell应用

10.2.3 spark-submit提交作业

10.3 Spark在智能投顾领域应用

10.3.1 应用描述

10.3.2 具体实现

10.4 热搜词统计

10.4.1 应用描述

10.4.2 具体实现

10.5 小结

累计评论(3条) 6个书友正在讨论这本书 发表评论

发表评论

发表评论，分享你的想法吧！

发表评论

买过这本书的人还买过

读了这本书的人还在读

支持设备

Excel大神是怎么做表的￥45.00

吉田拳

￥45.00

你好!Python ￥60.00

关东升

￥60.00

算法基础:打开算法之门(双色版) ￥47.00

(美)托马斯·H· 科尔曼(Thomas H· Cormen)

￥47.00

架构师启示录:知识模型、落地方法与思维模式￥47.00

灵犀

￥47.00

巧用ChatGPT进行数据分析与挖掘￥59.00

谢佳标

￥59.00

精通API架构:设计、运维与演进￥59.00

(英)詹姆斯·高夫;(英)丹尼尔·布莱恩特;(英)马修·奥本

￥59.00

速学Linux:系统应用从入门到精通￥60.00

良许

￥60.00

Excel财务数据分析与可视化￥55.30

羊依军陆群

￥55.30

Go底层原理与工程化实践￥59.00

李乐;陈雷

￥59.00

大模型RAG实战:RAG原理、应用与系统构建￥59.00

汪鹏;谷清水;卞龙鹏

￥59.00

更多同类图书 >

Kafka入门与实践电子书

支持设备

Excel大神是怎么做表的 ￥45.00

你好!Python ￥60.00

算法基础:打开算法之门(双色版) ￥47.00

架构师启示录:知识模型、落地方法与思维模式 ￥47.00

巧用ChatGPT进行数据分析与挖掘 ￥59.00

精通API架构:设计、运维与演进 ￥59.00

速学Linux:系统应用从入门到精通 ￥60.00

Excel财务数据分析与可视化 ￥55.30

Go底层原理与工程化实践 ￥59.00

大模型RAG实战:RAG原理、应用与系统构建 ￥59.00

当当云阅读

Excel大神是怎么做表的￥45.00

架构师启示录:知识模型、落地方法与思维模式￥47.00

巧用ChatGPT进行数据分析与挖掘￥59.00

精通API架构:设计、运维与演进￥59.00

速学Linux:系统应用从入门到精通￥60.00

Excel财务数据分析与可视化￥55.30

Go底层原理与工程化实践￥59.00

大模型RAG实战:RAG原理、应用与系统构建￥59.00