万本电子书0元读

万本电子书0元读

顶部广告

企业大数据处理:Spark、Druid、Flume与Kafka应用实践电子书

售       价:¥

纸质售价:¥40.70购买纸书

9人正在读 | 0人评论 6.8

作       者:肖冠宇

出  版  社:机械工业出版社

出版时间:2017-09-01

字       数:25.2万

所属分类: 科技 > 计算机/网络 > 计算机理论与教程

温馨提示:数字商品不支持退换货,不提供源文件,不支持导出打印

为你推荐

  • 读书简介
  • 目录
  • 累计评论(1条)
  • 读书简介
  • 目录
  • 累计评论(1条)
本书分为三大部分,共九章。第壹部分(第1章)主要介绍了企业大数据系统的前期准备工作,包括如何构建企业大数据处理系统的软件环境和集群环境。第二部分(第2~7章)首先介绍了Spark的基本原理,Spark2.0版本的SparkSQL、StructuredStreaming原理和使用方法,以及Spark的多种优化方式;然后,介绍了Druid的基本原理、集群的搭建过程、数据摄过程,以及在查询过程中如何实现Druid查询API;着介绍了日志收集系统Flume的基本架构和关键组件,以及分层日志收集架构的设计与实践;后介绍了分布式消息队列Kafka的基本架构和集群搭建过程,以及使用Java语言实现客户端API的详细过程。第三部分(第8~9章)主要介绍了企业大数据处理的两个实际应用案例,分别是基于Druid构建多维数据分析平台和基于JMX指标的监控系统。<br/>【作者】<br/>肖冠宇目前就职于乐视网智能中心大数据部,曾就职于人民在线大数据团队,主要行广告数据分析、大数据产品研发等工作,具有多年大数据产品研发、高性能分布式框架、实时计算等经验,对整个Hadoop生态系统的各项技术都非常了解,有丰富的实践经验。<br/>
目录展开

前言

第一部分 准备工作

第1章 基础环境准备

1.1 软件环境准备

1.2 集群环境准备

1.3 小结

第二部分 核心技术

第2章 Spark详解

2.1 Spark概述

2.2 Spark SQL

2.3 Structured Streaming

2.4 Spark优化

2.5 小结

第3章 Druid原理及部署

3.1 架构设计

3.2 集群部署

3.3 小结

第4章 Druid数据摄入

4.1 模式设计

4.2 批量数据摄入

4.3 流数据摄入

4.4 数据更新

4.5 小结

第5章 Druid客户端

5.1 涉及组件

5.2 查询类型

5.3 查询API

5.4 小结

第6章 日志收集

6.1 Flume介绍

6.2 Flume应用实践

6.3 小结

第7章 分布式消息队列

7.1 Kafka介绍

7.2 安装部署

7.3 客户端API

7.4 小结

第三部分 项目实践

第8章 数据平台

8.1 需求分析

8.2 功能实现

8.3 小结

第9章 监控系统

9.1 Inf luxDB

9.2 JMXTrans

9.3 Grafana

9.4 小结

累计评论(1条) 2个书友正在讨论这本书 发表评论

发表评论

发表评论,分享你的想法吧!

买过这本书的人还买过

读了这本书的人还在读

回顶部