万本电子书0元读

万本电子书0元读

顶部广告

基于ApacheKylin构建大数据分析平台电子书

   Kyligence 联合创始人兼CEO,Apache Kylin项目管理委员会主席(PMC Chair)韩卿 武汉市云升科技发展有限公司董事长,《智慧城市—大数据、物联网和云计算之应用》作者杨正洪 万达网络科技集团大数据中心副总经理,《Spark高级数据分析》中文版译者龚少成   数据架构师,IT脱口秀(清风那个吹)创始人,《开源大数据分析引擎Impala实战》作者贾传青 等等业内专家联合推荐

售       价:¥

纸质售价:¥51.70购买纸书

101人正在读 | 32人评论 6.2

作       者:蒋守壮,夏毓彦

出  版  社:清华大学出版社

出版时间:2017-01-01

字       数:17.0万

所属分类: 科技 > 计算机/网络 > 计算机理论与教程

温馨提示:数字商品不支持退换货,不提供源文件,不支持导出打印

为你推荐

  • 读书简介
  • 目录
  • 累计评论(3条)
  • 读书简介
  • 目录
  • 累计评论(3条)
Apache Kylin是一个源的分布式分析引擎,提供Hadoop之上的SQL查询口及多维分析(OLAP)能力以支持超大规模数据,*初由eBay公司发并贡献至源社区。它能在亚秒内查询巨大的Hive表。 本书分为21章,详细讲解Apache Kylin概念、安装、配置、部署,让读者对Apache Kylin构建大数据分析平台有一个感性认识。同时,本书从应用角度,结合Dome和实例介绍了用于多维分析的Cube算法的创建、配置与优化。*后还介绍了Kyligence公司发布KAP大数据分析平台,对读者有极大的参考价值。 本书适合大数据技术初学者、大数据分析人员、大数据架构师等,也适合用于高等院校和培训学校相关专业师生教学参考。<br/>【推荐语】<br/>   Kyligence 联合创始人兼CEO,Apache Kylin项目管理委员会主席(PMC Chair)韩卿 武汉市云升科技发展有限公司董事长,《智慧城市—大数据、物联网和云计算之应用》作者杨正洪 万达网络科技集团大数据中心副总经理,《Spark高级数据分析》中文版译者龚少成   数据架构师,IT脱口秀(清风那个吹)创始人,《源大数据分析引擎Impala实战》作者贾传青 等等业内专家联合推荐         Apache Kylin将传统的数据仓库及商务智能分析能力带到了大数据时代,作为新兴的技术已经被广大用户所使用。作为创始作者,我非常欣喜能看到关于Apache Kylin相关书籍的出版, 这无疑对中国用户更好地使用Kylin,解决实际的大数据分析架构及业务问题有很大帮助。 韩卿 Kyligence 联合创始人兼CEO,Apache Kylin项目管理委员会主席(PMC Chair)   伴随着大数据发展的三条主线是大数据技术、大数据思维和大数据实践。因为RDBMS很难处理单表10亿行数据,所以大数据技术应需而生。大数据技术从*初的解决海量数据的快速存储和读取,到今天的海量数据的OLAP,当中衍生出众多的技术产品,Apache Kylin就是其中的一个优秀产品,目标是解决大数据范畴中的OLAP。 第二条主线是大数据思维。数据处理的*近几十年都被RDBMS的思想所束缚,小表、多表、表的连、过分注重冗余性的坏处,等等,这些都限制了海量数据上的处理与分析。大数据技术出来之后,随着而来的大数据思维,给我们带来了海量数据处理的新思维。这个新思维的核心就是突破表的概念,而采用面向对象的数据模型在数据层上实现。Apache Kylin的Cube模型就是在逐步体现大数据的思维。 *后一条主线是大数据实践。大数据实践分为数据梳理、数据建模、数据采集、数据管控、数据服务、数据可视化和数据分析。这是一环套一环的步骤,不能跳过。Apache Kylin作为数据分析环节的技术产品,一定要同数据管理的《基于Apache Kylin构建大数据分析平台》一书浅显易懂,实操性强,是目前Apache Kylin界不可多得的技术资料,值得细读和研究。   杨正洪 武汉市云升科技发展有限公司董事长           Apache Kylin是基于MOLAP的实时大数据引擎,与Hadoop生态系统结合更加紧密,先天的优势注定了其支持更大的数据规模,更好的扩展性,独有的中国血统较其他源软件更具本地化优势,更符合中国国情。本书包含了守壮多年的实践经验 ,系统全面的介绍了Apache Kylin技术,值得推荐。   贾传青 数据架构师,IT脱口秀(清風那个吹)创始人                <br/>【作者】<br/>蒋守壮,现就职于万达网络科技集团有限公司,资深大数据工程师,大数据实践者。曾任平安科技资深大数据分析师和架构师,CSDN社区专家,知识库特邀编辑。目前专注于Docker、Kubernetes、Mesos、Hadoop、Spark和Kylin等技术领域。<br/>
目录展开

内容简介

推荐序

前言

致谢

第一部分 Apache Kylin基础部分

第1章 Apache Kylin前世今生

1.1 Apache Kylin的背景

1.2 Apache Kylin的应用场景

1.3 Apache Kylin的发展历程

第2章 Apache Kylin前奏

2.1 事实表和维表

2.2 星型模型和雪花型模型

2.3 OLAP

2.4 数据立方体(Data Cube)

第3章 Apache Kylin工作原理和体系架构

3.1 Kylin工作原理

3.2 Kylin体系架构

3.3 Kylin中的核心部分:Cube构建

3.4 Kylin的SQL查询

3.5 Kylin的特性和生态圈

第4章 搭建CDH大数据平台

4.1 系统环境和安装包

4.2 准备工作:系统环境搭建

4.3 正式安装CDH:准备工作

4.4 正式安装CDH5:安装配置

第5章 使用Kylin构建企业大数据分析平台的4种部署方式

5.1 Kylin部署的架构

5.2 Kylin的四种典型部署方式

第6章 单独为Kylin部署HBase集群

第7章 部署Kylin集群环境

7.1 部署Kylin的先决条件

7.2 部署Kylin集群环境

7.3 为Kylin集群搭建负载均衡器

第二部分 Apache Kylin进阶部分

第8章 Demo案例实战

8.1 Sample Cube案例描述

8.2 Sample Cube案例实战

第9章 多维分析的Cube创建实战

9.1 Cube模型

9.2 创建Cube的流程

第10章 Build Cube的来龙去脉

10.1 流程分析

10.2 小结

第三部分 Apache Kylin高级部分

第11章 Cube优化

第12章 备份Kylin的Metadata

12.1 Kylin的元数据

12.2 备份元数据

12.3 恢复元数据

第13章 使用Hive视图

13.1 使用Hive视图

13.2 使用视图实战

第14章 Kylin的垃圾清理

14.1 清理元数据

14.2 清理存储器数据

第15章 JDBC访问方式

第16章 通过RESTful访问Kylin

第17章 Kylin版本之间升级

17.1 从1.5.2升级到最新版本1.5.3

17.2 从1.5.1升级到1.5.2版本

17.3 从Kylin 1.5.2.1升级到Kylin 1.5.3实战

17.4 补充内容

第18章 大数据可视化实践

18.1 可视化工具简述

18.2 安装Kylin ODBC驱动

18.3 通过Excel访问Kylin

18.4 通过Power BI访问Kylin

18.5 通过Tableau访问Kylin

18.6 Kylin + Mondrian + Saiku

18.7 实战演练:通过Saiku访问Kylin

18.8 通过Apache Zepplin访问Kylin

18.9 通过Kylin的“Insight”查询

第19章 使用Streaming Table构建准实时Cube

第20章 快速数据立方算法

20.1 快速数据立方算法概述

20.2 快速数据立方算法优点和缺点

20.3 获取Fast Cubing算法的优势

第四部分 Apache Kylin的扩展部分

第21章 大数据智能分析平台KAP

21.1 大数据智能分析平台KAP概述

21.2 KAP的安装部署

累计评论(3条) 3个书友正在讨论这本书 发表评论

发表评论

发表评论,分享你的想法吧!

买过这本书的人还买过

读了这本书的人还在读

回顶部