万本电子书0元读

万本电子书0元读

顶部广告

Doris实时数仓实战电子书

(1)作者背景资深:作者是有10余年工作经验的架构师和大数据专家,在MMP领域有丰富经验,是Apache Doris项目的贡献者。 (2)社区高度评价:Apache Doris PMC主席、3位Apache Doris PMC成员、Select DB创始人以及腾讯、小米、*的多位专家力荐。 (3)内容系统*:从基本操作、架构设计、进阶使用、运维管理、拓展应用、项目实战等多个维度*讲解Doris。 (4)图文并茂、案例丰富:书中包含大量图表,能帮助读者轻松阅读和理解;书中有大量和案例和2个综合案例,能让读者快速获得项目实战能力。

售       价:¥

纸质售价:¥69.30购买纸书

97人正在读 | 0人评论 6.7

作       者:王春波

出  版  社:机械工业出版社

出版时间:2023-04-28

字       数:17.0万

所属分类: 科技 > 计算机/网络 > 计算机理论与教程

温馨提示:数字商品不支持退换货,不提供源文件,不支持导出打印

为你推荐

  • 读书简介
  • 目录
  • 累计评论(0条)
  • 读书简介
  • 目录
  • 累计评论(0条)
这是一本讲解如何用当下流行的数据仓库技术Doris搭建实时数仓的著作。 前10章详细讲解了Doris的技术与实践,包括安装、部署、数据定义、模型详解、数据导、数据查询、查询优化、FlinkSQL、外部表、集群运维等; 第11-14章详细讲解了数据仓库的设计、OLAP的查询以及实时数仓的建设等。<br/>【作者】<br/>王春波 启高信息技术总监,专注于数据分析领域的发工作近十年,是商业银行管理会计、商务智能应用和数据仓库建模领域的专家级人物。曾经在银行业甲方和乙方从事过数据仓库、数据集市发超过七年时间,又加盟某上市公司大数据事业部,担任资深商务智能工程师。目前在创业型公司担任技术总监职务。 在工作之余,我运营了一个《数据中台研习社》的公众号,也会总结分享一些项目实践过程中遇到的问题。<br/>
目录展开

前折页

书名页

版权

推荐序一

推荐序二

前言

第一部分 基础

第1章 Doris概述

1.1 Doris的前世今生

1.1.1 Doris应需而生

1.1.2 Doris架构重组

1.1.3 Doris引擎升级

1.1.4 Doris拥抱开源

1.2 Doris的特点

1.2.1 极简架构

1.2.2 使用简单

1.2.3 功能丰富

1.2.4 开源开放

1.3 Doris核心设计

1.3.1 存储引擎

1.3.2 查询引擎

1.3.3 查询优化器

1.3.4 向量化执行引擎

1.4 Doris应用场景

1.5 Doris的竞争对手

1.5.1 Doris的“前浪”——Greenplum

1.5.2 Doris的“表哥”——Kylin

1.5.3 Doris的“知音”——ClickHouse

1.5.4 Doris的“伤痕”——StarRocks

第2章 Doris的安装与部署

2.1 集群规划和环境准备

2.1.1 环境要求

2.1.2 硬件要求

2.1.3 节点规划

2.1.4 通信端口

2.1.5 IP地址绑定

2.2 Doris源码编译

2.2.1 环境准备

2.2.2 通过Git下载Doris源码

2.2.3 拉取Docker编译环境

2.2.4 启动编译环境

2.2.5 进入Docker进行编译

2.2.6 编译Broker

2.3 安装和部署

2.3.1 安装前的准备

2.3.2 安装FE

2.3.3 安装BE

2.3.4 安装Broker

2.4 数据库访问和常用命令

2.4.1 访问Doris数据库

2.4.2 Doris常用命令

2.4.3 Doris用户管理

第3章 Doris数据对象

3.1 数据类型

3.1.1 数值类型

3.1.2 日期时间类型

3.1.3 字符串类型

3.1.4 其他扩展类型

3.2 OLAP表定义

3.2.1 列定义

3.2.2 键描述

3.2.3 分布描述

3.2.4 键值对

3.3 分区表定义

3.3.1 Range分区

3.3.2 List分区

3.4 外部表定义

3.4.1 MySQL表引擎

3.4.2 Broker表引擎

3.4.3 Hive表引擎

3.4.4 Iceberg表引擎

3.5 表的基本操作

3.5.1 修改表

3.5.2 删除表

3.5.3 清空表

3.6 视图

3.6.1 创建视图

3.6.2 修改视图

3.6.3 删除视图

3.7 函数

3.7.1 日期函数

3.7.2 正则匹配函数

3.7.3 BITMAP函数

3.7.4 JSON函数

3.7.5 表函数

3.7.6 窗口函数

第4章 Doris数据模型详解

4.1 数据模型及原理

4.1.1 Duplicate模型

4.1.2 Aggregate模型

4.1.3 Unique模型

4.2 数据模型实战

4.3 数据模型应用场景

4.4 表数据存储

4.5 分区与分桶

4.6 DDL语句执行过程

第二部分 进阶

第5章 数据导入实战

5.1 INSERT INTO

5.1.1 用法详解

5.1.2 应用举例

5.2 Stream Load

5.2.1 执行原理

5.2.2 用法详解

5.2.3 应用举例

5.3 Broker Load

5.3.1 执行原理

5.3.2 用法详解

5.3.3 应用举例

5.4 Routine Load

5.4.1 执行原理

5.4.2 用法详解

5.4.3 应用举例

5.5 Binlog Load

5.5.1 基本原理

5.5.2 用法详解

5.5.3 应用举例

5.6 DataX

5.6.1 DataX执行原理

5.6.2 DataX DorisWriter插件

5.6.3 应用举例

5.7 Spark Load

5.7.1 执行原理

5.7.2 用法详解

5.7.3 应用举例

第6章 Doris数据查询

6.1 简单查询

6.1.1 简单的SQL语法

6.1.2 WITH特性

6.1.3 IN语句和EXISTS语句

6.2 多表关联

6.2.1 JOIN操作类型

6.2.2 JOIN算法实现

6.2.3 分布式JOIN优化策略

6.3 开窗查询

6.4 BITMAP精准去重

6.5 HLL近似去重

6.6 GROUPING SETS多维组合

第7章 Doris查询优化

7.1 执行计划

7.2 查询优化器

7.3 索引

7.4 物化视图

7.5 ROLLUP

7.6 向量化查询引擎

7.7 查询优化总结

第三部分 拓展

第8章 Doris流数据

8.1 Flink简介

8.2 Flink基本概念

8.3 Flink SQL和Table API

8.4 Flink CDC技术

8.5 Flink Doris Connector

8.5.1 插件编译与安装

8.5.2 环境配置

8.5.3 单表增、删、改

8.5.4 多表关联

8.5.5 汇总数据

第9章 Doris外部表

9.1 ODBC外部表

9.2 Hive外部表

9.3 ES外部表

9.4 Iceberg外部表

第10章 Doris集群管理

10.1 集群管理

10.1.1 数据库管理

10.1.2 用户管理

10.1.3 权限管理

10.2 集群资源管理

10.2.1 节点资源划分

10.2.2 节点资源限制

10.3 集群备份和恢复

10.3.1 数据导出

10.3.2 数据备份

10.3.3 数据恢复

10.3.4 模式备份

10.4 集群高可用

10.4.1 Doris一键启动

10.4.2 Doris自启动

10.4.3 Doris升级版本

10.5 集群扩缩容

10.5.1 FE扩容

10.5.2 FE缩容

10.5.3 BE扩容

10.5.4 BE缩容

10.5.5 Broker扩缩容

10.6 删除恢复

第四部分 实战

第11章 数据仓库概述

11.1 数据仓库的起源

11.2 数据仓库的流行

11.3 数据仓库的分布式之路

11.4 MPP架构的崛起

11.5 数据仓库的未来

11.6 概念对比

11.6.1 数据仓库与数据库

11.6.2 数据仓库与大数据技术

11.6.3 数据仓库与数据中台

11.6.4 数据仓库与数据湖

第12章 数据仓库设计

12.1 数据仓库架构

12.1.1 Inmon的企业信息化工厂

12.1.2 Kimball的维度建模数据仓库

12.1.3 两种建模方式对比

12.2 数据仓库分层

12.2.1 操作数据存储层

12.2.2 数据仓库层

12.2.3 应用数据层

12.3 实时数据仓库的两条线路

12.4 实时数据仓库的新选择

第13章 基于Doris的OLAP查询和实时数据仓库实战

13.1 项目背景

13.2 项目需求

13.3 技术方案实现

13.3.1 基于DataX的接口数据抽取

13.3.2 基于Hive构建数据仓库

13.3.3 基于Doris构建数据集市

13.3.4 基于Flink SQL的实时数据流

13.3.5 代码发布和作业监控

13.4 业务方案实现

13.4.1 零售流水及本期、同期计算

13.4.2 有效店、同店及渠道分析

13.4.3 库存及齐码率分析

13.4.4 库销比及售罄率分析

13.5 项目总结

第14章 基于Doris的流批一体数据仓库实战

14.1 项目背景

14.2 项目需求

14.3 技术方案实现

14.3.1 批量数据同步

14.3.2 实时数据入库

14.3.3 数据仓库分层

14.3.4 全增量一体化数据加工

14.3.5 流批融合的实时大屏

14.3.6 调度任务

14.4 开发规范

14.4.1 数据对象命名规范

14.4.2 建表规范

14.4.3 字段命名规范

14.4.4 调度任务命名规范

14.5 项目交付成果

14.5.1 PC端报表

14.5.2 移动端报表

14.5.3 自助分析报表

14.6 项目总结

后折页

累计评论(0条) 0个书友正在讨论这本书 发表评论

发表评论

发表评论,分享你的想法吧!

买过这本书的人还买过

读了这本书的人还在读

回顶部