万本电子书0元读

万本电子书0元读

顶部广告

深入理解Doris:原理与应用电子书

这是Doris社区PPMC官方出品,SelectDB资深技术专家和Doris核心发者执笔,权威性毋庸置疑。本书得到了Apache Doris 创始人及来自多家大厂的行业领袖联合推荐。书中凝结了Doris数百位发者的经验和智慧,结合数千名Doris用户真实使用经历系统解读Doris的原理和发实战。

售       价:¥

纸质售价:¥103.20购买纸书

2人正在读 | 0人评论 6.6

作       者:王磊,陈明雨

出  版  社:机械工业出版社

出版时间:2026-01-04

字       数:29.0万

所属分类: 科技 > 计算机/网络 > 计算机理论与教程

温馨提示:数字商品不支持退换货,不提供源文件,不支持导出打印

为你推荐

  • 读书简介
  • 目录
  • 累计评论(条)
  • 读书简介
  • 目录
  • 累计评论(条)
这是一本由Doris社区官方出品的Doris权威指南。本书基于Doris 2.1版本撰写,由Apache Doris PMC Chair和SelectDB高级解决方案架构师联合撰写。书中不仅深入剖析了Doris的核心原理,还基于实际用户的需求对实战进行*指导。可以说,本书是一本融合了Doris社区数百位开发者和数千名使用者的智慧和使用经验的经典之作。 本书共11章。 第1~3章:面向Doris的初级使用者,对快速入门Doris知识、Doris表结构设计和使用、Doris数据操作等基础内容进行*分享。读者基于此可以快速把Doris用起来。 第4~9章:从原理和应用两个层面对Doris存储引擎、Doris查询引擎、Doris 倒排索引、Doris高并发点查、Doris数据湖、生态组件进行深度剖析,带领用户深入理解Doris原理和使用。 第10章:重点介绍Doris运维管理相关内容。 第11章:介绍如何基于Doris构建实时数据仓库,这部分不仅介绍了具体的构建方法,还给出了基于Doris构建数据仓库的实践。
目录展开

前折页

书名页

版权

推荐序一 走向现代化数据仓库

推荐序二 新一代高性能分析型数据库的崛起

前言

第1章 Doris快速入门

1.1 什么是Doris

1.1.1 Doris的发展历史

1.1.2 Doris的架构设计简介

1.1.3 Doris的特点

1.1.4 Doris的主要应用场景

1.2 Doris的安装部署

1.2.1 操作系统要求

1.2.2 单节点部署

1.2.3 高可用集群部署

1.2.4 集群端口说明

1.3 Doris使用入门

1.3.1 数据模型简介

1.3.2 明细模型实战

1.3.3 主键模型实战

1.3.4 统计模型实战

1.3.5 Stream Load数据导入

1.3.6 数据变更操作

1.3.7 倒排索引使用入门

第2章 Doris表结构的设计和使用

2.1 Doris的数据模型

2.1.1 聚合模型

2.1.2 主键模型

2.1.3 明细模型

2.2 数据分布

2.2.1 数据分区

2.2.2 分区维护

2.2.3 数据分桶

2.2.4 分桶设置最佳实践

2.3 同步物化视图

2.3.1 同步物化视图的概念

2.3.2 同步物化视图的原理

2.3.3 同步物化视图的操作

2.3.4 同步物化视图使用案例

2.3.5 同步物化视图的注意事项

2.3.6 同步物化视图和Rollup

2.4 异步物化视图

2.4.1 异步物化视图的概念和使用场景

2.4.2 异步物化视图的原理

2.4.3 异步物化视图的使用

2.5 索引构建

2.5.1 ZoneMap索引

2.5.2 前缀索引

2.5.3 Bitmap索引

2.5.4 Bloom Filter索引

第3章 Doris数据操作

3.1 数据导入

3.1.1 Stream Load

3.1.2 Routine Load

3.1.3 INSERT INTO

3.2 数据导出

3.2.1 Export

3.2.2 OUTFILE

3.3 数据变更

3.3.1 批量标记数据更新和删除

3.3.2 基于SQL语句进行数据变更

3.4 数据连接协议

3.4.1 MySQL协议

3.4.2 Arrow Flight SQL协议

3.5 作业调度

3.5.1 作业调度的概念和使用场景

3.5.2 作业调度的原理

3.5.3 作业调度的使用

第4章 存储引擎

4.1 数据分布

4.1.1 分区

4.1.2 分桶

4.1.3 Tablet、Rowset、Version、Segment的关系

4.1.4 Doris存储目录

4.1.5 Segment数据格式

4.2 数据压缩

4.2.1 LZ4压缩算法

4.2.2 ZSTD压缩算法

4.3 数据写入和更新原理

4.3.1 LSM

4.3.2 Doris数据写入原理

4.3.3 MVCC高并发更新原理

4.3.4 Merge On Read原理和实现

4.3.5 Merge On Write原理和实现

4.3.6 部分列更新

4.4 数据合并原理和实现

4.5 多副本写入

4.5.1 Doris多副本写入流程

4.5.2 Doris写入流程优化:Memtable前移

4.5.3 副本写入原则:多副本机制

4.6 副本管理机制

4.6.1 Doris多副本原理

4.6.2 副本状态和Tablet状态

4.6.3 副本修复

4.6.4 副本均衡

4.6.5 副本状态命令

第5章 Doris查询引擎原理

5.1 查询规划器原理

5.1.1 Doris SQL分布式执行流程

5.1.2 SQL解析计划

5.2 Pipeline执行引擎

5.2.1 Pipeline执行引擎的背景

5.2.2 Pipeline执行引擎的设计思想

5.2.3 Pipeline的实现逻辑

5.2.4 Pipeline优化

5.3 统计信息收集

5.3.1 统计信息收集原理

5.3.2 外表统计信息收集

5.3.3 收集统计信息实战

5.4 分布式连接原理和优化

5.4.1 分布式连接原理

5.4.2 Doris连接优化

5.5 查询数据落盘

5.5.1 数据落盘原理

5.5.2 数据落盘使用

第6章 Doris倒排索引原理和应用

6.1 日志分析的需求和挑战

6.1.1 日志分析的作用

6.1.2 日志分析的主要应用场景

6.1.3 日志分析场景的特点

6.1.4 日志分析场景的总体架构

6.2 Doris日志解决方案

6.2.1 开放性

6.2.2 高效写入

6.2.3 高效查询

6.2.4 统一

6.3 Doris日志核心技术解析

6.3.1 倒排索引的基础原理

6.3.2 Doris倒排索引的实现原理

6.3.3 Variant

6.3.4 动态剪枝TopN算法

6.3.5 N-Gram索引

6.3.6 Doris文本检索的其他加速优化方法

6.4 Doris日志应用实战

6.4.1 倒排索引语法介绍

6.4.2 倒排索引结合冷热分离架构入门示例

6.4.3 Doris日志导入方式

6.4.4 Doris日志存储场景参数优化

第7章 高并发点查原理和应用

7.1 什么是高并发点查

7.2 Doris高并发点查的挑战

7.2.1 行存和列存的优缺点

7.2.2 Doris查询计划复杂

7.2.3 SQL解析压力大

7.3 Doris高并发核心技术解析

7.3.1 行列混存

7.3.2 点查路径优化

7.3.3 预处理语句优化

7.3.4 行级缓存

7.4 Doris高并发点查使用

第8章 湖仓一体原理和应用

8.1 湖仓一体概述

8.1.1 数据仓库和数据湖的区别

8.1.2 湖仓一体的优点

8.1.3 Doris的湖仓一体演进路线

8.2 湖仓一体架构概述

8.3 数据源连接框架

8.3.1 元数据统一表达

8.3.2 元数据缓存及同步

8.3.3 数据访问

8.4 数据湖写入

8.5 数据湖查询原理解析

8.5.1 查询规划

8.5.2 查询执行

8.6 Doris多源数据目录实战

8.6.1 Doris多源数据目录简介

8.6.2 Doris多源数据目录主要应用场景

8.6.3 Doris多源数据目录常用操作

8.6.4 Doris多源数据目录使用实战

第9章 生态组件原理和应用

9.1 Flink Doris连接器

9.1.1 Flink简介

9.1.2 Flink CDC简介

9.1.3 Flink Doris连接器

9.1.4 Flink Doris源连接器原理和使用

9.1.5 Flink Doris接收连接器原理和使用

9.1.6 Flink Doris接收连接器整库同步

9.1.7 Flink Doris接收连接器循环接入

9.2 Spark Doris连接器

9.2.1 Spark简介

9.2.2 Spark Doris源连接器原理和使用

9.2.3 Spark Doris接收连接器原理和使用

9.2.4 Spark Doris连接器核心配置参数

第10章 运维管理

10.1 集群管理

10.1.1 节点启停操作

10.1.2 节点扩缩容

10.2 账号与权限管理

10.3 资源管理

10.3.1 资源组原理和使用

10.3.2 工作负载组

10.3.3 SQL级别资源限制

10.4 跨集群复制

10.4.1 CCR实现原理

10.4.2 CCR使用

第11章 基于Doris构建实时数据仓库

11.1 实时数据仓库的定义及构建方法

11.1.1 Hadoop大数据平台

11.1.2 实时数据仓库架构出现的必要性

11.1.3 基于Doris的实时数据仓库的特点

11.2 基于Doris的实时数据仓库架构

11.2.1 Doris数据接入

11.2.2 数据仓库分层理论

11.2.3 Doris多种数据仓库分层方案

推荐阅读

后折页

累计评论(条) 个书友正在讨论这本书 发表评论

发表评论

发表评论,分享你的想法吧!

买过这本书的人还买过

读了这本书的人还在读

回顶部