(1)作者背景资深:在数仓、数据中台等领域深耕10余年,启高信息大数据架构师,Apache Doris和OpenGauss源码贡献者。 (2)作者经验丰富:丰富的数据仓库、数据集市、数据中台项目实战经验,对大数据主流技术架构、产品选型与解决方案有深研究,尤其擅长用优雅的SQL实现复杂的逻辑。 (3)讲透Greenplum:从工作原理、功能组件、深应用3个维度全面、深讲解Greenplum,帮助读者快速实现Greenplum的门、实战与阶。
售 价:¥
纸质售价:¥76.30购买纸书
温馨提示:数字商品不支持退换货,不提供源文件,不支持导出打印
为你推荐
内容简介
推荐语
作者介绍
序一
序二
序三
前言
第一部分 大数据平台概述
第1章 大数据平台技术的演进
1.1 关系型数据库
1.1.1 数据库发展历程
1.1.2 关系型数据库独霸天下
1.1.3 结构化查询语言SQL
1.1.4 列存储的兴起
1.2 Hadoop生态系统
1.2.1 Hadoop概述
1.2.2 Hadoop生态圈
1.2.3 Hadoop的优缺点
1.3 NoSQL的瓶颈和SQL数据库的回归
1.3.1 NoSQL产品的发展
1.3.2 NoSQL的共性
1.3.3 SQL数据库的回归
1.4 MPP架构的兴起
1.4.1 什么是MPP架构
1.4.2 MPP架构的蓬勃发展
1.4.3 MPP数据库代表—TBase
1.4.4 浅谈HTAP
第二部分 Greenplum入门
第2章 Greenplum概述
2.1 Greenplum的前世今生
2.2 Greenplum数据库架构
2.3 Greenplum数据库的特点
2.4 Greenplum新特性及展望
2.5 Greenplum的优势
第3章 Greenplum的安装与部署
3.1 Greenplum数据库安装过程
3.1.1 准备工作
3.1.2 安装Master节点
3.1.3 复制安装包到其他节点
3.1.4 初始化Greenplum数据库
3.2 安装GPCC
3.3 Greenplum访问接口
3.3.1 CLI
3.3.2 JDBC
3.3.3 ODBC
3.4 Greenplum数据库常用命令
3.4.1 启动和停止
3.4.2 修改参数
3.4.3 其他常用命令
3.5 Greenplum性能测试
第4章 Greenplum使用入门
4.1 数据类型详解
4.1.1 基本数据类型
4.1.2 特殊数据类型
4.1.3 组合数据类型
4.2 数据表的基本使用
4.2.1 表对象定义
4.2.2 表的基本操作
4.2.3 数据的基本操作
4.3 数据表的高级应用
4.3.1 数据表的存储特性
4.3.2 分区表详解
4.3.3 外部表
4.4 数据库函数
4.4.1 数学函数
4.4.2 三角函数列表
4.4.3 字符串函数和操作符
4.4.4 类型转换相关函数
4.4.5 自定义函数
4.5 数据库的其他对象
4.5.1 视图
4.5.2 索引
4.5.3 序列
第三部分 Greenplum应用
第5章 Greenplum查询详解
5.1 SQL语法
5.1.1 简单SQL语法
5.1.2 WITH子句特性
5.1.3 IN语句和EXISTS语句
5.1.4 MERGE子句的实现
5.2 JOIN操作
5.3 分析函数的妙用
5.4 高级函数精选
第6章 ETL工具箱
6.1 数据加载王者GPLoad
6.1.1 GPLoad简介
6.1.2 GPLoad配置详解
6.1.3 GPLoad实战
6.2 自定义存储过程
6.2.1 存储过程介绍
6.2.2 存储过程应用模板
6.2.3 存储过程精选案例
6.3 PXF插件
6.3.1 PXF简介
6.3.2 安装PXF
6.3.3 PXF实战
6.4 DBLink
6.4.1 DBLink简介
6.4.2 安装DBLink
6.4.3 DBlink实战
6.5 拉链表
第7章 Greenplum高级应用
7.1 开放的编程接口
7.1.1 PL/Python
7.1.2 PL/R
7.2 MADlib机器学习库
7.2.1 安装MADlib
7.2.2 线性回归案例
7.2.3 关联规则案例
7.2.4 朴素贝叶斯分类案例
7.3 半结构化数据分析
7.4 地理空间数据分析
7.5 图计算应用
第8章 Greenplum运维管理和监控
8.1 数据库管理
8.1.1 创建和管理数据库
8.1.2 创建和管理模式
8.1.3 创建和管理表空间
8.1.4 创建和管理用户
8.1.5 创建和管理资源队列
8.2 可视化监控页面—GPCC
8.3 管理好帮手—gp_toolkit
8.4 Greenplum备份和恢复
8.5 在线扩容工具GPExpand
8.5.1 Greenplum扩容实战
8.5.2 扩容原理分析
8.6 锁机制
8.6.1 锁管理概述
8.6.2 普通锁数据结构
第9章 Greenplum性能优化
9.1 系统级优化
9.1.1 操作系统选择
9.1.2 硬件资源配置
9.1.3 磁盘读写
9.1.4 节点之间的网络带宽
9.1.5 系统参数
9.2 数据库级优化
9.2.1 数据库参数配置
9.2.2 资源队列
9.3 表级优化
9.3.1 建表参数
9.3.2 表的优化
9.4 执行计划和查询优化
9.4.1 查看执行计划
9.4.2 数据扫描方式
9.4.3 分布式执行方式
9.4.4 两种聚合方式
9.4.5 关联分类
9.4.6 优化器的选择
9.4.7 其他关键术语
第10章 Greenplum与开源组件
10.1 Kettle
10.2 DataX
10.3 HDFS、Hive和HBase
10.4 Spark
10.5 Kafka
10.6 Flink
第11章 Greenplum与BI应用
11.1 Tableau
11.1.1 Tableau连接Greenplum
11.1.2 Tableau最佳实践要点
11.2 永洪BI
11.3 帆软BI
11.4 DataV
11.5 Quick BI
第四部分 数据中台实战
第12章 数据中台建设思路
12.1 为什么要搭建数据中台
12.2 什么是数据中台
12.3 如何搭建数据中台
12.3.1 数据资产盘点和规划
12.3.2 数据应用规划与设计
12.3.3 数据平台选型与建设
12.3.4 数据应用设计与实现
12.3.5 组织架构调整与流程变革
12.4 数据中台怎么选型
12.4.1 数据仓库选型
12.4.2 ETL工具选型
12.4.3 调度平台选型
12.4.4 BI工具选型
第13章 接口数据同步
13.1 全量接口同步
13.2 增量接口同步
13.3 流式数据同步
13.4 日志流数据同步
第14章 数据建模
14.1 数据建模思想
14.1.1 Inmon企业信息化工厂
14.1.2 Kimball的维度数据仓库
14.1.3 两种建模体系的对比
14.2 数据分层设计
14.2.1 操作数据存储层
14.2.2 数据仓库层
14.2.3 数据集市层
14.3 数据分层实战案例
14.3.1 ODS层
14.3.2 DWD层
14.3.3 DWB层
14.3.4 DWS层
14.3.5 ADS层
14.4 数据中台命名规范
14.4.1 数据库表命名
14.4.2 数据库字段命名
14.4.3 脚本命名规范
第15章 数据中台主要配套功能
15.1 数据权限管理
15.2 数据补录
15.3 BI门户
15.4 元数据管理
15.5 指标管理
第16章 数据中台数据应用
16.1 商业智能
16.2 自助分析平台
16.3 数据服务
16.4 标签平台
16.5 推荐系统
第17章 基于Greenplum的数据中台实践案例
17.1 项目背景
17.2 项目需求
17.3 项目技术实现
17.3.1 系统架构
17.3.2 系统ETL分层
17.3.3 系统调度任务
17.4 智能数据应用
17.4.1 自助分析应用
17.4.2 固定报表
17.4.3 可视化大屏
17.4.4 钉钉数据服务
17.5 典型技术方案分享
17.5.1 准实时需求实现方案
17.5.2 数据库优化方案
17.5.3 数据权限控制方案
17.5.4 历史数据离线存储方案
17.5.5 系统备份方案
17.6 典型业务方案分享
17.6.1 零售指标同期分析
17.6.2 零售指标节假日对比分析
17.6.3 在库库存
17.6.4 在途库存
17.6.5 售罄率
17.6.6 齐码率
17.7 项目总结
买过这本书的人还买过
读了这本书的人还在读
同类图书排行榜