万本电子书0元读

万本电子书0元读

顶部广告

*使用Greenplum:入门、进阶与数据中台电子书

(1)作者背景资深:在数仓、数据中台等领域深耕10余年,启高信息大数据架构师,Apache Doris和OpenGauss源码贡献者。 (2)作者经验丰富:丰富的数据仓库、数据集市、数据中台项目实战经验,对大数据主流技术架构、产品选型与解决方案有深研究,尤其擅长用优雅的SQL实现复杂的逻辑。 (3)讲透Greenplum:从工作原理、功能组件、深应用3个维度全面、深讲解Greenplum,帮助读者快速实现Greenplum的门、实战与阶。

售       价:¥

纸质售价:¥78.70购买纸书

20人正在读 | 0人评论 6.8

作       者:王春波

出  版  社:机械工业出版社

出版时间:2021-12-01

字       数:31.0万

所属分类: 科技 > 计算机/网络 > 计算机理论与教程

温馨提示:数字商品不支持退换货,不提供源文件,不支持导出打印

为你推荐

  • 读书简介
  • 目录
  • 累计评论(0条)
  • 读书简介
  • 目录
  • 累计评论(0条)
内容简介 这不仅是一本从原理到使用、从门到阶讲解Greenplum的著作,而且是一本指导企业用更省钱、更高效地方式使用Greenplum构建企业级数据仓库和数据中台的著作。 作者在数据架构和数据仓库一线工作10余年,积累了丰富的项目经验,他用浅显易懂的语言、贴近生产环境的案例、丰富的示意图例写作了本书,能帮助读者快速掌握具有实战价值的知识。 具体地,阅读本书你将收获如下内容: ?掌握数据仓库技术的发展历程和发展方向; ?理解MPP架构的架构特和实现逻辑; ?Greenplum数据库的安装和基本操作; ?Greenplum数据库的工作原理; ?SQL语句从门到发实战; ?Greenplum数据库ETL相关功能的具体用途; ?机器学习、文本处理、图计算、GIS等的门知识; ?掌握Greenplum数据库的运维和监控要; ?全面掌握Greenplum数据库的性能优化; ?数据中台的理念和建设路径; ?数据中台从口到智能化应用的项目实战; ?零售行业数据中台的项目实战案例。<br/>【推荐语】<br/>(1)作者背景资深:在数仓、数据中台等领域深耕10余年,启高信息大数据架构师,Apache Doris和OpenGauss源码贡献者。(2)作者经验丰富:丰富的数据仓库、数据集市、数据中台项目实战经验,对大数据主流技术架构、产品选型与解决方案有深研究,尤其擅长用优雅的SQL实现复杂的逻辑。(3)讲透Greenplum:从工作原理、功能组件、深应用3个维度全面、深讲解Greenplum,帮助读者快速实现Greenplum的门、实战与阶。(4)Greenplum数据中台搭建:从建设思路、口实战、建模实战到数据中台管理和应用,全方位解读基于 Greenplum 数据库实现数据中台的过程(5)Greenplum中文社区推荐:Greenplum中文社区创始人姚延栋、启高信息创始人赵书贤等7位专家联袂推荐(6)丰富案例和图示:通过浅显易懂的语言,用丰富的案例和图示,将复杂的内容简单化,引导读者深学习,事半功倍。<br/>【作者】<br/>作者介绍 王春波 资深架构师和数据仓库专家,现任上海启高信息科技有限公司大数据架构师,Apache Doris和openGauss贡献者,Greenplum中文社区参与者。 具有十多年的数据仓库、数据集市、数据中台项目实战经验,对大数据主流技术架构、产品选型与解决方案有深研究,尤其擅长用优雅的SQL实现复杂的逻辑。 常年奔波在各个项目交付现场,曾成功主导过中国邮政储蓄银行、南海农商银行、广东省联社、前海微众银行、广东南粤银行等多家银行的管理会计项目,以及卡宾、安踏、特步等多家零售鞋服企业的数据中台项目。 公众号“数据中台研习社”运营者。<br/>
目录展开

内容简介

推荐语

作者介绍

序一

序二

序三

前言

第一部分 大数据平台概述

第1章 大数据平台技术的演进

1.1 关系型数据库

1.1.1 数据库发展历程

1.1.2 关系型数据库独霸天下

1.1.3 结构化查询语言SQL

1.1.4 列存储的兴起

1.2 Hadoop生态系统

1.2.1 Hadoop概述

1.2.2 Hadoop生态圈

1.2.3 Hadoop的优缺点

1.3 NoSQL的瓶颈和SQL数据库的回归

1.3.1 NoSQL产品的发展

1.3.2 NoSQL的共性

1.3.3 SQL数据库的回归

1.4 MPP架构的兴起

1.4.1 什么是MPP架构

1.4.2 MPP架构的蓬勃发展

1.4.3 MPP数据库代表—TBase

1.4.4 浅谈HTAP

第二部分 Greenplum入门

第2章 Greenplum概述

2.1 Greenplum的前世今生

2.2 Greenplum数据库架构

2.3 Greenplum数据库的特点

2.4 Greenplum新特性及展望

2.5 Greenplum的优势

第3章 Greenplum的安装与部署

3.1 Greenplum数据库安装过程

3.1.1 准备工作

3.1.2 安装Master节点

3.1.3 复制安装包到其他节点

3.1.4 初始化Greenplum数据库

3.2 安装GPCC

3.3 Greenplum访问接口

3.3.1 CLI

3.3.2 JDBC

3.3.3 ODBC

3.4 Greenplum数据库常用命令

3.4.1 启动和停止

3.4.2 修改参数

3.4.3 其他常用命令

3.5 Greenplum性能测试

第4章 Greenplum使用入门

4.1 数据类型详解

4.1.1 基本数据类型

4.1.2 特殊数据类型

4.1.3 组合数据类型

4.2 数据表的基本使用

4.2.1 表对象定义

4.2.2 表的基本操作

4.2.3 数据的基本操作

4.3 数据表的高级应用

4.3.1 数据表的存储特性

4.3.2 分区表详解

4.3.3 外部表

4.4 数据库函数

4.4.1 数学函数

4.4.2 三角函数列表

4.4.3 字符串函数和操作符

4.4.4 类型转换相关函数

4.4.5 自定义函数

4.5 数据库的其他对象

4.5.1 视图

4.5.2 索引

4.5.3 序列

第三部分 Greenplum应用

第5章 Greenplum查询详解

5.1 SQL语法

5.1.1 简单SQL语法

5.1.2 WITH子句特性

5.1.3 IN语句和EXISTS语句

5.1.4 MERGE子句的实现

5.2 JOIN操作

5.3 分析函数的妙用

5.4 高级函数精选

第6章 ETL工具箱

6.1 数据加载王者GPLoad

6.1.1 GPLoad简介

6.1.2 GPLoad配置详解

6.1.3 GPLoad实战

6.2 自定义存储过程

6.2.1 存储过程介绍

6.2.2 存储过程应用模板

6.2.3 存储过程精选案例

6.3 PXF插件

6.3.1 PXF简介

6.3.2 安装PXF

6.3.3 PXF实战

6.4 DBLink

6.4.1 DBLink简介

6.4.2 安装DBLink

6.4.3 DBlink实战

6.5 拉链表

第7章 Greenplum高级应用

7.1 开放的编程接口

7.1.1 PL/Python

7.1.2 PL/R

7.2 MADlib机器学习库

7.2.1 安装MADlib

7.2.2 线性回归案例

7.2.3 关联规则案例

7.2.4 朴素贝叶斯分类案例

7.3 半结构化数据分析

7.4 地理空间数据分析

7.5 图计算应用

第8章 Greenplum运维管理和监控

8.1 数据库管理

8.1.1 创建和管理数据库

8.1.2 创建和管理模式

8.1.3 创建和管理表空间

8.1.4 创建和管理用户

8.1.5 创建和管理资源队列

8.2 可视化监控页面—GPCC

8.3 管理好帮手—gp_toolkit

8.4 Greenplum备份和恢复

8.5 在线扩容工具GPExpand

8.5.1 Greenplum扩容实战

8.5.2 扩容原理分析

8.6 锁机制

8.6.1 锁管理概述

8.6.2 普通锁数据结构

第9章 Greenplum性能优化

9.1 系统级优化

9.1.1 操作系统选择

9.1.2 硬件资源配置

9.1.3 磁盘读写

9.1.4 节点之间的网络带宽

9.1.5 系统参数

9.2 数据库级优化

9.2.1 数据库参数配置

9.2.2 资源队列

9.3 表级优化

9.3.1 建表参数

9.3.2 表的优化

9.4 执行计划和查询优化

9.4.1 查看执行计划

9.4.2 数据扫描方式

9.4.3 分布式执行方式

9.4.4 两种聚合方式

9.4.5 关联分类

9.4.6 优化器的选择

9.4.7 其他关键术语

第10章 Greenplum与开源组件

10.1 Kettle

10.2 DataX

10.3 HDFS、Hive和HBase

10.4 Spark

10.5 Kafka

10.6 Flink

第11章 Greenplum与BI应用

11.1 Tableau

11.1.1 Tableau连接Greenplum

11.1.2 Tableau最佳实践要点

11.2 永洪BI

11.3 帆软BI

11.4 DataV

11.5 Quick BI

第四部分 数据中台实战

第12章 数据中台建设思路

12.1 为什么要搭建数据中台

12.2 什么是数据中台

12.3 如何搭建数据中台

12.3.1 数据资产盘点和规划

12.3.2 数据应用规划与设计

12.3.3 数据平台选型与建设

12.3.4 数据应用设计与实现

12.3.5 组织架构调整与流程变革

12.4 数据中台怎么选型

12.4.1 数据仓库选型

12.4.2 ETL工具选型

12.4.3 调度平台选型

12.4.4 BI工具选型

第13章 接口数据同步

13.1 全量接口同步

13.2 增量接口同步

13.3 流式数据同步

13.4 日志流数据同步

第14章 数据建模

14.1 数据建模思想

14.1.1 Inmon企业信息化工厂

14.1.2 Kimball的维度数据仓库

14.1.3 两种建模体系的对比

14.2 数据分层设计

14.2.1 操作数据存储层

14.2.2 数据仓库层

14.2.3 数据集市层

14.3 数据分层实战案例

14.3.1 ODS层

14.3.2 DWD层

14.3.3 DWB层

14.3.4 DWS层

14.3.5 ADS层

14.4 数据中台命名规范

14.4.1 数据库表命名

14.4.2 数据库字段命名

14.4.3 脚本命名规范

第15章 数据中台主要配套功能

15.1 数据权限管理

15.2 数据补录

15.3 BI门户

15.4 元数据管理

15.5 指标管理

第16章 数据中台数据应用

16.1 商业智能

16.2 自助分析平台

16.3 数据服务

16.4 标签平台

16.5 推荐系统

第17章 基于Greenplum的数据中台实践案例

17.1 项目背景

17.2 项目需求

17.3 项目技术实现

17.3.1 系统架构

17.3.2 系统ETL分层

17.3.3 系统调度任务

17.4 智能数据应用

17.4.1 自助分析应用

17.4.2 固定报表

17.4.3 可视化大屏

17.4.4 钉钉数据服务

17.5 典型技术方案分享

17.5.1 准实时需求实现方案

17.5.2 数据库优化方案

17.5.3 数据权限控制方案

17.5.4 历史数据离线存储方案

17.5.5 系统备份方案

17.6 典型业务方案分享

17.6.1 零售指标同期分析

17.6.2 零售指标节假日对比分析

17.6.3 在库库存

17.6.4 在途库存

17.6.5 售罄率

17.6.6 齐码率

17.7 项目总结

累计评论(0条) 0个书友正在讨论这本书 发表评论

发表评论

发表评论,分享你的想法吧!

买过这本书的人还买过

读了这本书的人还在读

回顶部