万本电子书0元读

万本电子书0元读

顶部广告

剑指大数据——企业级数据仓库项目实战(电商版)电子书

- 从0到1,带领读者一步步搭建一个功能完善、指标丰富的电商版离线数据仓库。- 项目涵盖40多个脚本、5大类日志数据、34张业务数据原始表、100多张数据仓库表、100多个电商统计指标。- 主流大数据框架:Hadoop、Spark、Hive、Kafka等一网打尽。流行新锐框架:DolphinScheduler、Ranger、Kerberos等逐个击破。- 附赠63小时名师视频讲解及全部教程源码。

售       价:¥

纸质售价:¥84.00购买纸书

32人正在读 | 0人评论 6.8

作       者:尚硅谷教育

出  版  社:电子工业出版社

出版时间:2022-08-01

字       数:18.3万

所属分类: 科技 > 计算机/网络 > 计算机理论与教程

温馨提示:数字商品不支持退换货,不提供源文件,不支持导出打印

为你推荐

  • 读书简介
  • 目录
  • 累计评论(0条)
  • 读书简介
  • 目录
  • 累计评论(0条)
本书按照需求规划、需求实现、可视化的流程行编排,通过项目发的主要流程,介绍数据仓库的搭建过程。在整个数据仓库的搭建过程中,本书介绍了主要组件的安装部署、需求实现的具体思路,以及各种问题的解决方案等,并在其中穿插了许多与大数据和数据仓库相关的理论知识,包括数据仓库的概念、电商业务概述、数据仓库理论和数据仓库建模等。 本书共14章,其中,第1~3章是项目的前期准备阶段,主要介绍了数据仓库的概念和搭建需求,并初步搭建了本数据仓库项目所需的基本环境;第4~7章是项目的核心部分,详细介绍了数据仓库的建模理论,并完成了数据从采集到分层搭建的全过程,是本书的重部分;第8~14章是对数据治理各功能模块的实现,针对数据治理的不同功能需求分模块行实现。 本书适合具有一定编程基础并对大数据感兴趣的读者阅读。通过学习本书,读者可以快速了解数据仓库,全面掌握数据仓库相关技术。<br/>【作者】<br/>尚硅谷教育是一家专业的IT教育培训机构,设了JavaEE、大数据、HTML5前端等多门学科,在互联网上发布的JavaEE、大数据、HTML5前端、区块、C语言、Python等技术视频教程广受赞誉。<br/>
目录展开

内容简介

前言

第1章 数据仓库概论

1.1 数据仓库的概念与特点

1.2 数据仓库的演进过程

1.3 数据仓库技术

1.4 数据仓库基本架构

1.5 数据库和数据仓库的区别

1.6 学前导读

1.7 本章总结

第2章 项目需求描述

2.1 前期调研

2.2 项目架构分析

2.3 项目业务概述

2.4 系统运行环境

2.5 本章总结

第3章 项目部署的环境准备

3.1 Linux环境准备

3.2 Linux环境配置

3.3 Hadoop环境搭建

3.4 本章总结

第4章 用户行为数据采集模块

4.1 日志生成

4.2 消息队列Kafka

4.3 采集日志的Flume

4.4 消费日志的Flume

4.5 采集通道启动、停止脚本

4.6 本章总结

第5章 业务数据采集模块

5.1 电商业务概述

5.2 业务数据采集

5.3 本章总结

第6章 数据仓库搭建模块

6.1 数据仓库理论准备

6.2 数据仓库建模实践

6.3 数据仓库搭建环境准备

6.4 数据仓库搭建——ODS层

6.5 数据仓库搭建——DIM层

6.6 数据仓库搭建——DWD层

6.7 数据仓库搭建——DWS层

6.8 数据仓库搭建——ADS层

6.9 数据模型评估及优化

6.10 本章总结

第7章 DolphinScheduler全流程调度

7.1 DolphinScheduler概述与安装部署

7.2 创建MySQL数据库和表

7.3 DataX数据导出

7.4 全流程调度

7.5 电子邮件报警

7.6 本章总结

第8章 数据可视化模块

8.1 Superset部署

8.2 Superset使用

8.3 Superset实战

8.4 ECharts可视化

8.5 本章总结

第9章 即席查询模块

9.1 Presto

9.2 Kylin

9.3 即席查询框架对比

9.4 本章总结

第10章 集群监控模块

10.1 Zabbix入门

10.2 Zabbix部署

10.3 Zabbix使用

10.4 Grafana

10.5 本章总结

第11章 安全认证模块

11.1 Kerberos入门

11.2 Kerberos安装

11.3 Kerberos操作

11.4 Hadoop集成Kerberos

11.5 在安全认证模式下启动Hadoop集群

11.6 在安全认证模式下操作Hadoop集群

11.7 Hive集成Kerberos

11.8 在安全认证模式下操作Hive

11.9 在安全认证模式下执行数据仓库全流程调度

11.10 Presto集成Kerberos

11.11 Kylin集成Kerberos

11.12 本章总结

第12章 权限管理模块

12.1 Ranger入门

12.2 Ranger安装部署

12.3 使用Ranger对Hive进行权限管理

12.4 本章总结

第13章 元数据管理模块

13.1 Atlas入门

13.2 Atlas安装及启动

13.3 Atlas使用

13.4 本章总结

第14章 数据质量

14.1 数据质量管理概述

14.2 数据质量监控需求

14.3 开发环境准备

14.4 编写及集成检查规则脚本

14.5 编写报警脚本

14.6 调度模块

14.7 可视化模块

14.8 本章总结

累计评论(0条) 0个书友正在讨论这本书 发表评论

发表评论

发表评论,分享你的想法吧!

买过这本书的人还买过

读了这本书的人还在读

回顶部