万本电子书0元读

万本电子书0元读

顶部广告

数字化转型实践:构建云原生大数据平台电子书

暂无

售       价:¥

纸质售价:¥86.10购买纸书

21人正在读 | 0人评论 6.5

作       者:金鑫,武帅

出  版  社:电子工业出版社

出版时间:2022-08-01

字       数:13.1万

所属分类:

温馨提示:数字商品不支持退换货,不提供源文件,不支持导出打印

  • 读书简介
  • 目录
  • 累计评论(0条)
  • 读书简介
  • 目录
  • 累计评论(0条)
21 世纪,互联网行业的爆发启了全球数据量急剧增长的新时代,数据已经成为驱动企业数字化转型的核心力量。整个数据行业的技术能力不断提升,从数据库到数据仓库,再到源大数据,都在经济社会中发挥着极其重要的作用。近年来,新兴数据技术与云计算相互辅助,共同发展,诞生了一系列云原生数据服务,让企业能够突破传统模式的局限,专注于业务,降本增效。本书以全球前沿的云原生服务为基础,详细展现了如何将数据存储、数据引、批量数据处理、实时数据处理、数据仓库、数据可视化和机器学习等核心要素综合起来,逐步构建一个高效的大数据服务平台。<br/>【作者】<br/>金鑫,微软技术专家,于2000年加微软,专注于研究企业级应用和分布式系统。近年来,作为微软公有云架构和发技术领域专家,主要从事微软云数据平台和发平台的建设工作,致力于为客户提供云原生解决方案及技术咨询。武帅,微软技术专家,于2011年加微软,一直从事发测试技术和公有云的研究及咨询工作。目前专注于云计算的行业落地,致力于物联网、大数据和人工智能等新兴技术助力企业数字化转型的工作。<br/>
目录展开

前折页

内容简介

前言

第1章 数字化转型与数据技术

1.1 数字化转型

1.2 基于数据进行数字化转型

1.3 数据仓库

1.4 大数据

1.5 数据湖

1.6 云计算中数据技术的演进

1.7 本书目标

第2章 数据存储

2.1 数据存储的发展与趋势

2.1.1 集中式文件系统

2.1.2 网络文件系统

2.1.3 分布式文件系统

2.1.4 云原生存储

2.2 Azure Blob对象存储

2.2.1 数据冗余策略

2.2.2 分层存储

2.2.3 兼容HDFS的WASB文件系统

2.3 创建存储账号

2.3.1 订阅

2.3.2 资源组

2.3.3 存储账号

2.4 Azure数据湖存储

2.4.1 分层命名空间

2.4.2 兼容HDFS的ABFS文件系统

2.5 创建数据湖存储

2.6 基于HDFS访问数据湖存储

2.7 在HDInsight中访问数据湖存储

2.8 本章小结

第3章 数据引入

3.1 什么是数据引入

3.2 数据引入面临的挑战

3.3 数据引入工具

3.4 数据工厂

3.4.1 什么是数据工厂

3.4.2 创建数据工厂

3.4.3 数据工厂的主要组件

3.5 引入数据

3.5.1 数据复制

3.5.2 管道设计

3.5.3 参数化

3.5.4 监控

3.6 本章小结

第4章 批量数据处理

4.1 数据处理概述

4.2 数据处理引擎

4.2.1 MapReduce

4.2.2 Spark

4.3 Databricks

4.4 使用Databricks处理批量数据

4.5 Databricks的特性

4.5.1 依赖库管理

4.5.2 Databricks文件系统(DBFS)

4.5.3 密钥管理

4.5.4 Delta Lake

4.6 使用数据工厂处理批量数据

4.6.1 设计Data Flow

4.6.2 Data Flow的设计模式

4.6.3 如何选择Data Flow与Databricks

4.7 本章小结

第5章 实时数据处理

5.1 什么是实时数据处理

5.2 消息队列

5.3 Kafka的使用

5.3.1 创建虚拟网络

5.3.2 创建Kafka集群

5.3.3 配置IP Advertising

5.3.4 生产者发送数据

5.4 实时数据处理引擎

5.5 使用Spark Structured Streaming处理实时数据

5.5.1 连通Kafka与Databricks

5.5.2 在Databricks中处理数据

5.5.3 使用Cosmos DB保存数据

5.6 Event Hub

5.7 本章小结

第6章 数据仓库

6.1 什么是数据仓库

6.2 云原生数据仓库

6.3 Synapse Analytics

6.3.1 什么是Synapse Analytics

6.3.2 Synapse SQL的架构

6.3.3 创建Synapse工作区

6.3.4 创建SQL池

6.3.5 连接SQL池

6.4 数据加载

6.4.1 数据加载方式

6.4.2 使用COPY导入数据

6.5 Synapse SQL的资源和负荷管理

6.5.1 资源类

6.5.2 并发槽

6.5.3 最大并发查询数

6.5.4 工作负荷组

6.5.5 工作负荷分类器

6.6 数据仓库发展趋势

6.6.1 挑战

6.6.2 趋势

6.7 Synapse Analytics的高级特性

6.7.1 Synapse工作室

6.7.2 数据中心

6.7.3 无服务器SQL池

6.7.4 托管Spark

6.8 本章小结

第7章 数据可视化

7.1 数据可视化概述

7.2 数据可视化工具

7.3 Power BI

7.3.1 什么是Power BI

7.3.2 Power BI的构件

7.3.3 使用Power BI Desktop

7.3.4 使用Power BI服务

7.4 本章小结

第8章 机器学习

8.1 机器学习概述

8.1.1 算法类型

8.1.2 业务场景

8.2 机器学习的流程

8.3 机器学习的挑战与云原生平台的优势

8.4 云原生机器学习平台

8.4.1 创建工作区

8.4.2 创建数据存储库

8.4.3 创建数据集

8.4.4 创建计算资源

8.5 机器学习设计器

8.6 自动化机器学习

8.7 本章小结

参考文献

反侵权盗版声明

累计评论(0条) 0个书友正在讨论这本书 发表评论

发表评论

发表评论,分享你的想法吧!

买过这本书的人还买过

读了这本书的人还在读

回顶部