欢迎光临当当，请登录免费注册

男频| 女频

当当云阅读

当当云阅读文字

万本电子书0元读

万本电子书0元读

搜索

购物车

图书分类

小说: 侦探/悬疑/推理; 情感/都市; 科幻/魔幻; 作品集; 外国小说

文艺: 文学; 青春文学; 传记; 艺术; 动漫/幽默

历史文化: 哲学/宗教; 历史; 政治/军事; 文化; 社会科学; 古籍; 法律

经济/管理: 管理; 经济; 投资理财; 市场/营销; 商务沟通; 中国经济; 国际经济

心理/励志: 心理学; 女性心理学; 儿童心理学; 情绪管理; 职场/人际交往; 人生哲学

生活: 两性关系; 亲子/家教; 旅游/地图; 烹饪/美食; 保健/养生

童书: 儿童文学; 启蒙读物; 少儿英语; 动漫/图画书

科技/教育: 科普读物; 计算机/网络; 自然科学; 中小学教辅; 考试; 外语; 工具书

原版书: 外文原版书; 港台圖書; 小语种

我要充值赠送20%

顶部广告

当当云阅读 > 科技 > 计算机/网络 > 计算机理论与教程 > AI辅助数据质量监控

AI辅助数据质量监控

| | 手机阅读

扫描下载当当云阅读App

AI辅助数据质量监控电子书

当ChatGPT因数据噪声输出误导结论，当企业仪表盘数字遭高管质疑——本书正是根治数据信任危机的'手术刀'。译者团队深谙国内数据痛，将硅谷前沿技术本土化：技术深度：独创'数据质量四大支柱'框架，详解无监督学习模型调优行业温度：Discover金融、BuzzFeed等案例验证千倍ROI 人文洞察：以姥鲨隐喻'微小数据缺陷的致命影响'，唤醒质量敬畏数据工程师告别'救火'，决策者远离直觉依赖——这或是企业智能化转型中最关键的一本书！

售价：¥

纸质售价：¥75.10购买纸书

6人正在读 | 0人评论

6.5

作者：(美)杰里米·斯坦利,(美)佩奇·施瓦茨

出版社：机械工业出版社

出版时间：2025-05-21

字数：12.6万

所属分类：科技 > 计算机/网络 > 计算机理论与教程

温馨提示：数字商品不支持退换货，不提供源文件，不支持导出打印

为你推荐

读书简介
目录
累计评论(条)

读书简介
目录
累计评论(条)

本书主要介绍了如何确保企业所依赖的数据的质量。书中详细阐述了自动化数据质量监控的重要性，并提供了实用的方法，帮助企业高效地覆盖所有数据表，主动发现数据问题，并立即解决。作者们解释了如何构建无监督机器学习模型来检测数据问题，以及如何实施通知机制以减少警报疲劳，并迅速分类和解决这些问题。此外，本书还探讨了如何将自动化数据质量监控与数据目录、BI和ML系统集成，以克服自动化监控的局限性，并在大规模环境中部署和管理监控解决方案。这本书是数据质量领域的实用指南，为企业提供了确保数据质量的有效策略和方法。<br/>【推荐语】<br/>当ChatGPT因数据噪声输出误导结论，当企业仪表盘数字遭高管质疑——本书正是根治数据信任危机的'手术刀'。译者团队深谙国内数据痛，将硅谷前沿技术本土化：技术深度：独创'数据质量四大支柱'框架，详解无监督学习模型调优行业温度：Discover金融、BuzzFeed等案例验证千倍ROI 人文洞察：以姥鲨隐喻'微小数据缺陷的致命影响'，唤醒质量敬畏数据工程师告别'救火'，决策者远离直觉依赖——这或是企业智能化转型中最关键的一本书！<br/>【作者】<br/>Jeremy Stanley是Anomalo公司的联合创始人兼首席技术官。此前，他曾在Instacart公司担任数据科学副总裁，在那里他领导了机器学习项目，并推动了旨在提高公司盈利能力的各项举措。Paige Schwartz是Anomalo公司的一名专业技术作家，曾为包括Airbnb（爱彼迎）、Grammarly和OpenAI等在内的企业客户撰写文案。她曾担任谷歌的产品经理，擅长机器学习和数据相关领域的话题。<br/>

目录展开

O’Reilly Media，Inc.介绍

本书赞誉

译者序一

译者序二

前言

第1章数据质量监控势在必行

1.1 高质量的数据是新时代的黄金

1.1.1 数据驱动型公司是当今的颠覆者

1.1.2 数据分析的普及

1.1.3 人工智能和机器学习是竞争优势之源[1]

1.1.4 公司正在投资现代数据栈

1.2 数据越多，问题越多

1.2.1 数据工厂中的问题

1.2.2 数据迁移

1.2.3 第三方数据源

1.2.4 公司的成长与变化

1.2.5 外界因素

1.3 为什么我们需要数据质量监控

1.3.1 数据疤痕

1.3.2 数据冲击

1.4 自动化数据质量监控：一个全新的领域

第2章数据质量监控策略与自动化的角色

2.1 监控需求

2.2 数据可观测性：必要但不充分

2.3 传统的数据质量监控方法

2.3.1 人工数据质量检测

2.3.2 基于规则的测试

2.3.3 指标监控

2.4 使用无监督机器学习实现自动化数据质量监控

2.4.1 什么是无监督机器学习

2.4.2 类比：车道偏离警告

2.4.3 自动化的局限性

2.5 数据质量监控的四大支柱方法

第3章对自动化数据质量监控的商业影响进行评估

3.1 对数据进行评估

3.1.1 数量

3.1.2 种类

3.1.3 速度

3.1.4 真实性

3.1.5 特殊情况

3.2 评估你的行业

3.2.1 监管压力

3.2.2 人工智能/机器学习的风险

3.2.3 数据即产品

3.3 评估你的数据成熟度

3.4 评估对利益相关方的好处

3.4.1 工程师

3.4.2 数据团队领导者

3.4.3 科学家

3.4.4 消费者

3.5 进行投资回报率分析

3.5.1 定量指标

3.5.2 定性指标

3.6 总结

第4章利用机器学习使数据质量监控自动化

4.1 要求

4.1.1 敏感性

4.1.2 特异性

4.1.3 透明度

4.1.4 可扩展性

4.1.5 非必要需求

4.1.6 数据质量监控不等同于异常检测

4.2 机器学习方法和算法

4.2.1 数据抽样

4.2.2 特征编码

4.2.3 模型开发

4.2.4 模型可解释性

4.3 整体思路的伪代码实现

4.4 其他应用

4.5 总结

第5章构建一个适用于真实数据的模型

5.1 数据挑战及应对措施

5.1.1 季节性

5.1.2 基于时间的特征

5.1.3 混乱程度

5.1.4 就地更新表格

5.1.5 列之间的相关性

5.2 模型测试

5.2.1 引入合成异常

5.2.2 基准测试

5.2.3 模型改进

5.3 总结

第6章实施警报机制同时避免警报疲劳

6.1 如何通过通知促进数据问题响应

6.1.1 分类处理

6.1.2 路由

6.1.3 解决方案

6.1.4 文档记录

6.2 在没有通知的情况下采取行动

6.3 一个通知的解析

6.3.1 可视化

6.3.2 操作

6.3.3 文本描述

6.3.4 检查的创建者/最后编辑者

6.4 发送通知

6.4.1 通知的受众

6.4.2 通知的渠道

6.4.3 通知的时机

6.5 避免警报疲劳

6.5.1 合理安排检查顺序

6.5.2 使用机器学习对警报进行聚类

6.5.3 抑制通知

6.6 自动化根因分析

6.7 总结

第7章集成监控与数据工具和系统

7.1 监控数据堆栈

7.2 数据仓库

7.2.1 与数据仓库集成

7.2.2 安全性

7.2.3 多仓库之间的数据协调

7.3 数据编排器

7.4 数据目录

7.5 数据使用者

7.5.1 BI和分析工具

7.5.2 MLOps

7.6 总结

第8章大规模运营解决方案

8.1 自建还是购买

8.2 配置

8.2.1 确定最重要的表格

8.2.2 决定监控表格中的哪些数据

8.2.3 大规模配置

8.3 启用

8.3.1 用户角色和权限

8.3.2 培训、支持与推广

8.4 持续改善数据质量

8.4.1 数据健康计划

8.4.2 衡量指标

8.5 从混乱到清晰

附录数据质量问题的类型

关于作者

关于封面

累计评论(条) 个书友正在讨论这本书 发表评论

发表评论

发表评论，分享你的想法吧！

当当云阅读

买过这本书的人还买过

读了这本书的人还在读

支持设备

同类图书排行榜

01

豆包使用秘笈:从入门到精通的100个实用技巧

豆包使用秘笈:从入门到精通的100个实用技巧￥53.00

王吉斌;曾亮;吴佳莹;黄飞杰

￥53.00

02

豆包从入门到精通:AI助手和智能体轻松搞定工作、学习和生活难题

豆包从入门到精通:AI助手和智能体轻松搞定工作、学习和生活难题￥47.00

乔剑;苏小文

￥47.00

03

千问从入门到精通:AI助手和智能体轻松搞定工作、学习和生活难题

千问从入门到精通:AI助手和智能体轻松搞定工作、学习和生活难题￥35.00

乔剑;苏小文;李天舒

￥35.00

04

学会提问,驾驭AI:提示词从入门到精通

学会提问,驾驭AI:提示词从入门到精通￥61.60

程希冀

￥61.60

05

腾讯元宝使用秘笈:从入门到精通的100个实用技巧

腾讯元宝使用秘笈:从入门到精通的100个实用技巧￥53.00

王吉斌;吴佳莹;曾亮;张文杰

￥53.00

06

DeepSeek应用大全:从入门到精通的*案例解析

DeepSeek应用大全:从入门到精通的*案例解析￥54.60

李艮基;肖灵儿;等

￥54.60

07

DeepSeek硬核技术解读

DeepSeek硬核技术解读￥59.00

刘丹;尹俊希;杨院伶

￥59.00

08

OpenClaw实战指南:零基础打造会干活的AI数字员工

OpenClaw实战指南:零基础打造会干活的AI数字员工￥79.00

徐尧

￥79.00

09

豆包*学习:AI 辅助中小学生学习的方法与技巧

豆包*学习:AI 辅助中小学生学习的方法与技巧￥47.00

薛碧芸;郭泽德

￥47.00

10

精通Excel数据统计与分析

精通Excel数据统计与分析￥57.54

李宗璋著

￥57.54

更多同类图书 >

电子书排行榜

新书排行榜

5元封顶

关注我们

最受欢迎的阅读产品

关注我们：
- 新浪微博
- 官方微信
关于我们

欢迎反馈宝贵意见给我们

客服书吧：当当云阅读问答

意见反馈

Copyright (C) 当当网 2004-2022, All Rights Reserved

京ICP备17043473号-1 | 出版物经营许可证新出发京批字第直0673号

当当网收录的免费小说作品、频道内容、书友评论、用户上传文字、图片等其他一切内容及在当当网所做之广告均属用户个人行为，与当当网无关。

当当云阅读

二维码

0元畅读数万本精选电子书