万本电子书0元读

万本电子书0元读

顶部广告

CDA三级认证教材:敏捷数据挖掘电子书

CDA数字化人才认证教材 历经3次升级迭代 精英专家团队,品质教材保障 畅销10多万册的数据红宝书

售       价:¥

纸质售价:¥85.00购买纸书

1人正在读 | 0人评论 6.7

作       者:CDA数据科学研究院

出  版  社:电子工业出版社

出版时间:2026-01-01

字       数:18.5万

所属分类: 科技 > 计算机/网络 > 多媒体/数据通信

温馨提示:数字商品不支持退换货,不提供源文件,不支持导出打印

为你推荐

  • 读书简介
  • 目录
  • 累计评论(条)
  • 读书简介
  • 目录
  • 累计评论(条)
本书作为CDA三级认证教材,破了传统的学院派知识整合模式,从业务应用场景出发来组织内容, 旨在更加贴近业务需求,而非单纯罗列算法。经过多年的磨,本书精选了在行业应用中价值最大的九类场景,并提供不同场景下构建数据应用的最佳实践。 本书涉及的算法不仅涵盖传统的统计学习,还结合企业实际需求,解构了机器学习、深度学习的前沿方法,并提供了丰富的示例代码, 以便读者借鉴。本书分为三篇:理论篇、技术篇和管理篇。 理论篇共1章,讲解数据挖掘的核心思维、算法模型和数据挖掘之间的关系, 以及数据挖掘的落地场景框架。技术篇共6章,讲解决策类、识别类、优化分析类模型的具体算法,以及参数调优、特征工程、类别不平衡问题等内容。管理篇共2章,讲解 MLOps 和模型生命周期管理。<br/>【推荐语】<br/>CDA数字化人才认证教材 历经3次升级迭代 精英专家团队,品质教材保障 畅销10多万册的数据红宝书<br/>【作者】<br/>CDA 数据科学研究院简介2013年,大数据行业方兴未艾,CDA 数据科学研究院孕育而生,是全球率先成立的专注于数据科学领域的专业研究机构。CDA 数据科学研究院汇集国内外数据行业专家,团队具有专业的学术素养、精湛的研究水平、扎实的企业实战经验、丰富的行业资源,通过对各类企业、社会组织等行全面、系统、深的调查和访问,获得紧跟技术发展的经验与数据,并结合数据行业的未来发展方向行系统的研究,不断研发创新的知识体系和技术应用。近十年来,CDA 数据科学研究院秉持“专业性、前沿性、科学性”的定位,深耕数据分析、大数据、人工智能等核心领域,持续推数据科学的行业发展和数字化人才标准体系的建立。未来,CDA 数据科学研究院也将顺应数字化时代浪潮,持续拓创新,继续加大数据科学领域的内容建设,推人才数字化赋能,助力企业数字化转型。<br/>
目录展开

内容简介

CDA,数智人才的身份认证

第1篇 理论篇

第1章 数据挖掘综述

1.1 企业中数据分析的层级

1.2 数据分析的过程

1.3 数据挖掘方法论

1.3.1 CRISP-DM方法论

1.3.2 SEMMA方法论

1.4 数据挖掘的核心思维

1.5 算法建模的4个要素

1.5.1 目标函数

1.5.2 学习策略

1.5.3 寻优方法

1.5.4 评估方法

1.6 算法模型分类介绍

1.6.1 预测性——有监督学习

1.6.2 描述性——无监督学习

1.7 数据挖掘落地场景框架

1.8 数据挖掘建模模型的评估

第2篇 技术篇

第2章 决策类模型

2.1 客户价值预测

2.1.1 线性回归模型概述

2.1.2 Python案例:线性回归建模

2.1.3 多元线性回归的变量筛选

2.1.4 Python案例:多元线性回归变量筛选

2.1.5 模型假设检验

2.1.6 残差分析

2.1.7 强影响点分析

2.1.8 Python案例:线性回归调优实践

2.1.9 线性回归建模的完整流程小结

2.1.1 0正则化

2.1.1 1 Python案例:岭回归与Lasso回归实战

2.2 营销响应预测

2.2.1 使用逻辑回归预测客户响应率

2.2.2 比较逻辑回归与线性回归

2.2.3 图解逻辑回归

2.2.4 逻辑回归模型概述

2.2.5 分类变量的处理

2.2.6 Python案例:逻辑回归建模实战

2.2.7 逻辑回归建模小结

2.3 细分画像

2.3.1 K-means聚类算法

2.3.2 基于密度的聚类算法

2.4 交叉销售

2.4.1 关联规则

2.4.2 序列模式

第3章 识别类模型

3.1 申请反欺诈

3.1.1 决策树

3.1.2 集成算法

3.1.3 K最近邻域算法

3.1.4 朴素贝叶斯

3.1.5 支持向量机

3.1.6 神经网络

3.2 违规行为识别

3.2.1 孤立森林

3.2.2 局部异常因子

第4章 优化分析类模型

4.1 预测技术

4.1.1 基于动力模型的ARIMA

4.1.2 基于深度学习的LSTM

4.2 运筹优化

4.2.1 线性规划

4.2.2 整数规划

4.2.3 非线性规划

4.3 流程挖掘

4.3.1 业务流程挖掘的总体理念

4.3.2 流程发现

4.3.3 流程监控

4.3.4 流程遵循

4.3.5 Python案例:利用PM4PY进行流程挖掘

第5章 预测类模型的参数调优

5.1 模型参数优化的方法

5.1.1 网格搜索

5.1.2 随机搜索

5.1.3 其他搜索方法

5.1.4 随机搜索优化实践

5.2 选择最佳模型算法的方法

5.3 将数据预处理加入模型选择

5.4 并行化加速模型的选择

5.5 建模门槛值优化的方法

第6章 特征工程

6.1 特征工程概述

6.2 数据预处理

6.2.1 错误值处理

6.2.2 异常值处理

6.2.3 缺失值填补

6.2.4 二值化

6.2.5 离散化

6.2.6 哑编码

6.2.7 标准化

6.2.8 规范化

6.3 特征构造

6.4 特征选择

6.4.1 过滤式

6.4.2 包裹式

6.4.3 嵌入式

6.5 特征转换

6.5.1 线性特征转换

6.5.2 非线性特征转换

6.5.3 特征转换小结

第7章 类别不平衡问题

7.1 不平衡数据概述

7.2 传统学习方法在不平衡数据中的局限性

7.3 类别不平衡所造成的问题

7.4 类别不平衡问题的处理方法

7.4.1 过采样与欠采样技术

7.4.2 数据合成

7.4.3 模型惩罚技术

第3篇 管理篇

第8章 机器学习研发运营一体化(MLOps)

8.1 MLOps的背景

8.2 MLOps的机器学习建模工作流程

8.2.1 数据工程

8.2.2 模型工程

8.2.3 模型部署

8.3 MLOps的设计框架

8.3.1 版本管理

8.3.2 测试

8.3.3 模型持续部署

8.3.4 模型持续监控

8.3.5 自动化

第9章 模型生命周期管理

9.1 模型生命周期概念

9.1.1 模型开发

9.1.2 模型上线

9.1.3 模型退役

9.2 模型管理

9.2.1 外部和本地模型导入

9.2.2 模型的预测和检验

9.2.3 模型的监控和迭代

9.3 模型服务

9.3.1 实时服务

9.3.2 批量服务

9.3.3 准实时服务

9.4 工作流管理

9.5 权限管理

累计评论(条) 个书友正在讨论这本书 发表评论

发表评论

发表评论,分享你的想法吧!

买过这本书的人还买过

读了这本书的人还在读

回顶部