为你推荐

内容简介
CDA,数智人才的身份认证
第1篇 理论篇
第1章 数据挖掘综述
1.1 企业中数据分析的层级
1.2 数据分析的过程
1.3 数据挖掘方法论
1.3.1 CRISP-DM方法论
1.3.2 SEMMA方法论
1.4 数据挖掘的核心思维
1.5 算法建模的4个要素
1.5.1 目标函数
1.5.2 学习策略
1.5.3 寻优方法
1.5.4 评估方法
1.6 算法模型分类介绍
1.6.1 预测性——有监督学习
1.6.2 描述性——无监督学习
1.7 数据挖掘落地场景框架
1.8 数据挖掘建模模型的评估
第2篇 技术篇
第2章 决策类模型
2.1 客户价值预测
2.1.1 线性回归模型概述
2.1.2 Python案例:线性回归建模
2.1.3 多元线性回归的变量筛选
2.1.4 Python案例:多元线性回归变量筛选
2.1.5 模型假设检验
2.1.6 残差分析
2.1.7 强影响点分析
2.1.8 Python案例:线性回归调优实践
2.1.9 线性回归建模的完整流程小结
2.1.1 0正则化
2.1.1 1 Python案例:岭回归与Lasso回归实战
2.2 营销响应预测
2.2.1 使用逻辑回归预测客户响应率
2.2.2 比较逻辑回归与线性回归
2.2.3 图解逻辑回归
2.2.4 逻辑回归模型概述
2.2.5 分类变量的处理
2.2.6 Python案例:逻辑回归建模实战
2.2.7 逻辑回归建模小结
2.3 细分画像
2.3.1 K-means聚类算法
2.3.2 基于密度的聚类算法
2.4 交叉销售
2.4.1 关联规则
2.4.2 序列模式
第3章 识别类模型
3.1 申请反欺诈
3.1.1 决策树
3.1.2 集成算法
3.1.3 K最近邻域算法
3.1.4 朴素贝叶斯
3.1.5 支持向量机
3.1.6 神经网络
3.2 违规行为识别
3.2.1 孤立森林
3.2.2 局部异常因子
第4章 优化分析类模型
4.1 预测技术
4.1.1 基于动力模型的ARIMA
4.1.2 基于深度学习的LSTM
4.2 运筹优化
4.2.1 线性规划
4.2.2 整数规划
4.2.3 非线性规划
4.3 流程挖掘
4.3.1 业务流程挖掘的总体理念
4.3.2 流程发现
4.3.3 流程监控
4.3.4 流程遵循
4.3.5 Python案例:利用PM4PY进行流程挖掘
第5章 预测类模型的参数调优
5.1 模型参数优化的方法
5.1.1 网格搜索
5.1.2 随机搜索
5.1.3 其他搜索方法
5.1.4 随机搜索优化实践
5.2 选择最佳模型算法的方法
5.3 将数据预处理加入模型选择
5.4 并行化加速模型的选择
5.5 建模门槛值优化的方法
第6章 特征工程
6.1 特征工程概述
6.2 数据预处理
6.2.1 错误值处理
6.2.2 异常值处理
6.2.3 缺失值填补
6.2.4 二值化
6.2.5 离散化
6.2.6 哑编码
6.2.7 标准化
6.2.8 规范化
6.3 特征构造
6.4 特征选择
6.4.1 过滤式
6.4.2 包裹式
6.4.3 嵌入式
6.5 特征转换
6.5.1 线性特征转换
6.5.2 非线性特征转换
6.5.3 特征转换小结
第7章 类别不平衡问题
7.1 不平衡数据概述
7.2 传统学习方法在不平衡数据中的局限性
7.3 类别不平衡所造成的问题
7.4 类别不平衡问题的处理方法
7.4.1 过采样与欠采样技术
7.4.2 数据合成
7.4.3 模型惩罚技术
第3篇 管理篇
第8章 机器学习研发运营一体化(MLOps)
8.1 MLOps的背景
8.2 MLOps的机器学习建模工作流程
8.2.1 数据工程
8.2.2 模型工程
8.2.3 模型部署
8.3 MLOps的设计框架
8.3.1 版本管理
8.3.2 测试
8.3.3 模型持续部署
8.3.4 模型持续监控
8.3.5 自动化
第9章 模型生命周期管理
9.1 模型生命周期概念
9.1.1 模型开发
9.1.2 模型上线
9.1.3 模型退役
9.2 模型管理
9.2.1 外部和本地模型导入
9.2.2 模型的预测和检验
9.2.3 模型的监控和迭代
9.3 模型服务
9.3.1 实时服务
9.3.2 批量服务
9.3.3 准实时服务
9.4 工作流管理
9.5 权限管理
买过这本书的人还买过
读了这本书的人还在读
同类图书排行榜