万本电子书0元读

万本电子书0元读

顶部广告

Python金融大数据风控建模实战:基于机器学习电子书

结合机器学习算法,行信用评分卡模型的构建 手把手带领读者零门槛学习金融领域的风险控制 理清业务:立足业务场景,深剖析金融大数据风控建模的全流程 算法精讲:详解算法原理,系统梳理不同算法的异同与应用场景 代码实践:提供完整的源代码和详细的代码注释,带领读者动手实践 项目实战:以真实数据为基础,通过实际项目从0到1行全流程实战 《Python金融大数据风控建模实战:基于机器学习》精华内容:

售       价:¥

纸质售价:¥82.10购买纸书

65人正在读 | 0人评论 6.5

作       者:王青天,孔越

出  版  社:机械工业出版社

出版时间:2020-05-01

字       数:28.9万

所属分类: 科技 > 计算机/网络 > 程序设计

温馨提示:数字商品不支持退换货,不提供源文件,不支持导出打印

为你推荐

  • 读书简介
  • 目录
  • 累计评论(0条)
  • 读书简介
  • 目录
  • 累计评论(0条)
本书的定位是一本Python金融大数据风控建模的门级读物。全书包括4篇:背景篇旨在由浅深地引领读者走金融科技领域,了解智能风控,系统、全面地认识评分卡;基础篇围绕评分卡构建的全流程,向读者一一讲述每个环节的理论知识,随之行代码实践,帮助读者获得从0至1构建评分卡模型的工程能力;阶篇旨在从建模中可能遇到问题出发,提供一些问题解决或模型提升的思路,使建立的评分卡具有更好的业务适应及预测能力;实战篇结合真实信贷场景的数据集,带领读者完成从数据分析至评分卡生成的各个流程,旨在让读者体验真实场景,具备评分卡实战能力,亦可作为读者实际工作中构建评分卡的参考。本书适合有一定Python语言基础的金融风控相关技术人员阅读,也适合想要了解人工智能如何在金融场景应用的发及业务人员。另外,也适合专业培训机构的学员和相关专业的学生。<br/>
目录展开

前言

第1篇 智能风控背景

第1章 金融科技介绍

1.1 金融科技的前世今生

1.2 金融科技正深刻地改变和塑造着金融业态

1.3 新兴科技不断强化金融科技的应用能力

1.4 金融风险控制面临着前所未有的挑战

1.5 智能风控和评分卡

1.6 评分卡模型的开发流程

第2章 机器学习介绍

2.1 机器学习的概念

2.2 机器学习的分类

2.2.1 有监督学习

2.2.2 无监督学习

2.2.3 强化学习

2.3 机器学习与人工智能的关系

2.4 机器学习与数学的关系

2.5 机器学习与深度学习

第3章 评分卡模型介绍

3.1 申请评分卡

3.1.1 数据获取

3.1.2 好坏样本定义

3.1.3 观察期与表现期确定

3.1.4 样本分层

3.1.5 数据清洗与预处理

3.1.6 特征工程

3.1.7 模型训练与优化

3.2 行为评分卡

3.2.1 数据获取

3.2.2 时间窗口

3.2.3 特征工程

3.3 催收评分卡

3.3.1 催收评分卡分类

3.3.2 催收策略

3.4 反欺诈模型

3.4.1 欺诈风险与信用风险比较

3.4.2 欺诈模型好坏样本定义

3.4.3 欺诈主体分析

3.4.4 反欺诈方法介绍

第2篇 评分卡理论与实战基础

第4章 数据清洗与预处理

4.1 数据集成

4.2 数据清洗

4.3 探索性数据分析

4.4 Python代码实践

4.4.1 数据集成

4.4.2 数据清洗

4.4.3 探索性数据分析

第5章 变量编码方法

5.1 无监督编码

5.1.1 One-hot编码

5.1.2 Dummy variable编码

5.1.3 Label编码

5.2 有监督编码

5.2.1 WOE编码

5.2.2 WOE编码与One-hot编码比较

5.3 Python代码实践

5.3.1 One-hot编码

5.3.2 Dummy variable编码

5.3.3 Label编码

5.3.4 WOE编码

第6章 变量分箱方法

6.1 变量分箱流程

6.2 最优Chi-merge卡方分箱方法

6.3 Best-KS分箱方法

6.4 最优IV分箱方法

6.5 基于树的最优分箱方法

6.6 Python代码实践

6.6.1 最优Chi-merge分箱

6.6.2 最优IV分箱

6.6.3 基于树的分箱

第7章 变量选择

7.1 过滤法变量选择

7.2 包装法变量选择

7.3 嵌入法变量选择

7.4 Python代码实践

7.4.1 过滤法变量选择

7.4.2 包装法变量选择

7.4.3 嵌入法变量选择

第8章 Logistic回归模型

8.1 Logistic回归模型原理

8.2 过拟合与欠拟合

8.3 Python代码实践

第9章 模型的评估指标

9.1 正负样本的选择

9.2 标准评估指标

9.3 概率密度评估指标

9.4 概率分布评估指标

9.5 Python代码实践

第10章 评分卡分数转化

10.1 由概率到分数的转换

10.2 变量的分值计算

10.3 评分卡性能评估

10.4 Python代码实践

第11章 模型在线监控

11.1 稳定性监控

11.2 单调性监控

11.3 性能监控指标

11.4 Python代码实践

第3篇 评分卡理论与实战进阶

第12章 样本不均衡处理

12.1 数据层下采样样本不均衡的处理方法

12.1.1 随机下采样方法

12.1.2 样本邻域选择的下采样方法

12.1.3 样本邻域清理的下采样方法

12.1.4 Bagging集成的下采样方法

12.1.5 Boosting集成的下采样方法

12.2 数据层上采样样本不均衡的处理方法

12.2.1 随机上采样方法

12.2.2 SMOTE样本生成方法

12.2.3 Borderline-SMOTE样本生成方法

12.3 算法层样本不均衡的处理方法

12.4 模型评估层样本不均衡的处理方法

12.5 Python代码实践

12.5.1 数据层下采样样本不均衡处理代码实现

12.5.2 数据层上采样样本不均衡处理代码实现

第13章 特征工程进阶

13.1 数据层特征工程

13.2 算法层特征工程

13.2.1 基于树模型的特征生成

13.2.2 FM特征交叉

13.3 Python代码实践

13.3.1 数据层特征工程代码实现

13.3.2 算法层特征工程代码实现

第14章 决策树模型

14.1 决策树模型的原理

14.2 决策树学习

14.3 决策树与过拟合

14.4 Python代码实践

第15章 神经网络模型

15.1 神经元模型

15.2 神经网络的网络结构

15.3 神经网络的学习策略

15.4 Python代码实践

第16章 支持向量机模型

16.1 感知器模型

16.1.1 感知器模型的原理

16.1.2 感知器与支持向量机模型

16.2 线性可分支持向量机

16.3 线性支持向量机

16.4 非线性支持向量机

16.5 感知器相关模型比较

16.6 Python代码实践

16.6.1 线性支持向量机模型代码实现

16.6.2 非线性支持向量机模型代码实现

第17章 集成学习

17.1 Bagging与Boosting对比

17.2 Random Forest模型原理

17.3 Adaboost模型原理

17.4 GBDT模型原理

17.5 Xgboost模型原理

17.6 Python代码实践

17.6.1 Random Forest模型

17.6.2 Adaboost模型

17.6.3 GBDT模型

17.6.4 Xgboost模型

第18章 模型融合

18.1 Blending方法原理

18.2 Stacking方法原理

18.3 Python代码实践

18.3.1 Blending模型融合代码实现

18.3.2 Stacking模型融合代码实现

第4篇 Lending Club数据集实战

第19章 完整的模型开发实现

19.1 数据源介绍

19.2 数据的获取与预处理

19.2.1 数据准备

19.2.2 好坏样本定义

19.2.3 数据清洗与预处理

19.3 特征工程

19.3.1 简单的特征工程

19.3.2 变量分箱与编码

19.3.3 变量选择

19.4 模型构建与评估

19.4.1 模型构建与优化

19.4.2 模型评估

19.5 评分卡生成

附录A 主要符号表

附录B 开发环境简介

参考文献

累计评论(0条) 0个书友正在讨论这本书 发表评论

发表评论

发表评论,分享你的想法吧!

买过这本书的人还买过

读了这本书的人还在读

回顶部