信用风险评估评分卡建模方法及原理| 学习笔记

本文涉及的产品
模型训练 PAI-DLC,5000CU*H 3个月
模型在线服务 PAI-EAS,A10/V100等 500元 1个月
交互式建模 PAI-DSW,5000CU*H 3个月
简介: 快速学习信用风险评估评分卡建模方法及原理。

开发者学堂课程【场景实践 - 机器学习-信用风险评估评分卡建模方法及原理信用风险评估评分卡建模方法及原理】学习笔记,与课程紧密联系,让用户快速学习知识。

课程地址:https://developer.aliyun.com/learning/course/443/detail/5451


信用风险评估评分卡建模方法及原理

 

目录:

一、什么是评分卡

二、评分卡的重要组成部分

三、PAI 建模流程

四、分箱

五、评分卡模型概览

六、评分卡训练-分数 Scaling

七、评分卡训练 -Stepwise 变量选择

八、最大似然估计分析表

九、模型拟合统计量

十、评分卡分群

十一、变量约束条件

十二、其他模型评估指标

十三、样本稳定指数(PSI)

 

一、什么是评分卡?

评分卡是信用风险评估领域常用的建模方法。

评分卡并不简单对应于某一种机器学习算法,而是一种通用的建模框架,将原始数据通过分箱后进行特征工程变换,继而应用于线性模型进行建模的一种方法。最后我们还会对此评估。

评分卡不仅可以在信用风险评估领域应用,还会在其他领域使用。

例如:在芝麻信场景里面可能评分卡对一些用户的评分;在微贷可以对客户的风险进行评分;在客服领域会对客服质量做打分;在交通管理邻域会对驾驶员的综合素质进行打分;其实评分卡是一个建模的套件。

 

二、评分卡的重要组成部分

分箱:等频(根据特征的原始数据进行排序之后根据分位点切出来 n 个分箱)、等宽(按照数据的值域分为 n 个分箱)、自动(是一种动态规划的算法,通过他的分箱结果,保证每个 WOE 值有一个单调项的趋势)

特征工程:

(在分箱结束后,我们会用分箱的结果对原始的数据做一个特征工程,这是两个方面)

(1)离散化:将一个特征通过分箱结果把他理想化为 n 个特征

(2)WOE:应运特征在某一个分箱 WOE 值来替换特征原有的原始值

(这些数据会应运到线性模型内这就是模型的训练了)

3、线性模型:

(1)逻辑回归:使用较多

(2)线性回归

整个训练完成后会对训练数据或者预测数据进行评估预测、打分,打分后会使用一个评估组卷,对打分结果进行评估,看一下模型的性能。评估组件支持许多评估指标,包括AUC、K-S、Lift Chart、Gain Char

4、评估:AUC/K-S/Lift Chart/Gain Chart...

 

三、PAI 建模流程

首先我们用一个数据输入的节点,把这个的节点输出到拆分组件,把原始的数据拆分成两个数据集,一个是训练集,一个是测试集。接下来再把训练集接到分箱的组件内,对它进行分箱。

分箱完成后会把原始数据和分箱完成后的数据,分箱的结果记录到评分卡的训练里面去。评分卡的训练组件会做特征工程,然后去做训练。

现在举三个例子:

1、离散化评分卡训练,训练完成后会对评分卡进行预测、打分,之后进行二分类的评估。

2、WOE 评分卡训练

3、stepwise WOE

 

四、分箱

在运行完成之后点击在组件上点击右键在弹出的菜单内选择我要分箱即可看到变量的分箱列表。

点进其中的一个列表就可以看到变量分箱的详细信息。包含右侧的统计信息(和具体的分箱逻辑没有关系,他是对分箱完成以后,在分箱的基础上进行统计,包括每一个分箱有多少个样本,给用户做参考);左侧的是分箱的相关的重要信息,每一个箱的值域是多少;中间还有一些相关的图表。

这个页面可以对分箱做灵活的操作,比如说自动分箱分完后,可以给用户提供丰富的调整策略,包括分箱的合并,分箱的拆分,还有一些灵活的自定义分箱。

点击分箱上面的图表,可以看到表量在每一个分箱内数据分布的情况,包括WOE的曲线等等

 

五、评分卡模型概览

image.png

当训练完成后会产出评分卡模型,在模型的组件上点击右键,

点击查看模型报告,就可以看到上面这个键面。

上面的图包含整个模型卡的信息:

最右边红色的方框,与模型无关的统计信息。是单纯的统

计信息,与模型训练没有关系。右边的框是方便用户对比看

训练集和测试集的趋势是否一致,分布是否一致。

中间黑色的方框与模型相关,第一列是原始权重,也就是参数的权重;比如说用逻辑回归完成之后每一个变量对应一个 wait 这个 wait 就是 unscathed,没有做过任何处理的。右面的一列是通过一条标准线把一个浮点数转化成一个整数,整数可能实际对应到评分卡内的分数,对某一用户的加分减分。

最上面的截距项在评分卡训练中加了一些内在的约束。后面有些 WOE 的值、 MC。

左面的红色框是一个约束的信息,某一个变量大于另外一个变量,对应到评分卡就是这一个加分大于另一个,会有一个业务上的需求。

4、在最左侧是包括了一些变量的基本信息,变量的列表、分箱等等。

 

六、评分卡训练-分数 Scaling

1、为什么需要 scaling weight?

在平时输出的分数可能是一个很小的负点数,对于用户来说没有直观意义,我们需要把他转化为一个分数,对应到某一个场景内,他们能够理解的分数。

例如:芝麻信用分(出来的可能是一个概率,需要把概率转换成能够理解的分数)

2、三个参数(三个参数确定三条标准线,两个点可以确定一条直线,那这两个点是通过三个参数来确定的,三个参数分别是什么呢?):

(1)给定参数的基准点,指定风险值.在训练过程中通过指定 Scaling 信息将模型weight 转换成整形的分数。

(2)odds 在给定的分数基准点处的 odds 值

(3)pdo(Point Double Odds)分数送了多少分,odds 会加倍。

公式:

Log(odds)=log(image.png)=image.png=a·score+b (a 是 unscaled weight;b 是scaled weight)

a =image.png

b =log(odds)-a×scaled_value

如 : {"scaledValue":800, odds" :40, pdo:28}

 

七、评分卡训练-Stepwise 变量选择

变量选择的标准为 Marginal Contribution,某变量的 MC

定义为将该变量放入模型目标函数值所产生的变化。

1、最大步长

2、选中变量的 MC 阈值

3、移除变量的 MC 阈值

4、并行度(值越大,辨识度越高)这个特征选择与其他略有不同,scar 是统计分析软件,更多专注于统计领域的指标。MC 更偏向学习领域的指标。

 

八、最大似然估计分析表

最大似然分析和相关的统计有相似之处,许多软件在统计完之后会输出统计信息,这个表内有一些估计值,参数值,标准物,估计的误差等等。

 

九、模型拟合统计量

可以查看模型最终拟合的程度,其实是一些值的相关变化,和一些常用的指标AIC,SC 等等。

AIC=-2log(L)+2r

SC=-2log(L)+r log(n)

 

十、评分卡分群

1、(并不是评分卡的重要组成部分,是一个高级的功能。)

(1)决策树与评分卡的结合

(2)自动搜索对整体人群性能带来提升的分群分裂点

(3)决策树的每个叶子节点上构建一个评分卡模型

(4)可选择用于评测整体人群性能的指标(AUC/KS)(目的十分直接)

评分卡与决策树的一些性质相似。约束条件、叶子节点最大样本数。

右面的图是评分卡建模的流程,先通过分箱,接一个评分卡的分群和评分卡的训练是类似的。

再接一个预测组件最后对人群做一个评估,打分。在打分的结果做一个二分类的评估,做一个性能的评估。

2、下面的图就是一个评分卡分群的一个结果图,在评分卡分群运行完成后,在这个组件上点击右键,点查看模型报告。

这是一个决策树,从根节点到叶子节点就是一个决策树的规则路径,走到这个路径就是符合这个规则的人群,现在图中有8个节点,每个叶子节点都分别对应了一个小的评分卡模型,点击叶子节点就会看到一个评分卡模型。

image.png


十一、变量约束条件

1、为什么需要对变量施加约束?

2、在哪里可以对变量施加约束?

3、可以对变量施加什么样的约束?

4、变量约束在算法层面如何实现?

为什么需要对变量施加约束?

约束一般是为了满足在金融场景里面对强解释性的需求,比如说下面的图:当用户在某一个数据分箱完了之后,可能会出现 n 个箱,都会有 woe 值,会有一个 woe 的趋势图。

对于在训练过程而言,训练过程中变量和变量之间有一些细微的相关性,会导致训练出来的模型内,并不能满足模型的 weight 也符合这个趋势,这样会对解释性造成很大的困扰。WOE 大的分箱反而分数会低,这样对解释性不太友好,因此最好两个趋势一致。

还有一些情况可能会有相关业务上的强制性的一些要求。

变量约束只是针对于理想化情景而言的,约束是施加在每一个变量的分箱上的。如果选择的不是理想化的功能,选择其他的,就没有变量约束这件事了。

离散化、可解释性、特殊业务需求

image.png

在哪里可以对变量施加约束?

分箱列表中间会有一个 constraint,选择对一个变量世施加什么样的约束。

右侧提供约束的自动化设置方法。

分箱组件->右键“我要分箱”

分箱变量会自动保存

变量约束在算法层面如何实现?

1、变量约束通过带优化的优化算法来实现

2、PAI评分卡支持多种优化算法

3、无约束优化算法:Newton’s Method(牛顿法,适合小规模,速度快)/L-BFGS(开销低,规模大,广告搜索)

4、有约束优化算法:Barrier Method/SQP(Active Set Method)不施加约束时与牛顿法等价。

 

十二、其他模型评估指标

image.png

目前PAI平台支持ROC曲线/KS曲线/Lift曲线/Gain曲

线/Precision Recall曲线,参考组件“二分类评估”。可以看到每一个曲线的详细信息;另外也可以做分组评估,数据表内可能有很多个分组,对每一个分组可以计算相关的指标。

在对模型训练完之后,对模型做一个预测打分,对打分结果会做一个二分类的评估。

 

十三、样本稳定指数(PSI)

模型在这次部署以及上次部署是否同样稳定,我们可能希望分布变化不要太大,通常情况下,会用表格做分布图,直观的看分布,这种方法不能量化,不能自动化的监控,所以我们会检测PSI指标。

样本稳定指数是在分险评分中经常使用的用于评估样本分

布稳定度的指标。

相关实践学习
使用PAI-EAS一键部署ChatGLM及LangChain应用
本场景中主要介绍如何使用模型在线服务(PAI-EAS)部署ChatGLM的AI-Web应用以及启动WebUI进行模型推理,并通过LangChain集成自己的业务数据。
机器学习概览及常见算法
机器学习(Machine Learning, ML)是人工智能的核心,专门研究计算机怎样模拟或实现人类的学习行为,以获取新的知识或技能,重新组织已有的知识结构使之不断改善自身的性能,它是使计算机具有智能的根本途径,其应用遍及人工智能的各个领域。 本课程将带你入门机器学习,掌握机器学习的概念和常用的算法。
相关文章
|
6月前
|
机器学习/深度学习 数据采集 搜索推荐
多模型DCA曲线:如何展现和解读乳腺癌风险评估模型的多样性和鲁棒性?
多模型DCA曲线:如何展现和解读乳腺癌风险评估模型的多样性和鲁棒性?
153 1
|
6月前
|
机器学习/深度学习 安全
一文读懂分类模型评估指标
模型评估是深度学习和机器学习中非常重要的一部分,用于衡量模型的性能和效果。本文将逐步分解混淆矩阵,准确性,精度,召回率和F1分数。
458 1
|
6月前
|
编解码 算法 数据挖掘
【数据挖掘】聚类趋势估计、簇数确定、质量测定等评估方法详解(图文解释 超详细)
【数据挖掘】聚类趋势估计、簇数确定、质量测定等评估方法详解(图文解释 超详细)
140 0
|
17天前
|
机器学习/深度学习 数据采集 数据挖掘
特征工程在营销组合建模中的应用:基于因果推断的机器学习方法优化渠道效应估计
因果推断方法为特征工程提供了一个更深层次的框架,使我们能够区分真正的因果关系和简单的统计相关性。这种方法在需要理解干预效果的领域尤为重要,如经济学、医学和市场营销。
41 1
特征工程在营销组合建模中的应用:基于因果推断的机器学习方法优化渠道效应估计
|
4月前
|
机器学习/深度学习 Python
贝叶斯分析与决策理论:用于确定分类问题决策点的应用
在分类问题中,一个常见的难题是决定输出为数字时各类别之间的切分点
59 9
贝叶斯分析与决策理论:用于确定分类问题决策点的应用
|
5月前
|
机器学习/深度学习 算法 数据可视化
【机器学习】分类与预测算法的评价与优化
【机器学习】分类与预测算法的评价与优化
93 0
|
6月前
|
机器学习/深度学习 数据可视化 算法
R语言神经网络与决策树的银行顾客信用评估模型对比可视化研究
R语言神经网络与决策树的银行顾客信用评估模型对比可视化研究
|
6月前
|
数据可视化 数据挖掘
singleCellNet(代码开源)|单细胞层面对细胞分类进行评估,褒贬不一,有胜于无
`singleCellNet`是一款用于单细胞数据分析的R包,主要功能是进行细胞分类评估。它支持多物种和多分组分析,并提供了一个名为`CellNet`的类似工具的示例数据集。用户可以通过安装R包并下载测试数据来运行demo。在demo中,首先加载查询和测试数据,然后训练分类器,接着进行评估,包括查看准确率和召回率的曲线图、分类热图和比例堆积图等。此外,`singleCellNet`还支持跨物种评估,将人类基因映射到小鼠直系同源物进行分析。整体而言,`singleCellNet`是一个用于单细胞分类评估的综合工具,适用于相关领域的研究。
86 6
|
6月前
|
存储 资源调度 数据可视化
R语言STAN贝叶斯线性回归模型分析气候变化影响北半球海冰范围和可视化检查模型收敛性
R语言STAN贝叶斯线性回归模型分析气候变化影响北半球海冰范围和可视化检查模型收敛性
|
6月前
|
数据采集 数据挖掘
多维因素与学生辍学风险预测附录
多维因素与学生辍学风险预测附录