这场评分卡模型直播解答了我对于信贷风险的大部分疑问

简介: 8月4日下午15:00顶象第三期业务安全大讲堂正式开讲。本期业务安全大讲堂由顶象研发总监管胜老师进行分享,针对信贷风控,管胜老师就评分卡模型做了深入浅出的讲解,深刻剖析了评分卡模型的原理、如何构建评分卡模型以及评分卡模型如何评估、应用、跟踪等问题,不仅让大家对信用贷有了更深的理解,同时对评分卡模型的构建产生了极大关注度。

8月4日下午15:00顶象第三期业务安全大讲堂正式开讲。本期业务安全大讲堂由顶象研发总监管胜老师进行分享,针对信贷风控,管胜老师就评分卡模型做了深入浅出的讲解,深刻剖析了评分卡模型的原理、如何构建评分卡模型以及评分卡模型如何评估、应用、跟踪等问题,不仅让大家对信用贷有了更深的理解,同时对评分卡模型的构建产生了极大关注度。

直播过程中,我们也收到了一系列关于评分卡模型的疑问,现将部分问答整理出来,供大家参考。感兴趣的同学也可关注顶象公众号或视频号回看直播重点。

Q1.png

Q1:评分卡模型为什么要做筛选特征,使用更多特征不是更好吗?

管胜:这个问题非常好,从算法的推理来看,特征越多模型的效果会越好,但是要注意,这个好可能仅仅发生在训练集上,对于测试集可能就不好了,它跟特征分箱是同一个道理,箱分得越细越多,过拟合的风险就越大,特征越多同样也会存在过拟合的风险,

除了过拟合的风险外,还有几个坏处:

  • 让模型变得更复杂,解释性变差。
  • 引入特征越多,模型上线的难度越大,在线上收集特征可能不容易。
  • 特征可能会波动,特征越多,整体模型的波动性也会更大,导致模型的稳定性下降。

Q2:PSI 对评分卡的稳定性监控很重要,你们是怎么实现的?

管胜:模型的开发阶段与应用监控阶段是分开的,数据也是分开的,开发阶段采用的是离线数据,应用阶段是实时数据,而做PSI监控,需要对2个数据集采用一致的方式进行分箱,然后计算2个数据集的PSI,要实现这个PSI对比,工程的难度会很大,在我们的产品实现上让算法人员开发的模型,无感知就自动支持PSI监控,把开发与应用做了集成。

  • 模型部署时,会自动将训练集的信息附带在模型中;
  • 模型在应用过程中,对应用样本集按训练集的方式进行分箱;
  • 每个月,对比一次计算出PSI。

Q3:分箱合并的过程,卡方检验合并与WOE合并,哪一种效果更好?

管胜:这是2种完全不同的分箱合并的思路,不过他们的共同点都是:有监督的,利用标签的信息来判断是否需要合并。

至于哪一种效果更好,其实并不能用公式来确定,需要根据实际的尝试才能知道,从实际的经验来看,两种效果的差距并不大。不过,WOE合并相对卡方检验来说,在复杂程度与应用上都更加简便。

Q4:评分卡的模型是怎么在风控体系使用的?

管胜:评分卡模型分为A卡、B卡、C卡,在信贷风控中,这3种使用最为久远与成熟。

A卡是贷前评分卡,也称为反欺诈评分卡,作为准入门槛使用。

B卡是贷中评分卡,借贷期间或信用卡使用期间,管理用户的风险与额度调整。

C卡是贷后评分卡,用于逾期催收借贷。

Q5:对机器学习、模型相关内容非常感兴趣,想往这个方向转,有推荐的书籍或者方法么?

管胜:首先还是要有一定的数学与统计学基础,对于传统机器学习来说,更多的都是统计学的知识,建议先学习概率论与数理统计,另外还需要学习线性代数。然后在实践中学习,安装python 与sklearn,查看算法的内部实现代码,特别要深入理解模型的训练与评估过程。对于深度学习,复杂的理论公式反而不多,建议多看引用量大的优秀Paper,学习更多的网络设计的原因与技巧。

Q6:我看您用的是自研的机器学习平台,内置了哪些算法呢?

管胜:已经封装好的算法组件有100+多个,涵盖:数据读写、特征工程、分类聚类回归算法、文本类算法、关联网络类算法、金融评分类算法、时序数据类算法、模型评估,另外还包括“人行征信特征衍生”组件,几乎可以解决任意场景建模的算法需求。

最后,再给大家简单介绍下顶象《业务安全大讲堂》系列直播课,本系列汇集业内大咖组建豪华讲师天团,剖析各类欺诈手段,详解前沿安全技术,帮助企业应对业务安全新风险。

Q2.png

下期将由顶象技术总监杜威为大家带来《业务安全平台核心模块解析——设备指纹》的主题课程,敬请期待!

相关文章
|
存储 缓存 算法
Python中collections模块的deque双端队列:深入解析与应用
在Python的`collections`模块中,`deque`(双端队列)是一个线程安全、快速添加和删除元素的双端队列数据类型。它支持从队列的两端添加和弹出元素,提供了比列表更高的效率,特别是在处理大型数据集时。本文将详细解析`deque`的原理、使用方法以及它在各种场景中的应用。
1002 4
|
移动开发 小程序
小程序-uniapp:URL Link / 适用于在移动端 从短信、邮件、微信外网页 等场景打开小程序任意页面
小程序-uniapp:URL Link / 适用于在移动端 从短信、邮件、微信外网页 等场景打开小程序任意页面
1367 0
|
数据挖掘 数据处理
ChatGPT在常用的数据分析方法中的应用(交叉分析)
ChatGPT在常用的数据分析方法中的应用(交叉分析)
313 1
|
JavaScript 前端开发
js中的bind,call,apply方法的区别以及用法
JavaScript中,`bind`、`call`和`apply`均可改变函数的`this`指向并传递参数。其中,`bind`返回一个新函数,不立即执行;`call`和`apply`则立即执行,且`apply`的参数以数组形式传递。三者在改变`this`指向及传参上功能相似,但在执行时机和参数传递方式上有所区别。
257 1
|
存储 搜索推荐 C语言
如何理解指针作为函数参数的输入和输出特性
指针作为函数参数时,可以实现输入和输出的双重功能。通过指针传递变量的地址,函数可以修改外部变量的值,实现输出;同时,指针本身也可以作为输入,传递初始值或状态。这种方式提高了函数的灵活性和效率。
|
前端开发
Flutter快速实现自定义折线图,支持数据改变过渡动画
Flutter快速实现自定义折线图,支持数据改变过渡动画
405 4
Flutter快速实现自定义折线图,支持数据改变过渡动画
|
存储 安全 芯片
内存卡无法格式化怎么办?这5个办法可以帮你
在日常生活中,我们常常使用内存卡来存储照片、视频、文档等重要数据。然而,有时候在尝试格式化内存卡时,我们可能会遇到无法格式化的问题。这种情况令人十分烦恼,因为这不仅影响了内存卡的使用,还可能导致数据丢失。那么,当内存卡无法格式化时,我们应该怎么办呢?本文将为您提供一些实用的解决方案,帮助您解决内存卡无法格式化的问题。
内存卡无法格式化怎么办?这5个办法可以帮你
|
机器学习/深度学习
YOLOv8改进 | 2023主干篇 | RepViT从视觉变换器(ViT)的视角重新审视CNN
YOLOv8改进 | 2023主干篇 | RepViT从视觉变换器(ViT)的视角重新审视CNN
853 1
YOLOv8改进 | 2023主干篇 | RepViT从视觉变换器(ViT)的视角重新审视CNN