基于消费信用评估的风控

简介: 信用评估是被当前社会广泛关注的领域,特别是在金融行业,如果可以通过每个用户的历史交易数据以及用户画像数据确定用户的个人信用,将有助于银行设置个人借贷额度,确定潜在风险。本文将介绍在金融风控领域如何进行用户画像,使用什么样的算法可以计算出每个用户的信用指标。

业务背景

信用评估是被当前社会广泛关注的领域,特别是在金融行业,如果可以通过每个用户的历史交易数据以及用户画像数据确定用户的个人信用,将有助于银行设置个人借贷额度,确定潜在风险。本文将介绍在金融风控领域如何进行用户画像,使用什么样的算法可以计算出每个用户的信用指标。

业务痛点

评分卡是金融领域经典的计算用户信用的算法,目前许多金融机构缺少云端可处理大规模样本数据的评分卡算法。

解决方案

PAI平台提供了一套基于评分卡体系的分箱、样本稳定性评估、评分模型训练和评估算法

1.人力要求:需要具备基础的评分卡建模经验

2.开发周期:1-2天

3.数据要求:最好有超过千条的打标数据,数据包含用户历史交易数据和基本用户画像

数据说明

数据来自国外真实脱敏后的银行消费数据,一共包含30000条样本,其中正常还款的6636个样例,非正常还款23364个样例

特征数据:

参数名称 参数描述
ID 用户ID
LIMIT_BAL 目前用户的额度
SEX 1是男,2是女
EDUCATION 1研究生,2本科,3高中生,其它
MARRIAGE 1结婚,2单身,3其它
AGE 年龄
PAY_0 9月付款情况:-1 按时付钱,1迟付款一个月,2迟付款两个月......
PAY_2~PAY_6 同PAY_0,分拆每个月的付款情况
BILL_AMT1~BILL_AMT6 每个月的具体账单是多少
PAY_AMT1~PAY_AMT6 上个月偿还的金额是多少

目标数据:

参数名称 参数描述
payment_next_month 用户是否还款,1是还款,0是未还款

流程说明

进入PAI-Studio产品:https://pai.data.aliyun.com/console

该方案数据和实验环境已经内置于首页模板:

打开实验:

1.拆分

将输入数据集分为两部分,一部分用来训练模型,另一部分用来预测评估。

2.分箱

分箱组件类似于onehot编码,可以将数据按照分布映射成更高维度的特征。以age字段为例,分箱组件可以按照数据在不同区间的分布进行分箱操作,分箱结果如图所示。

最终分箱组件的输出如下图所示,每个字段都被分箱到多个区间上。

3.样本稳定指数PSI

样本稳定指数是衡量样本变化所产生的偏移量的一种重要指标,通常用来衡量样本的稳定程度。比如样本在两个月份之间的变化是否稳定。通常变量的PSI值在0.1以下表示变化不太显著,在0.1到0.25之间表示变化比较显著,大于0.25表示变量变化比较剧烈,需要特殊关注。

本案例中,综合比较拆分前后以及分箱结果的样本稳定程度,返回每个特征的PSI数值,如下图所示:

4.评分卡训练

评分卡训练的结果图如下所示:

评分卡的精髓是将复杂的模型权重用符合业务标准的分数表示。

  • intercepy:截距。
  • Unscaled:原始的权重值。
  • Scaled:分数更改指标,比如对于pay_0这个特征,如果特征落在(-1,0]之间分数就减29,如果特征落在(0,1]之间分数就加上27。
  • importance:每个特征对于结果的影响大小,数值越大表示影响越大。

5.评分卡预测

每个预测结果的最终评分,本案例中表示的是每个用户的信用评分。

总结

基于用户的信用卡消费记录,通过评分卡模型训练及评分卡预测得到了每个用户的最终信用评分,这个评分可以应用到各种贷款或者金融相关的征信领域中。

相关实践学习
使用PAI+LLaMA Factory微调Qwen2-VL模型,搭建文旅领域知识问答机器人
使用PAI和LLaMA Factory框架,基于全参方法微调 Qwen2-VL模型,使其能够进行文旅领域知识问答,同时通过人工测试验证了微调的效果。
机器学习概览及常见算法
机器学习(Machine Learning, ML)是人工智能的核心,专门研究计算机怎样模拟或实现人类的学习行为,以获取新的知识或技能,重新组织已有的知识结构使之不断改善自身的性能,它是使计算机具有智能的根本途径,其应用遍及人工智能的各个领域。 本课程将带你入门机器学习,掌握机器学习的概念和常用的算法。
目录
相关文章
|
4月前
|
敏捷开发 小程序 API
个人开发者福音!免资质免签名,API开箱即用- 阿里云「短信认证」上线
个人开发者接入短信验证码遇资质、审核、稳定性三大难题。阿里云推出极简方案:免企业资质、免签名报备,仅需实名认证即可快速集成,双11特惠低至3.99元/年。
944 1
|
11月前
|
Web App开发 人工智能 Android开发
5.3K star!硅基生命新纪元,这个开源数字人框架要火!
"只需3分钟视频素材,就能打造专属数字分身!" "开源免费商用,支持安卓/iOS/Web全平台运行" "法律咨询、虚拟陪伴、教育导师...解锁AI数字人无限可能"
1014 5
|
4月前
|
供应链 安全 物联网
2025年度工业互联网平台综合实力盘点:十大领先厂商深度解析与选型指南
2025年,工业物联网从“连接”迈向“价值”竞争。本文深度解析树根科技、华为云、阿里云等十大主流平台,聚焦连接能力、业务赋能与全球化部署,穿透技术参数,直击商业价值,助力企业精准选型,实现数字化转型战略突围。
1187 0
|
传感器 机器学习/深度学习 自动驾驶
未来出行的智能革命:自动驾驶技术的进展与挑战
自动驾驶技术正逐步改变我们的交通方式,从辅助驾驶到完全自动化,每一次技术跃迁都带来了新的可能。本文将探讨自动驾驶的发展历程、关键技术里程碑及其面临的主要挑战和未来趋势。
908 4
|
5月前
|
监控 Java 测试技术
JMeter 分布式压测指南:深入挖掘系统性能极限
本文针对单机压测的性能瓶颈,分享了JMeter分布式压测的实战经验。通过Master-Slave架构突破单机限制,结合Ansible实现高效节点管理,详细介绍了从需求分析、脚本设计到环境部署的全流程解决方案,为高并发性能测试提供实用指导。
|
人工智能 搜索推荐
数字孪生与体育:运动员表现分析
数字孪生技术在体育领域的应用正逐步改变运动员的训练和表现分析方式。通过创建虚拟模型,该技术能够实现个性化训练计划制定、比赛环境模拟、潜在伤害风险预测、技术动作精细化分析及团队战术布局模拟。结合AI技术,数字孪生为教练和运动员提供实时反馈和数据驱动的决策支持,助力提升竞技水平。
|
8月前
|
Oracle Java 关系型数据库
新手必看:Java 开发环境搭建之 JDK 与 Maven
本文分享了 Java 学习中 JDK 安装配置与 Maven 使用的入门知识,涵盖 JDK 下载安装、环境变量设置、Maven 安装配置及本地仓库与镜像设置,帮助新手快速搭建 Java 开发环境。
995 0
|
人工智能 安全 搜索推荐
未来移动操作系统的演变与挑战
随着科技的飞速发展,移动操作系统正经历着前所未有的变革。从早期的简单功能到如今的智能化、个性化定制,移动操作系统不仅极大地丰富了我们的生活,也不断推动着相关技术的突破。本文将探讨移动操作系统的未来发展趋势,包括人工智能、物联网的整合,以及面临的安全与隐私保护等挑战,旨在为读者提供一个全面而深入的视角,理解移动操作系统如何塑造我们的数字世界。
|
开发框架 前端开发 开发工具
一个小案例带你快速了解鸿蒙ArkUI的基本使用
一个小案例带你快速了解鸿蒙ArkUI的基本使用
905 124
|
Web App开发 缓存 Linux
高效Selenium测试技巧:轻松控制已开启的浏览器
【10月更文挑战第13天】在进行Selenium测试时,通常会启动新浏览器实例,但有时需要控制已开启的浏览器,以节省时间并更真实地模拟用户行为。这可通过设置Chrome为可远程控制并使用`Remote WebDriver`连接实现。需在启动Chrome时添加`--remote-debugging-port`参数,并通过Python脚本中的`webdriver.Remote`连接至指定端口。此外,还可利用会话ID(Session ID)重新连接浏览器,提高测试灵活性。需要注意浏览器版本兼容性及元素定位稳定性等问题,确保测试准确性和一致性。
1268 1