DataScience&ML:金融科技领域之风控场景之风控指标/字段相关概念、口径逻辑之详细攻略

简介: DataScience&ML:金融科技领域之风控场景之风控指标/字段相关概念、口径逻辑之详细攻略


目录

风控指标/字段相关概念、口径逻辑

基础指标

深度指标


风控指标/字段相关概念、口径逻辑

基础指标

名称

英文

含义/口径逻辑

举例

账龄

Month on Book,MOB

指资产放款月份。类似于婴孩一出生就有了年龄,一旦申贷订单被放款,也便拥有了账龄和生命周期

T1、以自然月底为末点

MOB0:放款日至当月月底

MOB1:放款后第二个完整的月份

MOB2:放款后第三个完整的月份

MOB的最大值取决于信贷产品期限。如果是12期产品,那么该资产的生命周期是12期,MOB最大到MOB12。

例如,2019年11月13日放款的订单,2019年11月是MOB0,2019年12月是MOB1,以此类推。

T2、以过一个自然月为末点

例如放款日期为2018.3.5号,则MOB1为2018.3.5-2018.4.5,MOB2为2018.4.5-2018.5.5。

T1的统计方法关注的是固定时间节点的用户的具体表现T2的的统计方法关注的是用户具有统一的表现期

逾期天数

Days Past Due,DPD

逾期天数,自还款日次日起到实还日期间的天数。

逾期天数 = 实际还款日 - 应还款日。

DPDN+:表示逾期天数 >= N天;

DPD30+:表示逾期天数 >=30天的资产;

例如,若还款日是每月8号,那么9号就是逾期第一天。如果客户在10号还款,那么逾期2天。

首次还款逾期 FPD,First Payment Deliquency 即用户放款通过后,首笔需要还款的账单的逾期情况。 例如FPD7+指标计算的是用户首期还款日到期后逾期7天及以上,对于反欺诈建模来说,常利用FPD15+,FPD30+等指标作为训练目标。

逾期期数

Month

指实际还款日与应还款日之间的逾期天数,并按区间划分后的逾期状态。(注:不同机构所定义的区间划分可能存在差异)

M0:当前未逾期(或用C表示,取自Current)

M1: 逾期1~30日;

M2:逾期31~60日;

M3:逾期61~90日;

M4:逾期91~120日;

M5:逾期121~150日;

M6:逾期151~180日;

M7:逾期180日以上;此时也被称为呆账(Bad Debts),会予以注销账户(write-off)

资产分池 金融领域专有名词,分池是指将同质、风险特征类似的债项放至同一个组合或资产池(Pooling)中,并一致估计资产池的巴塞尔风险参数,包括违约概率PD、违约损失率LGD和违约风险暴露(一般指信用卡,包含EAD和CCF两部分)。 信贷的三类分池场景:PD、LGD、EAD的分池。
违约概率模型

probability of default, PD,

PD模型

违约概率是指借款人在未来一定时期内发生违约的可能性。

客户风险预警系统在商业银行信用风险管理中,违约概率是指借款人在未来一定时期内不能按合同要求偿还银行贷款本息或履行相关义务的可能性。

违约概率是计算贷款预期损失、贷款定价以及信贷组合管理的基础,因此如何准确、有效地计算违约概率对商业银行信用风险管理十分重要。

深度指标

待更新……

目前我国商业银行建立违约概率(PD)模型的主流方法是(逻辑回归模型),该方法采用一组财务指标作为解释变量来预测客户的违约概率。

在信用风险管理领域,比较常见的违约概率模型包括逻辑回归模型、RiskCalc模型、KMV的Credit Monitor模型、风险中性模型、死亡率模型。逻辑回归模型是我国商业银行建立违约概率(PD)模型的主流方法之一,该方法采用一组财务指标作为解释变量来预测客户的违约概率。


相关文章
|
数据采集 SQL 运维
巧用指标平台DataIndex,五步法轻松实现指标管理
在业务发展初期,企业需要做好规范的指标管理,以保证随着业务的不断发展,数据化决策能够成为业务强有力的支撑。本文将为大家详解如何通过袋鼠云指标管理平台DataIndex 进行规范化的指标开发管理,轻松开发指标,避免各类指标问题。
1008 0
|
存储 SQL 机器学习/深度学习
用户画像标签体系——从零开始搭建实时用户画像(三)
用户画像标签体系——从零开始搭建实时用户画像(三)
2826 0
用户画像标签体系——从零开始搭建实时用户画像(三)
|
8月前
|
数据采集 存储 数据挖掘
基于 StarRocks 的风控实时特征探索和实践
【6月更文挑战第9天】StarRocks 是一款高性能分析型数据库,适用于风控实时特征处理,提供快速数据分析,助力企业高效准确的风控决策。通过建立适合的数据模型,收集整合实时特征数据,并利用 StarRocks 的实时加载与查询功能,企业能实时计算风险指标。同时,确保数据准确性、一致性和完整性,以及进行性能优化,是实现高效风控的关键。随着业务发展,持续优化 StarRocks 应用将帮助企业应对复杂风险挑战,推动健康发展。
159 8
|
9月前
|
存储 搜索推荐 分布式数据库
用户画像标签系统体系解释
用户画像标签系统体系解释
390 1
|
数据采集 数据建模 BI
数据中台实战(05)-如何统一管理纷繁杂乱的数据指标?
数据中台实战(05)-如何统一管理纷繁杂乱的数据指标?
511 1
|
存储 SQL 搜索推荐
【送书】从不了解用户画像,到用画像数据赋能业务看这一本书就够了丨《用户画像:平台构建与业务实践》
【送书】从不了解用户画像,到用画像数据赋能业务看这一本书就够了丨《用户画像:平台构建与业务实践》
|
数据采集 监控 数据管理
数据质量最佳实践(5):利用质量分和排行榜提升企业数据质量【Dataphin V3.12】
在数据质量最佳实践(3):通过质量治理工作台,实现质量问题的跟踪和处理这篇文章中,我们详细的介绍了如何通过治理工作台,对系统出现的一个一个具体质量问题进行治理。 但是对于企业整体的数据质量情况,我们该如何评估呢?以及如何寻找当前企业的数据质量短板,并有针对性的进行改进和提升呢? 在Dataphin V3.12版本中,质量新增了质量分的能力,可以给数据表和质量规则配置打分权重和打分方式,从而获得全局、数据源、项目、负责人、数据表等维度的质量打分评估,帮助CDO判断企业整体的数据质量情况和数据质量问题的分布,从而有针对性的提升企业整体的数据质量水平。
897 1
|
数据采集 SQL 监控
开源大数据分析实验(3)——简单用户画像分析之配置数据质量监控
本场景主要介绍基于海量日志数据进行简单用户画像分析为背景,如何通过使用DataWorks完成数据采集 、加工数据、配置数据质量监控和数据可视化展现等任务。
|
机器学习/深度学习 数据可视化 TensorFlow
【2023年最新】提高分类模型指标的六大方案详解
【2023年最新】提高分类模型指标的六大方案详解
294 0
|
机器学习/深度学习 分布式计算 并行计算
大数据开发,如何发掘数据的关系?
数据之中蕴藏关系,数据量足够大,这种关系越逼近真实世界客观规律。 网页之间链接关系蕴藏着网页重要性排序关系,购物车商品清单蕴藏着商品关联关系,通过对这些关系的挖掘,可帮助我们更清晰世界规律,并利用规律提高生产效率,改造世界。
134 0