DataScience&ML:金融科技领域之迁徙率(Flow Rate)表的简介、案例应用之详细攻略

简介: DataScience&ML:金融科技领域之迁徙率(Flow Rate)表的简介、案例应用之详细攻略


目录

金融科技领域之迁徙率(Flow Rate)表的简介

迁徙率(Flow Rate)表案例应用—定义逾期天数-利用迁徙率(Flow Rate)表

1、概念定义

T1、先设置观察期,再看表现

T2、只看每个月的的账户在下个月的表现

2、迁徙率—案例理解

2.1、迁徙情况百分比关注重点

2.2、迁徙情况百分比的意义

2.3、提前预测90天后是否逾期


金融科技领域之迁徙率(Flow Rate)表的简介

        贷款迁徙率,经济学领域术语,计算方法为期初正常类贷款向下迁徙金额/(期初正常类贷款余额-期初正常类贷款期间减少金额)×100%。

迁徙率(Flow Rate)表案例应用—定义逾期天数-利用迁徙率(Flow Rate)表

通过下边的分析,可以确定目标里“逾期天数”—90天以上。过程如下:

1、概念定义

T1、先设置观察期,再看表现

推荐文章https://zhuanlan.zhihu.com/p/81027037

T2、只看每个月的的账户在下个月的表现

概念定义

时间窗口

每个时间窗口由一个月和下一个月的数据构成。例如我拿一年的数据,例如2019年,就有11个观察窗口(1-2月,2-3月....11-12月)。比如2019年11个时间窗口就是“11-12月”

逾期期数

每个期数由30天组成(有的银行或者金融机构由自然月组成,会更加方便计算)。较多的金融机构会用Mn来形容逾期情况,例如

M0:当前未逾期

M1: 逾期1-30日

M2:逾期31-60日

M3:逾期61-90日

M4:逾期91-120日

以此类推......

此处的逾期和观察窗口(这个月、下个月)没有关系。观察窗口是相对关系;而逾期期数的大小,是从该客户逾期第一天开始计算,是一个绝对数值。

纵坐标是前月的逾期期数情况(时间窗口左边界);横坐标是次月的逾期期数情况(时间窗口右边界)。计算方式,例如我们只有两个时间窗口。在时间窗口【1月-2月】里有50个客户保持未逾期,【2月-3月】有100个客户保持未逾期,那么坐标[1,1]的总数会是150。

2、迁徙率—案例理解

假设经过分析2019年11个时间窗口后,当前月(11月)、下个月(次月12月),我们得到以下一个统计表。

所有时间窗口的迁徙情况总和

下个月

未逾期

逾期[0,30)

逾期[30,60)

逾期[60,90)

逾期[90,120)

逾期[120,∞)

总计

当前月

未逾期

8000

250

1

0

0

0

8251

逾期[0,30)

700

500

80

0

0

0

1280

逾期[30,60)

120

80

76

79

10

5

370

逾期[60,90)

70

25

19

60

60

5

239

逾期[90,120)

20

1

10

8

30

50

119

逾期[120,∞)

2

2

6

4

1

20

35

总计

8912

858

192

151

101

80

10294

比如,

8000=11月未逾期客户数+12月未逾期客户数

700 =11月逾期M1客户数+12月未逾期客户数

转换成百分比,并根据值的大小,用颜色标出来

所有时间窗口的迁徙情况百分比

下个月

未逾期

逾期[0,30)

逾期[30,60)

逾期[60,90)

逾期[90,120)

逾期[120,∞)

总计

当前月

未逾期

96.96%

3.03%

0.01%

0.00%

0.00%

0.00%

100%

逾期[0,30)

54.69%

39.06%

6.25%

0.00%

0.00%

0.00%

100%

逾期[30,60)

32.43%

21.62%

20.54%

21.35%

2.70%

1.35%

100%

逾期[60,90)

28.29%

10.46%

7.95%

25.10%

25.10%

2.09%

100%

逾期[90,120)

16.81%

0.84%

8.40%

6.72%

25.21%

42.02%

100%

逾期[120,∞)

5.71%

5.71%

17.14%

11.43%

2.86%

57.14%

100%

总计

2.1、迁徙情况百分比关注重点

只需要关注黑色框框的部分,也就是彩色背景的部分

解释:因为那些已经好转了的账户我们不管了,因为不是我们的催收对象,我们需要看的是逾期情况没有好转甚至恶化的客户。一个时间窗口内你的逾期情况最多往前一格(遇到天数为31天的有可能小概率逾期两格,但较少发生,统计时可忽略)。用直白的语言说,就是你现在逾期10天,给你一个月,你怎么也不可能逾期超过60天吧?

2.2、迁徙情况百分比的意义

说明了某个逾期期数的风险情况。我们这里用“从良”这个不太恰当但好理解的词来形容账户逾期期数变少。例如在上表里,

这个月当逾期<30天时,54.69%的客户都会在下个月还上款(因为大概率是忘了还款日而不是没钱还);

而这个月逾期在[90-119]天时:有42.02%的客户的逾期期数会继续增加(确实手头缺钱还不上);25.21%的客户逾期期数会保持不变(手头紧,仅还得上一期的欠款以确保账户不会被清算)。

“从良”占比:也就说是,当逾期天数超过90天,客户“从良”的概率只有(100-25.21-42.02)% = 32.77%。也就说,很大概率这个客户的情况会一直恶化下去,所以我们需要在Ta恶化前,就挑出来催收,以减少损失。“从良”的占比行业经验:至于低于多少就不能接受,则需要和商业部门沟通。但从良的少于1/3确实挺少了。

2.3、提前预测90天后是否逾期

此处并非指逾期真的超过90天才催收,而是说,我预测这个人将来会逾期超过90天,所以我在他达到那个逾期时间前就去催收,避免严重逾期的发生。


相关文章
|
人工智能 C++
ML之FE:Vintage曲线/Vintage分析的简介、计算逻辑、案例应用之详细攻略
ML之FE:Vintage曲线/Vintage分析的简介、计算逻辑、案例应用之详细攻略
ML之FE:Vintage曲线/Vintage分析的简介、计算逻辑、案例应用之详细攻略
|
6月前
|
机器学习/深度学习 人工智能 PyTorch
人工智能平台PAI产品使用合集之只进行训练(train)而不进行评估(eval)该如何配置
阿里云人工智能平台PAI是一个功能强大、易于使用的AI开发平台,旨在降低AI开发门槛,加速创新,助力企业和开发者高效构建、部署和管理人工智能应用。其中包含了一系列相互协同的产品与服务,共同构成一个完整的人工智能开发与应用生态系统。以下是对PAI产品使用合集的概述,涵盖数据处理、模型开发、训练加速、模型部署及管理等多个环节。
|
7月前
|
机器学习/深度学习 人工智能 分布式计算
人工智能平台PAI产品使用合集之如何配置DSSM模型负采样item表的schema
阿里云人工智能平台PAI是一个功能强大、易于使用的AI开发平台,旨在降低AI开发门槛,加速创新,助力企业和开发者高效构建、部署和管理人工智能应用。其中包含了一系列相互协同的产品与服务,共同构成一个完整的人工智能开发与应用生态系统。以下是对PAI产品使用合集的概述,涵盖数据处理、模型开发、训练加速、模型部署及管理等多个环节。
|
7月前
|
机器学习/深度学习 人工智能 TensorFlow
人工智能平台PAI产品使用合集之在使用DSSM负采样时,不知道label_fields的配置方法如何解决
阿里云人工智能平台PAI是一个功能强大、易于使用的AI开发平台,旨在降低AI开发门槛,加速创新,助力企业和开发者高效构建、部署和管理人工智能应用。其中包含了一系列相互协同的产品与服务,共同构成一个完整的人工智能开发与应用生态系统。以下是对PAI产品使用合集的概述,涵盖数据处理、模型开发、训练加速、模型部署及管理等多个环节。
|
7月前
|
机器学习/深度学习 人工智能 API
人工智能平台PAI产品使用合集之机器学习PAI中的sample_weight怎么加在样本中
阿里云人工智能平台PAI是一个功能强大、易于使用的AI开发平台,旨在降低AI开发门槛,加速创新,助力企业和开发者高效构建、部署和管理人工智能应用。其中包含了一系列相互协同的产品与服务,共同构成一个完整的人工智能开发与应用生态系统。以下是对PAI产品使用合集的概述,涵盖数据处理、模型开发、训练加速、模型部署及管理等多个环节。
|
7月前
|
机器学习/深度学习 分布式计算 DataWorks
构建CTR点击模型:阿里云产品实践与技术解析
点击率(CTR)预测模型在广告和推荐系统中发挥着重要作用。本文将深入介绍如何利用阿里云相关产品搭建CTR点击模型。我们将使用MaxCompute、机器学习平台PAI、DataWorks等阿里云产品,通过代码示例和详细说明,带你一步步完成整个流程。
729 0
|
机器学习/深度学习 人工智能 算法
强化学习从基础到进阶-案例与实践[5.1]:Policy Gradient-Cart pole游戏展示
强化学习从基础到进阶-案例与实践[5.1]:Policy Gradient-Cart pole游戏展示
|
存储 人工智能 自然语言处理
揭秘大模型背后的机理,清华49页长文全方位分析参数高效微调方案Delta Tuning(1)
揭秘大模型背后的机理,清华49页长文全方位分析参数高效微调方案Delta Tuning
228 0
|
机器学习/深度学习 分布式计算 关系型数据库
直播预告 | pg4ml 机器学习框架系列课程:实现细节、XOR 模型案例(上)
pg4ml 机器学习框架是基于 PostgreSQL v13 实现的、使用 plpgsql 编写的机器学习框架,本次讲解的实验环境基于PolarDB-PG开源数据库。本次分享主要介绍框架的实现细节,并构建XOR两层网络的模型案例,包括数据集、XOR分类的案例与原理、神经网络节点、训练任务结构与执行等内容。
直播预告 |  pg4ml 机器学习框架系列课程:实现细节、XOR 模型案例(上)