信用评分系统运行原理中篇-分箱逻辑(4)

简介: 信用评分系统运行原理中篇-分箱逻辑(4)

image.png


d2Mean = d2.mean()


image.png


d2MeanX = d2Mean.X


image.png


使用斯皮尔曼等级相关系数来评估两个变量之间的相关性



r, p = stats.spearmanr(d2MeanX, d2Mean.Y)
这个具体什么原理感兴趣的朋友 可以自己查阅一下资料


image.png


每个指标具体计算过程
min 最小值 d2.min().X
max 最大值 d2.max().X
total 总人数 d2.count().Y
sum 好人数 d2.sum().Y
rate 均值 d2.mean().Y
woe=np.log((d3['rate'] / (1-d3['rate'])) / (good/bad))
 (好人均值/坏人均值)/(好人人数/坏人人数) 取对数 即WOE
 goodattribute=d3['sum'] / good 每组好人数量/总的好人数
 badattribute=(d3['total'] - d3['sum']) / bad 每组坏人人数/坏人总人数
 iv = ((d3['goodattribute'] - d3['badattribute']) * d3['woe']).sum()
 d4 = (d3.sort_values(by = 'min'))
 通过min列排序


image.png


ivx1:  1.0027047570109968
cutx1:  [-inf, 0.0313, 0.1583, 0.5605, inf]
woex1:  [-1.37, -1.212, -0.288, 1.106]
相关文章
|
算法 数据处理
信用评分系统运行原理中篇-分箱逻辑(2)
信用评分系统运行原理中篇-分箱逻辑(2)
168 0
信用评分系统运行原理中篇-分箱逻辑(2)
信用评分系统运行原理中篇-分箱逻辑(3)
信用评分系统运行原理中篇-分箱逻辑(3)
221 0
信用评分系统运行原理中篇-分箱逻辑(3)
|
算法 编译器 Python
信用评分系统运行原理中篇-分箱逻辑(1)
信用评分系统运行原理中篇-分箱逻辑(1)
194 0
信用评分系统运行原理中篇-分箱逻辑(1)
信用评分系统运行原理上篇(2)
信用评分系统运行原理上篇(2)
152 0
信用评分系统运行原理上篇(2)
信用评分系统运行原理上篇(3)
信用评分系统运行原理上篇(3)
193 0
信用评分系统运行原理上篇(3)
|
机器学习/深度学习
信用评分系统运行原理上篇(1)
信用评分系统运行原理上篇(1)
201 0
信用评分系统运行原理上篇(1)
|
机器学习/深度学习 Python
信用评分系统运行原理下篇(3)
信用评分系统运行原理下篇(3)
138 0
信用评分系统运行原理下篇(3)
|
算法
信用评分系统运行原理下篇(2)
信用评分系统运行原理下篇(2)
178 0
|
算法
信用评分系统运行原理下篇(1)
信用评分系统运行原理下篇(1)
208 0
信用评分系统运行原理下篇(1)
|
算法
独家 | 一文教你如何处理不平衡数据集(附代码)
本文作者用python代码示例解释了3种处理不平衡数据集的可选方法,包括数据层面上的2种重采样数据集方法和算法层面上的1个集成分类器方法。
2272 0

热门文章

最新文章