信用评分系统运行原理中篇-分箱逻辑(4)

简介: 信用评分系统运行原理中篇-分箱逻辑(4)

image.png


d2Mean = d2.mean()


image.png


d2MeanX = d2Mean.X


image.png


使用斯皮尔曼等级相关系数来评估两个变量之间的相关性



r, p = stats.spearmanr(d2MeanX, d2Mean.Y)
这个具体什么原理感兴趣的朋友 可以自己查阅一下资料


image.png


每个指标具体计算过程
min 最小值 d2.min().X
max 最大值 d2.max().X
total 总人数 d2.count().Y
sum 好人数 d2.sum().Y
rate 均值 d2.mean().Y
woe=np.log((d3['rate'] / (1-d3['rate'])) / (good/bad))
 (好人均值/坏人均值)/(好人人数/坏人人数) 取对数 即WOE
 goodattribute=d3['sum'] / good 每组好人数量/总的好人数
 badattribute=(d3['total'] - d3['sum']) / bad 每组坏人人数/坏人总人数
 iv = ((d3['goodattribute'] - d3['badattribute']) * d3['woe']).sum()
 d4 = (d3.sort_values(by = 'min'))
 通过min列排序


image.png


ivx1:  1.0027047570109968
cutx1:  [-inf, 0.0313, 0.1583, 0.5605, inf]
woex1:  [-1.37, -1.212, -0.288, 1.106]
相关文章
|
运维 监控 算法
优化电脑屏幕监控软件:关联规则挖掘算法的引入
在如今的职场中,电脑屏幕监控软件已经成为了许多企业的标配,用于监测员工的工作行为以提高生产力和安全性。然而,为了让监控软件发挥最大的效用,关联规则挖掘算法正在崭露头角。接下来就让我们通过以下方面来看看如何通过关联规则挖掘算法提高电脑屏幕监控软件的监视效率——
184 0
|
2月前
|
机器学习/深度学习 人工智能 测试技术
探索软件测试中的“禅”:寻找内在的平和与外在的效率####
在软件测试的世界里,我们常常被缺陷的数量、测试用例的覆盖度以及上线时间的紧迫性所困扰。但如果我们能像禅宗修行者一样,将注意力转向内心的平静与专注,或许能在纷繁复杂的测试工作中找到一种全新的效率和质量提升之道。本文将带您走进软件测试的“禅意世界”,探讨如何在看似枯燥无味的测试过程中,通过调整心态、优化方法,实现个人成长与项目成功的双赢。 ####
|
8月前
|
移动开发 数据可视化
R语言两层2^k析因试验设计(因子设计)分析工厂产量数据和Lenth方法检验显著性可视化|数据分享(二)
R语言两层2^k析因试验设计(因子设计)分析工厂产量数据和Lenth方法检验显著性可视化|数据分享(二)
|
8月前
|
数据可视化
R语言两层2^k析因试验设计(因子设计)分析工厂产量数据和Lenth方法检验显著性可视化|数据分享(一)
R语言两层2^k析因试验设计(因子设计)分析工厂产量数据和Lenth方法检验显著性可视化|数据分享(一)
|
机器人 API
现货合约交易量化机器人开发设计执行逻辑源码实例分析
现货合约交易量化机器人开发设计执行逻辑源码实例分析
|
算法 机器人 数据挖掘
量化合约套利机器人策略开发部署执行逻辑源码实例分析
量化合约套利机器人策略开发部署执行逻辑源码实例分析
|
算法 搜索推荐 编译器
用调试来帮你分析并拿捏折半插入排序算法的流程
用调试来帮你分析并拿捏折半插入排序算法的流程
106 0
|
算法 C++
详细实例说明+典型案例实现 对枚举法进行全面分析 | C++
简单的来说,算法就是用计算机程序代码来实现数学思想的一种方法。学习算法就是为了了解它们在计算机中如何演算,以及在当今的信息时代,它们是如何在各个层面上影响我们的日常生活的,从而提高我们的逻辑思维能力和处理实际问题的能力。善用算法、巧用算法,是培养程序设计逻辑的重中之重,许多实际的问题都可用多个可行的算法来解决, 但是要从中找出最优的解决算法却是一项挑战。
231 0
详细实例说明+典型案例实现 对枚举法进行全面分析 | C++
|
数据采集 消息中间件 分布式计算
最终整体回顾总结(代码-预处理及爬虫识别)|学习笔记
快速学习最终整体回顾总结(代码-预处理及爬虫识别)
131 0
最终整体回顾总结(代码-预处理及爬虫识别)|学习笔记
|
存储 关系型数据库 MySQL
第十三章《优化》
第十三章《优化》
第十三章《优化》