信用卡欺诈模型的一些总结

简介: 版权声明:本文为博主原创文章,未经博主允许不得转载。 https://blog.csdn.net/sinat_32502811/article/details/81008948 有些言简意赅······· 1.
版权声明:本文为博主原创文章,未经博主允许不得转载。 https://blog.csdn.net/sinat_32502811/article/details/81008948

有些言简意赅·······
1. 样本不均衡

  • 过采样
    • 让少的生成,让两者同样多
  • 下采样

    • i. 让多的和少的一样多,相当于让多的放弃一些数据,让二者一样少

2. 各种评估指标:

  • recall = TP/(TP+FN)

  • 精度(precision) = (TP+TN)/(FP+FN)

    局限性:举个极端情况的例子,如果数据中大部分都是正样本,只有很少的负样本(样本不均衡),那么我仅仅只构造一个只会输出正类的模型,准确率也能达到很高,但是这样的模型不具有任何意义

3. 混淆矩阵

  • a. x:predict label;y:True label

  • b. 其实就是TP,FP,TN,FN

4.predict_proba(x_test.values)

5.SMOTE 算法(负样本的生成)

  • 算法内容:
    • 对于少数类中每一个样本x,以欧氏距离为标准计算它到少数类样本集中所有样本的距离,得到其k近邻
    • 根据样本不平衡比例,设置一个采样比例以确定采样倍率N,对于每一个少数类样本,从其k近邻中随机选择若干个样本.假设每一个选出来的为xnxn
    • 对于每一个随机选出的近邻xixi分别对于原样本按照如下公式构建新样本:xnew=xi+rand(0,1)(x^x)xnew=xi+rand(0,1)⋅(x^−x)
  • SMOTE算法的库:
from imblearn.over_sampling import SMOTE
目录
相关文章
|
10月前
|
SQL 自然语言处理 小程序
干货分享:隐私计算在保险理赔查勘中的应用
干货分享:隐私计算在保险理赔查勘中的应用
279 0
|
11月前
|
存储
3293. 风险人群筛查
3293. 风险人群筛查
64 0
|
12月前
|
机器学习/深度学习 Python
基于LightGBM实现银行客户信用违约预测
基于LightGBM实现银行客户信用违约预测
148 1
|
机器学习/深度学习 数据采集 数据可视化
数据分析案例-基于随机森林模型对信用卡欺诈检测
数据分析案例-基于随机森林模型对信用卡欺诈检测
268 0
数据分析案例-基于随机森林模型对信用卡欺诈检测
|
存储 机器学习/深度学习 人工智能
储户资金刷脸被盗,监管部门发文警示人脸应用风险
今年7月份,两大银行接连爆出多名储户的数百万存款被异地“刷脸”盗取,引发全社会关注。其实,因人脸安全问题导致资金被盗、被贷款安全事件已不是新鲜事。
127 0
储户资金刷脸被盗,监管部门发文警示人脸应用风险
|
C++
202009-2风险人群筛查
202009-2风险人群筛查
95 0
202009-2风险人群筛查
|
数据挖掘 PHP C语言
R 银行信用卡风控评分数据分析
R 银行信用卡风控评分数据分析
180 0
R 银行信用卡风控评分数据分析
|
安全 物联网
捂好电子钱包 信用卡诈骗解决方案大全
最近笔者看到了Tom Patterson在计算机世界上刊登的一篇文章。文章中他对信用卡/借记卡的安全使用提出了一些建议。由于Patterson先生是安全领域知名的专家,因此笔者对这篇文章也相当关注。
1108 0
|
Web App开发
二月垃圾邮件现状报:欺诈和钓鱼类信息倍增
2010年1月海地大地震后,欺诈和钓鱼消息数量急剧上升,攻击者利用这次灾难事件来为自己谋取利益。与2009年12月相比,2010年1月欺诈和钓鱼类消息在垃圾邮件中所占的比例是原来的2倍。419尼日利亚垃圾邮件(Nigerian Spam)手段江湖重现,欺诈和钓鱼消息数量占垃圾邮件总数的21%,达到该报告发布以来的历史最高记录。
775 0
|
运维 测试技术
如何用无监督模型,防范信用卡欺诈?
小叽导读:国际支付是指在国际经济活动中的当事人以一定的支付工具和方式,清偿因各种经济活动而产生的国际债权债务的行为。在支付中,如果伪造、冒用他人的卡进行支付或者用自己的信用卡进行恶意透支,就构成了欺诈。
2065 0