为了防止信用卡盗刷,机器学习算法给你画了一副「肖像」

简介: 对银行而言,衡量信用卡交易的风险非常困难。要实现这个目标必须快速确定哪些交易是合法授权,哪些交易是盗刷的。那么这些工作又是如何实现的呢?

盗刷信用卡风险已经成为困扰全球银行信用卡部门的难题之一。仅以美国为例,美联储的支付调查报道显示,2012年全美信用卡支付总金额达到260亿美元,这其中未经授权的信用卡支付,也就是盗刷信用卡的金额高达61亿美元。


对银行而言,衡量信用卡交易的风险非常困难。要实现这个目标必须快速确定哪些交易是合法授权,哪些交易是盗刷的。那么这些工作又是如何实现的呢?


站在消费者的立场来看,检测信用卡盗刷的过程似乎很「神奇」,这种检测几乎是瞬时发生的,背后涉及到一系列复杂的技术,从金融到经济到法律再到信息科学。当然,有些信用卡盗刷的检测很简单,比如,当机器发现信用卡刷卡地的邮编与发卡地的邮编不符时会发出警告。


传统的信用卡检测需要大量人力参与到海量数据的分析判断上,算法只会对一笔交易发出警告,最后人类审核员会打电话确认这笔交易是否涉嫌信用卡盗刷。现在,由于交易量激增,各大银行的信用卡部门开始依靠大数据,并通过机器学习和云计算的方法快速甄别未经授权的信用卡交易。


用于信用卡检测的机器学习算法首先将被海量正常的交易数据和持卡人数据进行训练。交易结果会成为机器理解交易的一个重要维度,比如一个正常人可能每周买一次电、每两周去一趟购物中心等等,这些交易结果将成为正常交易的模型。


接下来,机器将接受实时交易数据的考验,并给出该交易是否不合法的概率,比如97%,如果检测系统设置每笔交易不合法的概率不能高于95%,那么所有这些交易将被拒绝接受付款,换句话说,交易不会成功。


微信图片_20211125220354.jpg


这个算法考虑的因素很多,包括刷卡供应商的信任度、插卡让购买行为(时空维度)、IP地址等等,考虑的因素越多,其构建的模型也越准确。


这个检测的过程几乎是实时的,这也是人类工作者无法达到的检测速度。但整个流程中还是需要人类的参与,包括人类对算法判断的审核以及随后的信用卡欺诈跟踪等等。


金融交易过程中的数据非常大,比如目前PayPal要处理1亿690万用户的1.1PB数据。但对机器学习而言,越多的数据意味着越能提升自身的算法准确度,从而更好地识别盗刷信用卡的事件。海量数据对于银行IT系统的硬件要求非常高,数据的存储、读取和分析,都成为巨大的IT开支。


目前,银行的信用卡部门开始使用云计算作为处理海量数据的方式,云计算弹性可伸缩的特性能够机器学习算法运行的效率,有效应对诸如双11等刷卡高峰期时的信用卡检测


围绕信用卡盗刷和反盗刷的战争一直在持续,借助于机器学习、大数据和云计算以及今后可以实现的区块链技术,未来我们的钱包和卡包会越来越安全。

相关文章
|
1月前
|
机器学习/深度学习 存储 搜索推荐
利用机器学习算法改善电商推荐系统的效率
电商行业日益竞争激烈,提升用户体验成为关键。本文将探讨如何利用机器学习算法优化电商推荐系统,通过分析用户行为数据和商品信息,实现个性化推荐,从而提高推荐效率和准确性。
|
22天前
|
机器学习/深度学习 算法 搜索推荐
Machine Learning机器学习之决策树算法 Decision Tree(附Python代码)
Machine Learning机器学习之决策树算法 Decision Tree(附Python代码)
|
15天前
|
机器学习/深度学习 自然语言处理 算法
|
2天前
|
机器学习/深度学习 算法 搜索推荐
Python用机器学习算法进行因果推断与增量、增益模型Uplift Modeling智能营销模型
Python用机器学习算法进行因果推断与增量、增益模型Uplift Modeling智能营销模型
30 12
|
1月前
|
机器学习/深度学习 分布式计算 算法
大模型开发:你如何确定使用哪种机器学习算法?
在大型机器学习模型开发中,选择算法是关键。首先,明确问题类型(如回归、分类、聚类等)。其次,考虑数据规模、特征数量和类型、分布和结构,以判断适合的算法。再者,评估性能要求(准确性、速度、可解释性)和资源限制(计算资源、内存)。同时,利用领域知识和正则化来选择模型。最后,通过实验验证和模型比较进行优化。此过程涉及迭代和业务需求的技术权衡。
|
1月前
|
机器学习/深度学习 数据采集 算法
构建高效机器学习模型:从数据处理到算法优化
【2月更文挑战第30天】 在数据驱动的时代,构建一个高效的机器学习模型是实现智能决策和预测的关键。本文将深入探讨如何通过有效的数据处理策略、合理的特征工程、选择适宜的学习算法以及进行细致的参数调优来提升模型性能。我们将剖析标准化与归一化的差异,探索主成分分析(PCA)的降维魔力,讨论支持向量机(SVM)和随机森林等算法的适用场景,并最终通过网格搜索(GridSearchCV)来实现参数的最优化。本文旨在为读者提供一条清晰的路径,以应对机器学习项目中的挑战,从而在实际应用中取得更精准的预测结果和更强的泛化能力。
|
1月前
|
机器学习/深度学习 自然语言处理 算法
【机器学习】包裹式特征选择之拉斯维加斯包装器(LVW)算法
【机器学习】包裹式特征选择之拉斯维加斯包装器(LVW)算法
57 0
|
1月前
|
机器学习/深度学习 存储 算法
【机器学习】包裹式特征选择之基于遗传算法的特征选择
【机器学习】包裹式特征选择之基于遗传算法的特征选择
56 0
|
1月前
|
机器学习/深度学习 算法 数据可视化
实现机器学习算法时,特征选择是非常重要的一步,你有哪些推荐的方法?
实现机器学习算法时,特征选择是非常重要的一步,你有哪些推荐的方法?
27 1
|
1月前
|
机器学习/深度学习 数据采集 算法
解码癌症预测的密码:可解释性机器学习算法SHAP揭示XGBoost模型的预测机制
解码癌症预测的密码:可解释性机器学习算法SHAP揭示XGBoost模型的预测机制
112 0