机器学习和大数据——提高信用卡安全性-阿里云开发者社区

机器学习和大数据——提高信用卡安全性

2017-07-05 1568

版权

本文内容由阿里云实名注册用户自发贡献，版权归原作者所有，阿里云开发者社区不拥有其著作权，亦不承担相应法律责任。具体规则请查看《阿里云开发者社区用户服务协议》和《阿里云开发者社区知识产权保护指引》。如果您发现本社区中有涉嫌抄袭的内容，填写侵权投诉表单进行举报，一经查实，本社区将立刻删除涉嫌侵权内容。

简介：

Intetix Foundation（英明泰思基金会）由从事数据科学、非营利组织和公共政策研究的中国学者发起成立，致力于通过数据科学改善人类社会和自然环境。通过联络、动员中美最顶尖的数据科学家和社会科学家，以及分布在全球的志愿者，我们创造性地践行着我们的使命：为美好生活洞见数据价值。

当你在家却接到信用卡检测中心的电话询问你刚刚是否在某个商场完成支付，而事实上这个时间段你根本没有出门，更别说买什么昂贵的电器，那么银行是怎么知道这可能是笔欺诈性交易呢？

正确分辨每笔商业交易的合法性对信用卡公司的利益影响巨大。美联储支付研究数据表明，2012年美国公民信用卡交易额达到262亿美元。而同年由于未予授权的交易所产生的损失大约为61亿美元。联邦公平信用结账法将持卡人的未授权交易责任限制在50美元,剩余损失由信用卡公司负责。由此可见，欺诈性支付对信用卡公司盈亏的巨大影响。然而，尽管每年信用卡使用点都会接受严格的安全审查，仍无法真正杜绝信用卡欺诈。

对银行业来说，风险评估起着至关重要的作用。其总目标是在造成巨大损失前，快速地判断其是否为欺诈性质。但如何做到这一点？银行又如何辨别信用卡盗刷呢？
提高检测能力

因欺诈性支付过程的瞬间性，有效的反欺诈从客户视角看来非常神奇的。这看似简单且快速的检测其实暗含了一系列复杂的技术,涉及财经,法律及信息科学。

当然，也有一些相对简单的检测机制，无需太过先进的技术。例如，当信用卡在非常用地区使用时，无法提供其正确的邮政编码将被视为欺诈的指示之一。但得知受害人的邮编十分容易，通常诈骗犯都能够轻易躲过这一常规检查。

在过去，反欺诈支付所需的数据分析技术要求大量的人力投入。通过电脑算法发现的可疑案例，最终都需经过人工确认。现如今，过于庞大的交易数量使得信用卡公司更需依赖于大数据分析。机器学习和云计算等先进技术将提高检测欺诈支付的准确性。
通过机器学习判断是否为欺诈

简单来说,机器学习由计算机操控，通过符合特殊规则的预设过程且能自我完善的算法。计算机会先从一个模型开始，然后通过实验和犯错来训练它。之后它就可以做出风险预测，例如预测金融交易相关的风险。

检测欺诈的机器学习算法首先需用大量持卡人的正常交易数据来训练。交易序列就是这种训练数据的一个例子，如一个人通常每周加一次油,每两周去一次超市购物等等。该算法学习到这是一个正常的交易序列。

这种微调过程后,我们就可以通过运行算法检测信用卡交易,理想情况下能达到实时状态。然后算出一个概率指示交易被欺诈的可能性(例如,97%)。如果将欺诈检测系统设定为阻止任何欺诈概率高于95%的交易,这个评估可以在交易发生时立即引发信用卡冻结。

算法考虑了许多因素来限定欺诈交易:商家的诚信值,持卡人的购买行为（包括时间和地点）,IP地址,等。数据点越多,结果越精确。

没有人可以在分析成千上万的数据的同时做出判断，但机器学习可以，它使实时检测欺诈行为成为可能。

举一个典型的例子，当你在超市结账刷卡时，信用卡公司将会得到具体交易细节,如时间、数额、商店名与信用卡的年限。这些数据会被提供给已学习你的采购模式的算法，通过与许多过去的采购数据点比对来分析此项交易是否符合你的行为习惯。

在你的信用卡被使用时，无论你是身处每周六早晨都会去的餐厅，还是凌晨3点在两个时区外的加油站，算法都会立即知道你在交易，并检查你的交易行为是否正常。如果信用卡突然在同一天超额预付两次，而在历史数据中没有这样使用过的数据,这种行为将提高欺诈概率的评分。如果交易欺诈分值高于某个阈值,通常快速人工审核后,算法将与销售点系统联系让它拒绝交易。网上购物也会经过相同的流程。

在这种类型的系统中,大量人工干预成为过去的事。事实上,如果一个人过于参与欺诈监测周期，那么反应时间会变得更长。然而,人工仍然可以发挥作用——验证欺诈或跟踪被拒绝的交易。当一张卡被多次拒绝交易时,工作人员可以致电持卡人，以决定是否永久取消该卡。
在云端的电脑侦探

大量需处理的金融交易是一个很重的负担,特别是在大数据领域。但机器学习就是建立在堆积如山的数据上的,更多的信息会增加算法的准确性,帮助消除误报。合法的交易也会引发的可疑交易的误报,(例如,一个卡在一个不常使用的位置)。太多的警报和没有警报一样糟糕。

这样庞大的数据需要大量的计算能力。例如,贝宝(Paypal)无时无刻都在为其1.69亿的客户处理超过1.1 pb的数据。这些大量的数据——1 pb相当于超过20万张dvd的内存——这对算法的机器学习有积极影响,但也会对一个组织的计算基础设施产生很大负担。

这时就需要云计算了。远程计算资源可以在这里发挥着重要的作用。云计算是可伸缩的,而不会受限于公司自己的计算能力。

欺诈检测是“正义”与“邪恶”之间的军备竞赛。目前,“正义”一方似乎取得很大进展,在技术芯片等方面取得创新,同时还结合加密功能,机器学习,大数据。当然,还有云计算。

而骗子肯定会继续试图取胜和挑战欺诈检测系统的极限。剧烈变化的支付模式本身是另一个障碍。你的手机现在能够存储信用卡信息,可以用来无线支付，而这将会引入新的漏洞。幸运的是,目前的欺诈检测技术并不受制于支付系统技术。

本文转自d1net（转载）

机器学习和大数据——提高信用卡安全性

热门文章

最新文章

相关课程

相关电子书

探索云世界

热门

云计算

大数据

云原生

人工智能

数据库

开发与运维

活动广场

任务中心

训练营

直播

乘风者计划

下载

镜像站

技术资料

机器学习和大数据——提高信用卡安全性

热门文章

最新文章

相关课程

相关电子书