Sift Science 用大数据防范网络欺诈

简介:       现有的网络支付和网络交易的防欺诈系统过于复杂,也不能有效杜绝网络欺诈行为,Sift Science这样的创业公司开始尝试利用基于机器学习的大数据分析防范网络欺诈。       对于大数据分析来说, 网络安全是一个很有潜力的应用领域。
0.jpg

      现有的网络支付和网络交易的防欺诈系统过于复杂,也不能有效杜绝网络欺诈行为,Sift Science这样的创业公司开始尝试利用基于机器学习的大数据分析防范网络欺诈。

      对于大数据分析来说, 网络安全是一个很有潜力的应用领域。 通过大数据分析, 可以对攻击者的模式进行甄别, 从而更加主动地防范网络攻击,而不是如传统的安全防御那样只能对已知的攻击模式进行防范。 本站文章主动防御:大数据引发的信息安全技术革命, 曾提到IBM和RSA的一些基于大数据分析的产品。 而类似于 Cylance这样的初创公司, 也凭借大数据技术完成了融资

最近, 又有一家公司, Sift Science, 利用基于机器学习的大数据分析提供防范网络欺诈的服务。 Sift Science最近得到了由风险投资基金Union Square Ventures主导的400万美金的第一轮投资。 算上此前的150万美元的种子基金, Sift Science已经总共融了550万美金。

Sift Science的服务主要面向网络交易市场, 电子支付网络以及电子商务站点, 这些也正是网络欺诈最泛滥的地方。 这些站点只需要把Sift Science的一段JavaScript整合到网页去就可以享受Sift Science的服务。

Sift Science的联合创始人 Brandon Ballinger之前在Google工作过四年,主要的工作就是防范大量的欺诈广告。Sift Science的工程师中,也有5个来自于Google,有两个来自于搜索部门,还有三个和Brandon Ballinger一起曾经在防范欺诈广告的团队工作过。

“我们意识到,在互联网上的每个站点,都会有一些‘坏’用户,也就是一些实施欺诈的用户。我们创建Sift Science的目的就是建立一套欺诈监测系统。” Brandon Ballinger说。

Brandon Ballinger在2011年6月与他大学的室友Jason Tan一起创立了Sift Science。最初,他们通过Y Combinator的2011年夏季项目进行融资。他们在与潜在的客户进行交流时,客户的最初反应是,防欺诈的系统已经有不少在做了,似乎防欺诈这个问题已经解决了。

“不过,当我们真的与客户深入交流时,我们发现,其实这个问题远没有解决。很多网站买了防欺诈系统,而几乎没有人真正去用。” Brandon Ballinger说。

他指出现有的防欺诈系统还是太过复杂:

它们不像Google Analytics或者MixPanel.那样易用。而且,为了要使用防欺诈系统,你需要走一个长长的销售流程,需要有安装费用,需要有最低付费等等。而且API过于复杂。现有的防欺诈系统采用SOAP API,这往往需要几个月的时间才能整合到现有系统中去。而Sift Science为此提供了REST API。

此外,现有系统的一个大问题就是他们采用的是固定的规则。比如说,他们对超过一定数额以上的交易,或者来自尼日利亚的交易进行过滤。然而,网络欺诈方可不是按照固定规则出牌的,他们变化一下,就可以很轻易的通过行为的改变来骗过防欺诈系统。

因此, Sift Science采用了机器学习的算法来对付网络欺诈方的这种伎俩。 Sift Science的数据库中,有超过100万中网络欺诈的行为模式,而且它还在不断的通过机器学习的算法进行添加。比如,某些URL浏览的次序,来自Tor节点的IP地址,来自深夜的交易信息等等,都有可能被添加到网络欺诈的行为模式中进行分析。

1.jpg

对每个用户,采用Sift Science的站点可以通过API获取用户的防欺诈分数。站点也可以通过对机器学习模型的反馈,使得防欺诈模型更加适合本站的需求。

2.jpg

这个系统可以用来发现网络交易中的欺诈行为,也可以帮助站点发现那些网络欺诈者创建的垃圾用户。根据Sift Science的统计,他们系统能够甄别的客户站点90% 以上的网络欺诈行为。

Sift Science的产品此前已经经过了20家客户的Beta测试,这些客户包括Airbnb,Uber以及Listia。此外还有一些顶级的电子商务站点和网络支付平台。

Sift Science的产品推出后的定价是按照网站希望每个月对用户评分的数量而定的。每月5000以下的用户免费,超过5000用户的,每月每用户为10美分。


原文发布时间为:2013-08-17


本文来自云栖社区合作伙伴“大数据文摘”,了解相关信息可以关注“BigDataDigest”微信公众号

相关实践学习
简单用户画像分析
本场景主要介绍基于海量日志数据进行简单用户画像分析为背景,如何通过使用DataWorks完成数据采集 、加工数据、配置数据质量监控和数据可视化展现等任务。
SaaS 模式云数据仓库必修课
本课程由阿里云开发者社区和阿里云大数据团队共同出品,是SaaS模式云原生数据仓库领导者MaxCompute核心课程。本课程由阿里云资深产品和技术专家们从概念到方法,从场景到实践,体系化的将阿里巴巴飞天大数据平台10多年的经过验证的方法与实践深入浅出的讲给开发者们。帮助大数据开发者快速了解并掌握SaaS模式的云原生的数据仓库,助力开发者学习了解先进的技术栈,并能在实际业务中敏捷的进行大数据分析,赋能企业业务。 通过本课程可以了解SaaS模式云原生数据仓库领导者MaxCompute核心功能及典型适用场景,可应用MaxCompute实现数仓搭建,快速进行大数据分析。适合大数据工程师、大数据分析师 大量数据需要处理、存储和管理,需要搭建数据仓库?学它! 没有足够人员和经验来运维大数据平台,不想自建IDC买机器,需要免运维的大数据平台?会SQL就等于会大数据?学它! 想知道大数据用得对不对,想用更少的钱得到持续演进的数仓能力?获得极致弹性的计算资源和更好的性能,以及持续保护数据安全的生产环境?学它! 想要获得灵活的分析能力,快速洞察数据规律特征?想要兼得数据湖的灵活性与数据仓库的成长性?学它! 出品人:阿里云大数据产品及研发团队专家 产品 MaxCompute 官网 https://www.aliyun.com/product/odps 
相关文章
|
8月前
|
网络协议 大数据 数据挖掘
文献丨多组学大数据构建小麦穗发育转录调控网络,TRN+GWAS挖掘关键转录调控(二)
文献丨多组学大数据构建小麦穗发育转录调控网络,TRN+GWAS挖掘关键转录调控(二)
|
2月前
|
分布式计算 DataWorks NoSQL
MaxCompute资源问题之网络不通如何解决
DataWorks数据集是指在阿里云DataWorks平台内创建、管理的数据集合;本合集将介绍DataWorks数据集的创建和使用方法,以及常见的配置问题和解决方法。
32 2
|
8月前
|
数据可视化 大数据 数据挖掘
文献丨多组学大数据构建小麦穗发育转录调控网络,TRN+GWAS挖掘关键转录调控(三)
文献丨多组学大数据构建小麦穗发育转录调控网络,TRN+GWAS挖掘关键转录调控(三)
|
8月前
|
大数据 数据挖掘 Go
文献丨多组学大数据构建小麦穗发育转录调控网络,TRN+GWAS挖掘关键转录调控(一)
文献丨多组学大数据构建小麦穗发育转录调控网络,TRN+GWAS挖掘关键转录调控
|
4月前
|
分布式计算 网络协议 Hadoop
大数据成长之路------hadoop集群的部署 配置系统网络(静态) 新增集群(三台)
大数据成长之路------hadoop集群的部署 配置系统网络(静态) 新增集群(三台)
27 0
|
11月前
|
数据采集 存储 大数据
大数据数据采集的数据来源的爬取的网络数据
在大数据应用中,数据采集是非常重要的一步。网络爬虫技术可以帮助企业从互联网上获得更加丰富、多样化的数据,并为后续的数据分析和运用提供支持。
64 0
|
11月前
|
存储 缓存 监控
大数据开发基础的Linux系统的常用系统和网络管理
当今世界正处于信息化时代,数据量不断增长。随着数据的庞大,对于数据处理和管理的需求也越来越高。在这个背景下,大数据开发成为了一个非常热门的领域。而Linux系统是大数据开发的重要基础之一。本文将介绍Linux系统的常用系统和网络管理。
75 0
|
11月前
|
存储 分布式计算 大数据
大数据开发基础的计算机网络的Session/Cookie/Token等概念
随着互联网的发展,计算机网络中的Session/Cookie/Token等概念也越来越受到关注。这些概念在大数据开发中具有重要的应用价值,本篇文章将为大家介绍它们的基本概念、工作原理以及应用场景。
96 0
|
1月前
|
机器学习/深度学习 数据采集 人工智能
m基于深度学习网络的手势识别系统matlab仿真,包含GUI界面
m基于深度学习网络的手势识别系统matlab仿真,包含GUI界面
38 0
|
1月前
|
机器学习/深度学习 算法 计算机视觉
基于yolov2深度学习网络的火焰烟雾检测系统matlab仿真
基于yolov2深度学习网络的火焰烟雾检测系统matlab仿真