征信专题:坐在大数据金山上的Equifax

简介: 上期我们介绍了征信三巨头背后的大佬——费埃哲公司。他们的评分标准已经成为了美国征信业的事实标准。国内很多公司包括宜信等都是基于这个评分模型进行二次开发的。这期我们想通过一个大公司的案例来看看,这种数据类型的公司是如何赚钱的。

0.jpg

上期我们介绍了征信三巨头背后的大佬——费埃哲公司。他们的评分标准已经成为了美国征信业的事实标准。国内很多公司包括宜信等都是基于这个评分模型进行二次开发的。这期我们想通过一个大公司的案例来看看,这种数据类型的公司是如何赚钱的。


作为美国三大征信所之一,Equifax(艾可飞)公司存储着所有美国成年人以及另外16个国家公民的财务数据,其中包括全球5亿个消费者和8100万家企业。这些信息可谓是五花八门:哪些人在共享同一电话号码或地址、牙齿治疗贷款的申请、杂志订阅、租赁历史记录、房地产资产、投资理财、购买零售商品、纳税申报单类型、婚姻状况、就业状况、水电费缴付、有线电视账户、犯罪记录、债务收入比、地址更改、机动车档案、邮政信箱、推断某人能否支付账单、预测某人的支付意向,与过去和潜在的欺诈犯罪有无关系等。


这些看起来杂乱无章的海量信息,经过交叉分析和索引处理后,变成26 PB的数据。这个数字已经超过了美国联邦调查局的调查数据仓库(据说是联邦调查局最庞大的数据存储库)的10亿份不重复文档。


新产品的推出


Equifax在过去几年中,相继推出了大批基于大数据的新产品,这些产品旨在实现两个目标:为4.6万家企业客户降低风险,以及促进营销。


其中一款新产品可以帮助企业应用分析技术避免不良客户。据了解,Equifax的开发人员在这款产品中结合消费者个人信用评分和水电费支付历史记录而建立新的分析模型。分析结果将帮银行决定,是否值得花时间去争取那个信用卡支付曾到期未付的客户。Equifax还有一款新产品可以用来实时监测信用报告查询的系统,以及时发现犯罪苗头。Equifax综合数据解决方案部门副总裁Keith Manthey说:“骗子发现有效的行骗手段后,就会迅速共享和使用。该系统可以对查询速度及其他因素进行评分来判断这项申请是否为骗子所为。”


2011年,Equifax收购了一家商业智能工具公司和工作流软件开发商。事实上,在过去的5年中,Equifax共斥资17亿美元收购了多家数据收集和技术公司。这与Equifax在成立之初50年,一直采用纸张分类账的做法大相迳庭。


新IT架构的支撑


对海量数据的分析挖掘工作需要付出大量的IT成本。以往,拥有大量数据的公司需要建立大型数据仓库,并在大规模并行处理系统上运行。Brooks表示,建立大型数据仓库所需硬件成本太高,另外关系型数据库的架构也阻碍了对非结构化数据的查询。因此,Equifax存储和检索数据的方式一反传统,它并没有将这项工作视做处理查询,而是将它视做交付内容,将数据分布在低成本服务器集群上,由IT部门开发专有的分布式检索技术来查找信息。


Brooks说:“由于我们对数据量、交易查询量和响应时间的要求都很高,因此,我们一直小心谨慎,以免盲目跟随行业标准的做法。业内的传统做法需要建设庞大而复杂的基础设施,但如果换个角度考虑,其实这些基础设施建设就变得没有必要。”


目前,Equifax的数据专家要花时间对从公共和私人来源整合而来的数据进行重复数据删除和清洁处理,但他们不会一味地要求一个消费者只有惟一的一份信息。“上下文更重要。”他说,“实际上,他们是对的。现在,我们更多地考虑观察结果,而不是所谓的事实。”


人成为挖掘的对象


挖掘宝贵信息的一个常用方法是,对数据集进行混合搭配,寻找其中关系。例如,单身女性的百货商店签账卡的信用额度是否表明了她们有租赁汽车的意向?这种看似不着边际的尝试也许为营销人员带来非常有用的结果。


益百利最近发现,使用社交媒体的成年人比其他互联网用户更愿意逛星巴克。因此,星巴克或与之竞争的咖啡店可能希望在Facebook上加大广告投放力度。


在Equifax看来,宝贵信息有时还来自高管的灵光乍现。2011年春,CNN报道了一则关于涉案价值达50万美元的信用卡欺诈的新闻。新闻称,两兄弟与贝弗利山一家牙科诊所的雇员密谋,捏造了数百名的病人信息。他们伪造病人姓名、社会保障号码及其他个人数据,然后由诊所雇员向假病人发放牙齿治疗贷款。之后,该雇员再将贷款和虚假支付记录上报给益百利,以Garnik Dumanov和Grisha Stpanov之类的姓名建立了信用历史记录。


这起案件激发了Webb的想象力,Equifax能不能识破这样的骗局?


Brooks、Manthey及其他同事进一步详细了解了这起欺诈案件,从Equifax的众多记录中调阅相关数据(不仅仅是信用报告)。然后,他们开始测试分析信息的新方法,以期获得他们已经知道属实的结果:比如,Stpanov之流不可能真有其人。


Brooks说:“正常人会在许多方面留下痕迹,但虚构的人不会。”拥有有效身份信息的人即便没有信用记录,通常也会因缴付话费或订阅杂志等原因出现在其他一些文件中。而虚构的人则会在申领到信贷额度后会“人间蒸发”。最终,这种逆向分析促成了新的欺诈检测工具,Equifax的安全团队可以与客户一起使用该检测工具。


一年多来,三大征信所接到了来自美国银行、富国银行及另外19家银行关于采用诸如此类虚假身份申请信用卡的查询请求,银行看到良好的信用评分后才予以审批。另外,移动运营商和汽车经销商在办理新手机账户和提交客户购车贷款前也都要先查询这三大征信所的消费者信用数据。


财务报告之外


在Webb看来,抵押贷款领域的新法规给Equifax带来了另一个机会。


2010年出台的《多德-弗兰克华尔街改革和消费者保护法案》要求金融机构对不良贷款负更大的责任。Webb表示,金融专家们评估抵押贷款风险时意识到,简单的信用评分无法为银行决定该不该批准为大额贷款提供足够信息。


Equifax迅速推出了未公开债务监测(Undisclosed Debt Monitoring)服务,这项服务用来监测借款人从抵押贷款获审批到截止日期这段时间内的主要支出情况。例如,借款人可能因在抵押贷款获批后办理汽车贷款,从而改变借款人的还款风险评估状况,这将超出银行为其抵押贷款交易而设定的条件。


此外,Equifax还将这种技术融入到了创收产品中,以适应完全不同的情况。比如,实时的身份验证有助于电信公司避免遭到欺诈。Equifax可以为电信公司证实用户是否确有其人,此前是否一直按时缴纳手机账单。经过这样的身份验证,电信公司就可以放心地将手机卖给用户。


电信公司还可以向Equifax购买市场营销服务。Equifax可以告诉电信公司,相应指定用户的财富评分是否够高,在夏季是否有开支很大的习惯,在使用社交媒体方面是否很积极。电信公司依此情况,可以采用向上销售手段,向用户推销售价更高的手机,如果用户随后又介绍了两个社交媒体朋友与电信公司签约,用户的数据服务方案还可以打折。


“当客户与商家接触时,这种向上销售的效果最好。”Webb介绍道,“但商家在几星期后给客户邮寄小册子,甚至几天后发电子邮件,销售效果都要差很多。”趁客户还在,实时的身份验证和“决策”服务可以让零售商、电信公司及其他商家成交更多、价值更高的单子。


现在Equifax的涉猎范围已经远远超出了金融领域,身份也绝不局限于一家征信所。如果病人和医务人员需要在网上向医院提交身份证明,可以使用该公司的身份验证技术,这项技术会提出一些问题,只有答题者本人知道答案。2011年,Equifax开始帮助美国国土安全部和美国公民及移民服务局核查移民的就业资格。


原文发布时间为:2014-02-26


本文来自云栖社区合作伙伴“大数据文摘”,了解相关信息可以关注“BigDataDigest”微信公众号

相关实践学习
简单用户画像分析
本场景主要介绍基于海量日志数据进行简单用户画像分析为背景,如何通过使用DataWorks完成数据采集 、加工数据、配置数据质量监控和数据可视化展现等任务。
SaaS 模式云数据仓库必修课
本课程由阿里云开发者社区和阿里云大数据团队共同出品,是SaaS模式云原生数据仓库领导者MaxCompute核心课程。本课程由阿里云资深产品和技术专家们从概念到方法,从场景到实践,体系化的将阿里巴巴飞天大数据平台10多年的经过验证的方法与实践深入浅出的讲给开发者们。帮助大数据开发者快速了解并掌握SaaS模式的云原生的数据仓库,助力开发者学习了解先进的技术栈,并能在实际业务中敏捷的进行大数据分析,赋能企业业务。 通过本课程可以了解SaaS模式云原生数据仓库领导者MaxCompute核心功能及典型适用场景,可应用MaxCompute实现数仓搭建,快速进行大数据分析。适合大数据工程师、大数据分析师 大量数据需要处理、存储和管理,需要搭建数据仓库?学它! 没有足够人员和经验来运维大数据平台,不想自建IDC买机器,需要免运维的大数据平台?会SQL就等于会大数据?学它! 想知道大数据用得对不对,想用更少的钱得到持续演进的数仓能力?获得极致弹性的计算资源和更好的性能,以及持续保护数据安全的生产环境?学它! 想要获得灵活的分析能力,快速洞察数据规律特征?想要兼得数据湖的灵活性与数据仓库的成长性?学它! 出品人:阿里云大数据产品及研发团队专家 产品 MaxCompute 官网 https://www.aliyun.com/product/odps 
相关文章
|
数据采集 大数据 区块链
大数据征信进入洗牌期,区块链或成新一代征信系统底层架构
区块链技术助推新一代征信系统体系建设。
1941 0
|
机器学习/深度学习 新零售 大数据
|
数据采集 安全 大数据
|
新零售 安全 大数据

热门文章

最新文章