大数据征信专题——征信三巨头

简介: 当阿里通过数据进行小微企业贷款的时候,大家肯定会想,数据是如何用来做信用评估的。在“用数据做信用评估”这件事情上,业界有很多好的参考案例。我们整编了一套文章,共4篇。今天,带来第一篇《征信三巨头》   呵呵,看到题目,其实,美国的征信体系是全球最先进的,改成“美国征信体系介绍”都不为过。

0.jpg

当阿里通过数据进行小微企业贷款的时候,大家肯定会想,数据是如何用来做信用评估的。在“用数据做信用评估这件事情上,业界有很多好的参考案例。我们整编了一套文章,共4篇。今天,带来第一篇《征信三巨头》

 

呵呵,看到题目,其实,美国的征信体系是全球最先进的,改成美国征信体系介绍都不为过。

全球三大商业个人征信巨无霸即益百利(Experian)、艾克发(Equifax)和环联(Trans union)。三大巨头均从美国兴起,通过收购和信用合作等方式不断向全球扩张,以在海外广泛设立分支机构的方式把业务几乎覆盖全球,逐步发展成为完全国际化的世界性个人征信组织。这三家大牛现在已经不仅仅单纯的是征信公司了,还涉及了数据相关的解决方案业务,通过对数据的增值能力,成长为全球的领袖。

 

1、益百利(Experian):规模最大

益百利(Experian)是伦敦证券交易所上市企业,入选金融时报100指数成份股。公司总部设在爱尔兰共和国的首都都柏林,同时在美国加利福尼亚和英国诺丁汉等地设有运营总部。益百利在美国和英国都是最大的个人信息产品供应商,在全球30多个国家雇用员工12,500余人,拥有3亿自然人客户和3000万个企业客户,仅信用报告一项服务年产值就在20亿美元以上。益百利(Experian)通过会员制形式向具有一定规模和声望的客户提供征信服务,其信息主要来自于与之签订协议的会员,服务范围涵盖了从金融服务到电信、医疗、保险、零售、汽车、制造业、休闲产业、公用事业、房地产和政府部门。公司提供的数据分析智能、决策解决方案和处理服务确保在帮助客户更好地了解市场的同时支持他们开发和管理有利可图的顾客关系。

1  Experian主要财务指标一览

项目

2005

2006

年度总收益

$2.5b

$3.1b

年度息税前盈余

$567m

$727m

年度税前利润

$548m

$638m

总资产

$5,248m

$7,664m

总负债

$5,250m

$7,044m

注:单位为美元,b=billion(十亿), m=million(百万); EMEA/A.P.包括欧洲、中东、非洲和亚太地区。

2、艾克发(Equifax):历史最久

艾克发(Equifax)是纽约证券交易所上市企业,S&P; 500 指数成分股,附属于美国大百货公司PLC。公司拥有近108年的历史,在全球13个国家拥有员工4600余人。该公司通过专职业务代表专项调查的方式进行相关业务操作,提供的个人信用信息服务对象包括了商业银行、财务公司、保险公司、制造商、零售商、公用事业公司以及联邦政府机构等。

2  Equifax主要财务指标一览表

项目

2006

2005

年度总收益

$1.4b

$1.5b

年度息税前盈余

$415m

$390m

每普通股红利

$0.16

$0.15

总资产

$1,790m

$1,831m

总负债

$952m

$1,011m

 

3、环联(Trans Union):发展最快

环联(Trans Union)创建于1968年,公司总部设在芝加哥,拥有2.2亿消费者姓名和档案资料,覆盖美国、加拿大、维尔京群岛和波多黎各。公司向全世界6大洲30多个国家提供产品和服务。在数据采集方面,环联(Trans Union)拥有7000个数据供应机构,不断地向它提供数据更新,从而使公司有能力、有资源每个月对2.3亿的客户资料进行12次数据更新,每次更新涉及20亿条数据档案记录。

 

CIDA一夫当关——元数据标准的统一

CDIA是美国征信局协会的缩写。这个公司通过发布征信数据的标准征集模板,统一了征信体系的数据采集问题。制定了标准数据搜集格式Metro1Metro2。(征信数据元是征信领域内反映被征信人的特性及信用状况的数据单元,是通过定义、标识、表示以及允许值等一系列属性描述的不可再分的最小数据单元,如借款人名称、登记注册类型、登记注册号、学历、还款日期、还款方式等都是通过一系列属性进行描述的征信数据元。)

通过这个标准,数据采集的统一格式,使得美国个人征信局能够及时低成本、高效率地更新自己的数据库,也为金融机构等征信业“原材料”生产部门上报数据提供了便利。

三大公司百花齐放——先进的数据处理和模型评分技术

由于Metro标准的存在,美国三大个人征信局的数据库内容基本一致,但为什么三大机构的业务会有所不同呢?事实上,Metro标准只是提供了一个数据的原始输入格式,三大征信局都会对这些原始的数据进行各具特色的数据变换和数据加工,于是这些数据变换和数据加工技术成为三大征信局的关键技术,也就是它们各自拥有的“黑匣子”。

数据处理首先涉及到数据的存储、管理和维护,这些是由数据库技术来实现的,但数据库技术并不是征信公司所特有的核心技术。征信公司的核心技术有两个:一是个人信用数据的配对技术,即把有关某人的信用数据甄别出来,集中到一起形成整体;二是个人特征变量生成技术,即把有关某人的、数量庞大的原始数据进行加工,形成数个中间变量,最终生产出可以供商业运作和商业数据模型开发的特征变量,使得这些变量能够准确、完整地刻画该人的风险特征和价值特征。例如,益百利(Experian)公司用来作数据处理的一个程序系统是STAGGSTAGG通过“过滤器”技术对征信数据进行筛选,将筛选出的数据放入相应的细分类别中,便于进行集中管理。除“过滤器”之外,STAGG用的第二层工具被称为“变量”。变量是把经过初步分类即经过过滤的数据再进行一些计算,从而形成“特征变量”。

原文发布时间为:2014-02-22


本文来自云栖社区合作伙伴“大数据文摘”,了解相关信息可以关注“BigDataDigest”微信公众号

相关实践学习
简单用户画像分析
本场景主要介绍基于海量日志数据进行简单用户画像分析为背景,如何通过使用DataWorks完成数据采集 、加工数据、配置数据质量监控和数据可视化展现等任务。
SaaS 模式云数据仓库必修课
本课程由阿里云开发者社区和阿里云大数据团队共同出品,是SaaS模式云原生数据仓库领导者MaxCompute核心课程。本课程由阿里云资深产品和技术专家们从概念到方法,从场景到实践,体系化的将阿里巴巴飞天大数据平台10多年的经过验证的方法与实践深入浅出的讲给开发者们。帮助大数据开发者快速了解并掌握SaaS模式的云原生的数据仓库,助力开发者学习了解先进的技术栈,并能在实际业务中敏捷的进行大数据分析,赋能企业业务。 通过本课程可以了解SaaS模式云原生数据仓库领导者MaxCompute核心功能及典型适用场景,可应用MaxCompute实现数仓搭建,快速进行大数据分析。适合大数据工程师、大数据分析师 大量数据需要处理、存储和管理,需要搭建数据仓库?学它! 没有足够人员和经验来运维大数据平台,不想自建IDC买机器,需要免运维的大数据平台?会SQL就等于会大数据?学它! 想知道大数据用得对不对,想用更少的钱得到持续演进的数仓能力?获得极致弹性的计算资源和更好的性能,以及持续保护数据安全的生产环境?学它! 想要获得灵活的分析能力,快速洞察数据规律特征?想要兼得数据湖的灵活性与数据仓库的成长性?学它! 出品人:阿里云大数据产品及研发团队专家 产品 MaxCompute 官网 https://www.aliyun.com/product/odps 
相关文章
|
分布式计算 大数据 Hadoop
从十大技术和十大巨头了解大数据
从十大技术和十大巨头了解大数据
106 0
从十大技术和十大巨头了解大数据
|
数据采集 大数据 区块链
大数据征信进入洗牌期,区块链或成新一代征信系统底层架构
区块链技术助推新一代征信系统体系建设。
1941 0
|
分布式计算 关系型数据库 大数据
|
分布式计算 NoSQL 大数据
|
机器学习/深度学习 新零售 大数据

热门文章

最新文章