大数据征信进入洗牌期,区块链或成新一代征信系统底层架构

简介: 区块链技术助推新一代征信系统体系建设。

由于中国的消费金融需求旺盛但服务相对落后的行业特点,导致行业内数据滥用现象严重。

此前,人民银行征信中心副主任汪路在公开场合表示,在当前征信体系已经严重滞后于经济、金融发展需求的情况下,这些弊端应当受到高度重视并有效解决,以促进征信体系建设的顺利推进,降低经济和金融风险。

滥用数据现象体现了行业对个人征信市场的迫切需求,而随着百行征信的设立以及监管的重拳整治,野蛮生长了几年的大数据征信行业,进入洗牌期。

搭建个人征信体系需求迫切

“爬虫技术对个人隐私、数据滥用有推波助澜的作用。但这也从另一个角度体现了市场对于个人征信数据的一个需求。”北京大学金融智能研究中心研究员刘新海对第一财经记者表示。

目前,行业内滥用数据现象严重。刘新海认为数据滥用现象,主要可归纳为三类,一是采集数据过多,并未经过消费者本人同意;二是非法购买、数据倒卖;三是爬虫技术获取。

此前,消费金融领域一直是信息泄露的重灾区,倒卖数据现象比较严重。例如,用户在互金平台申请贷款时,需要填写电话号码、身份信息、银行卡等信息外,还要填写信用卡、车辆、公积金、甚至淘宝等网购平台的消费账单等,这些数据常常被数据供应商拿来倒卖。

在互金行业内,互金公司获取消费者的数据成本在运营成本中占比较高,造成了很多P2P等新兴借贷平台在购买数据防欺诈、降风险方面耗费了太多成本。 又由于市场数据分散,互金公司在购买数据时,往往批量购买,后由互金公司整合构成自己的一个征信数据来源。

“去年国家安全法以及两高的司法解释出台后,倒卖倒买个人数据现象得到了一定的缓解。”刘新海称。

《中华人民共和国网络安全法》作为我国网络领域的基础性法律,明确加强对个人信息保护,打击网络诈骗,重拳整治行业乱象。法律规定任何个人和组织不得窃取或者以其他非法方式获取个人信息,不得非法出售或者非法向他人提供个人信息,并规定了相应法律责任。

在爬虫技术方面,刘新海认为,爬虫技术之所以在互联网金融行业应用普遍,主要是源于P2P等互联网金融公司急需对借款人做信用评估,以防止欺诈行为。

“网络爬虫是互金平台获取借贷人信息数据的一种技术,但这种行为有时并不合规,例如现金贷行业出现一种‘同业爬虫’产品,可以直接将其他现金贷平台的放款额和风控数据爬出来,相当于其他的平台帮助你做了风控。”

刘新海表示,真正的风控技术需要投入人与时间,需要付出一定的代价买教训。从目前来看,很多公司都表示已加大投研力度,提升风控水平,但其实从行业、技术角度出发来看,互金行业的风控技术总体来说还比较落后,主要问题是消费金融服务需求太过迫切。

“只要公司做好营销,解决欺诈及获客问题,就可以挣钱,那么为什么还要花大量时间去做风控呢?这是行业矛盾的地方。根据互金行业的实际情况,过去一段时间,风控对于互金公司(特别是现金贷公司)的盈利能力而言并没有起到关键作用。”

用技术助推征信体系建设

征信体系与技术联系非常紧密,在大数据、人工智能技术迅猛发展的背景下,如何将用技术助推征信体系的建设,也是目前我国征信市场面对的一个挑战。

根据刘新海介绍,征信对我国而言本来就是“舶来品”,并且市场化公司参与多、发展渠道多。欧美发达国家是征信基础设施和金融体系循序渐进、同步发展,而我国则是经济发展倒逼征信体系发展,是跨越式发展。另一方面,单一的征信模式已无法满足消费经济活跃、需求旺盛的市场现状,因此需要通过其他的渠道来解决这个需求,所以一些市场化的互联网公司、大数据公司也想参与征信体系的基础设施建设。

相比移动支付,互联网时代的个人信用体系建设将给市场经济带来更深变革。对于互联网巨头而言,个人信用体系的建设可以成为一个新的经济形态的入口,在此背景下一些互联网公司纷纷推出信用分业务。巨头参与征信基础设施建设,如何在过程中保证公平正义、保护消费者隐私,是征信体系建设过程的一个重要的问题。

2月22日,央行下发了首张个人征信牌照,百行征信有限公司申请设立个人征信机构已获得许可,个人征信牌照有效期为3年。这一平台成立的主要目的,是把央行征信中心未能覆盖到的个人客户信用数据纳入,构建一个国家级的基础数据库,实现行业的信息共享,以有效降低风险成本。

此前,唯品金融副总经理汤磊对第一财经记者表示,目前整个行业发展过程中存在的突出问题,首先是信息的碎片化,出现“信息孤岛”,各家机构均把信息看成自己的核心资产,不愿拿出来共享或拿出来共享的信息数据失真,导致个人多头借贷、过度借贷、骗贷等行为不断出现;第二,随着大数据征信的概念炒得比较热,存在利用个人征信之名,过度采集或未经授权采集个人信息的情况。

百行征信的设立或许能够有效解决消费金融领域的数据孤岛问题,也能清理数据买卖的乱象。但业内对于“老八家”入股百行征信之后是否愿意共享数据存疑。那么,如何打造一个有效打破数据壁垒的信息共享平台?

“我认为互金协会的信用信息共享平台将成为百行征信未来主要的征信数据来源。百行征信最后也许不需要8家征信公司的数据,因为有的数据它们不想拿,也拿不出来。”一位接近央行人士此前对第一财经记者表示。

他指出,征信数据是有囊括标准的,在一定维度内的数据将被纳入征信数据。例如,个人的信贷历史,征信数据需要匹配到每个人,需要个人的标识信息,需要一个清晰的边界。但此前央行批复的“筹备成立”个人征信业务的8家机构,由于数据维度太广,并没有局限于传统的征信数据维度。因此,一旦按照征信数据标准收窄维度,会影响机构的金融生态体系。

从技术的角度来看,区块链技术或许可以解决机构间不信任的问题。中国信息通信研究院云计算与大数据研究所主任韩涵表示:“信用领域是区块链的应用场景之一,用区块链共享信息,一方面信息共享透明,机构之间可相互看到彼此都共享了哪些信息,比较放心;另一方面,通过区块链的技术来精准地记录你所共享的信用,把市场本身进行记账,同时设置不同的激励机制和运营模式,来实现信息的共享。”

另外,在防止数据泄漏方面,刘新海认为,区块链分布式、多约束的特点对于黑客来说挑战比较大。“身份信息用区块链存储是分布式的,系统的安全性会加强。同时,由于所有行为都在链上体现,对数据质量、真实性也有了保证。区块链技术可能是未来新一代征信系统的底层架构的一种选择。”但他同时指出,如何提高对海量征信数据的处理效率,也是区块链技术在实际应用中存在的一个问题。


原文发布时间为:2018-04-02

本文作者:36氪的朋友们

本文来源:36Kr,如需转载请联系原作者。


相关实践学习
基于MaxCompute的热门话题分析
Apsara Clouder大数据专项技能认证配套课程:基于MaxCompute的热门话题分析
目录
相关文章
|
10月前
|
存储 SQL 监控
数据中台架构解析:湖仓一体的实战设计
在数据量激增的数字化时代,企业面临数据分散、使用效率低等问题。数据中台作为统一管理与应用数据的核心平台,结合湖仓一体架构,打通数据壁垒,实现高效流转与分析。本文详解湖仓一体的设计与落地实践,助力企业构建统一、灵活的数据底座,驱动业务决策与创新。
|
负载均衡 算法 关系型数据库
大数据大厂之MySQL数据库课程设计:揭秘MySQL集群架构负载均衡核心算法:从理论到Java代码实战,让你的数据库性能飙升!
本文聚焦 MySQL 集群架构中的负载均衡算法,阐述其重要性。详细介绍轮询、加权轮询、最少连接、加权最少连接、随机、源地址哈希等常用算法,分析各自优缺点及适用场景。并提供 Java 语言代码实现示例,助力直观理解。文章结构清晰,语言通俗易懂,对理解和应用负载均衡算法具有实用价值和参考价值。
大数据大厂之MySQL数据库课程设计:揭秘MySQL集群架构负载均衡核心算法:从理论到Java代码实战,让你的数据库性能飙升!
|
11月前
|
存储 SQL 分布式计算
19章构建企业级大数据平台:从架构设计到数据治理的完整链路
开源社区: 贡献者路径:从提交Issue到成为Committer 会议演讲:通过DataWorks Summit提升影响力 标准制定: 白皮书撰写:通过DAMA数据治理框架认证 专利布局:通过架构设计专利构建技术壁垒
|
8月前
|
存储 分布式计算 资源调度
【赵渝强老师】阿里云大数据MaxCompute的体系架构
阿里云MaxCompute是快速、全托管的EB级数据仓库解决方案,适用于离线计算场景。它由计算与存储层、逻辑层、接入层和客户端四部分组成,支持多种计算任务的统一调度与管理。
701 1
|
10月前
|
消息中间件 分布式计算 大数据
“一上来就搞大数据架构?等等,你真想清楚了吗?”
“一上来就搞大数据架构?等等,你真想清楚了吗?”
202 1
|
9月前
|
SQL 存储 监控
流处理 or 批处理?大数据架构还需要流批一体吗?
简介:流处理与批处理曾是实时监控与深度分析的两大支柱,但二者在数据、代码与资源上的割裂,导致维护成本高、效率低。随着业务对数据实时性与深度分析的双重需求提升,传统架构难以为继,流批一体应运而生。它旨在通过逻辑、存储与资源的统一,实现一套系统、一套代码同时支持实时与离线处理,提升效率与一致性,成为未来大数据架构的发展方向。
|
11月前
|
架构师 Oracle 大数据
从大数据时代变迁到数据架构师的精通之路
无论从事何种职业,自学能力都显得尤为重要。为了不断提升自己,我们可以尝试建立一套个性化的知识目录或索引,通过它来发现自身的不足,并有针对性地进行学习。对于数据架构师而言,他们需要掌握的知识领域广泛而深入,不仅包括硬件、网络、安全等基础技术,还要了解应用层面,并熟练掌握至少一门编程语言。同时,深入理解数据库技术、具备大数据实操经验以及精通数据仓库建模和ELT技术也是必不可少的。只有这样,数据架构师才能具备足够的深度和广度,应对复杂的业务和技术挑战。 构建个人知识体系是数据架构师在学习和工作中的一项重要任务。通过系统化、不断深化的知识积累,数据架构师能够有效应对快速变化的商业环境和技术革新,进一
|
负载均衡 算法 关系型数据库
大数据新视界--大数据大厂之MySQL数据库课程设计:MySQL集群架构负载均衡故障排除与解决方案
本文深入探讨 MySQL 集群架构负载均衡的常见故障及排除方法。涵盖请求分配不均、节点无法响应、负载均衡器故障等现象,介绍多种负载均衡算法及故障排除步骤,包括检查负载均衡器状态、调整算法、诊断修复节点故障等。还阐述了预防措施与确保系统稳定性的方法,如定期监控维护、备份恢复策略、团队协作与知识管理等。为确保 MySQL 数据库系统高可用性提供全面指导。
|
8月前
|
机器学习/深度学习 传感器 分布式计算
数据才是真救命的:聊聊如何用大数据提升灾难预警的精准度
数据才是真救命的:聊聊如何用大数据提升灾难预警的精准度
565 14
|
9月前
|
机器学习/深度学习 运维 监控
运维不怕事多,就怕没数据——用大数据喂饱你的运维策略
运维不怕事多,就怕没数据——用大数据喂饱你的运维策略
822 0