公司介绍
数禾科技以大数据和技术为驱动,为金融机构提供高效的智能零售金融解决方案,服务银行、信托、消费金融公司、保险、小贷公司等持牌金融机构,业务涵盖消费信贷、小微企业信贷、场景分期、财富管理等多个领域,提供营销获客、风险防控、运营管理等服务数禾科技通过自主开发的智能金融产品,连接金融机构与普罗大众,赋能金融机构数字化转型,迎接中国消费升级的大潮。
业务介绍
上海数禾信息科技有限公司是一家拥有小贷牌照和融资担保牌照的金融科技公司公司的核心产品是“还呗”。“还呗”作为一款消费信贷产品,自始至终要解决的最关键问题就是面对海量的需要借钱的互联网用户,如何在信息不对称的情况下,以最低的风险把钱借出去。
因此大数据就在业务中起到了至关重要的作用,数据越多,数据的种类越丰富,数禾科技对用户的了解就会越全面,风险评估越准确,风险控制也会相对有效。
但是随着业务的发展,数据会越积越多,场景也会越来越复杂,传统的大数据架构已经难以满足面向大规模用户做精准风控的需要。当数据的体量达到一定的级别,当数据的多样性达到一定的复杂度,数禾科技就急需一种更加高效、更加灵活、更加低成本的解决方案。
业务难点
数据日渐精细化,如何做到数据的降本增效
在数据存储方面,随着业务的发展与用户数据的精细化,数据规模日渐庞大,而数据类型也在逐渐多样化。因此如何将海量不同类型的数据进行统一存储与治理,并在风控精准度和数据成本之间做有效的平衡,是数禾科技不得不面对的一个问题。
如何提高风控模型精准度,让风控AI更加智能
为了提高风控模型的精准度,让风控AI更加智能,因此需要利用大数据进行多次且全面的计算。因此数禾科技需要长期投入大量的计算资源和存储资源,以此来让系统持续不断地学习,让风控评估更加精准。
数据量大幅度增加,早期架构已无法支撑大规模计算
由于早期采用线下搭建开源大数据集群的解决方案,近几年数据量大幅增加,但计算资源和存储资源却不能随着实际需求进行弹性变化。而且离线
计算和实时计算,互相争抢资源,单点故障解决起来非常吃力。
阿里云数据湖解决方案
针对数禾科技在日常业务中面临到的数据统一存储和治理、计算性能和高弹性的需求,阿里云为其搭建了统一的数据湖解决方案。
在数据统一存储和治理层面,阿里云为其提供了对象存储统一的存储资源池,各种类型的数据可集中统一存储在OSS对象存储,解决数据孤岛现象,避免多份数据分散在多种不同的系统,实现无缝对接多种计算引擎。同时阿里云对象存储OSS还为数禾科技的数据提供了12个9的安全保障以及数据冷热分层功能,帮助数禾科技最大程度地保护数据安全和降低数据存储成本。
在数据计算层面,阿里云将数禾科技的实时计算完全剥离出来放在由阿里云EMR构建的大数据计算集群上。同时为其提供了包括Hadoop、Hive、Spark、Presto在内的多种大数据计算引擎,帮助其根据业务需要选择最合适的开源工具,最大程度地提升数据运算的能力。
在弹性方面,由于阿里云OSS+EMR构建的流批一体数据湖架构,数禾科技可以将把所有的数据做好分类后,放在不同的OSS桶里面,上面开启若干个计算资源独立的EMR集群,这些集群可以按场景来划分,也可以按职能部门来划分,随时需要随时创建,用完即删,然后还可以按需自动扩容,做到了真正的弹性计算。
达到的效果:
采用阿里云数据湖解决方案后,数禾科技做到了全面记录、全面是实时化、全面治理、场景驱动和安全合规的数据管理之道。帮助数禾科技真正实现数据驱动业务发展,真正地实现一切业务数据化,以及一切数据业务化。