产品3周迭代一次,启信宝驾驭8000万企业征信的平台架构-阿里云开发者社区

开发者社区> 百遇> 正文

产品3周迭代一次,启信宝驾驭8000万企业征信的平台架构

简介: 启信宝的企业数据范围广、维度多,覆盖8000万以上的企业, 19个产业链,95个细分行业,100个以上企业数据维度,企业覆盖率达98%以上。
+关注继续查看
11+大数据行业应用实践请见https://yq.aliyun.com/activity/156,同时这里还有流计算、机器学习、性能调优等技术实践。此外,通过Maxcompute及其配套产品,低廉的大数据分析仅需几步,详情访问https://www.aliyun.com/product/odps;更多精彩内容参见云栖社区大数据频道https://yq.aliyun.com/big-data 。

启信宝的核心功能包括搜索引擎、企业链图、关系族谱、企业监控、企业舆情以及企业信用报告等。启信宝目前支持APP、网页以及微信三种不同版本,另外还提供API调用方式。客户主要面向个人客户和企业客户,目前个人用户数已达到800万以上,企业客户以金融行业为主。

启信宝的大数据平台挑战

启信宝作为一家以大数据为核心竞争力的公司,借助大数据为客户降低执业风险、经营风险、投资风险和借贷风险,为客户提供数据解决方案以进行精准营销、拓客展业,为客户借贷管理、投资理财提供决策依据。主要面临的挑战为:

1.高时效性。作为一家成立时间较短的企业,为了不断满足客户新的需求以及提升客户体验,并快速确立市场领先地位,产品的迭代需要非常快速,基本上三周以内会迭代一次,而且通过每一次的迭代在数据上、挖掘上都需要有一些可以打动客户的亮点,这就要求采用的大数据平台能够满足时效性的需要。

2.低成本。作为创业公司,不仅对时效性有很高要求,成本也是重要的考量因素,需要以采用的大数据平台能够支撑快速、高效、低成本的产品迭代。

3.数据处理量巨大、对数据变化的实时性要求高。目前,启信宝仅日志数据的数据量已达到TB级别,每天会对日志数据进行几十个任务的调度处理来进行日志分析。另外,舆情方面的数据实时性要求较高,需要实时处理及更新并能够实时进行内容多维查询和统计分析。

4.可扩展性。作为一家数据公司,需要大数据平台能够应对未来极有可能发生的的数据量的爆发式增长,架构可伸缩,弹性的满足需要,避免不必要的IT费用。另外,未来启信宝将会在大数据采集和挖掘上持续发力,在企业信用信息展示的前提下,同时注重挖掘企业背后的舆情信息及商业关系,这就需要大数据平台的功能可扩展,既可以满足数据采集处理、可视化报表展示、多维分析等基本需求,也可以满足预测分析、机器学习及人工智能等方面的高阶分析需求。

5.数据融合工作的复杂性。启信宝的数据来源非常丰富,因此需要跟周边各种数据源打通。举个例子,有些大数据项目真正进行开发算法、模型的时间会很短,大概一两天左右就可以完成,但这往往仅为“冰山一角”,实际上,由于数据兼容性问题,数据准备工作异常繁杂,可能会用到一周甚至更长的时间。难怪最近纽约时报惊呼:“数据科学家把高达 80%的时间用于数据准备而不是用来发现新的商业智能”。

启信宝的大数据平台方案

启信宝作为垂直企业信息搜索平台,立足于企业征信信息的披露,基于海量大数据,为泛金融、泛投资、泛法律和商务用户提供企业信息画像、风险管理、营销决策等可量化数据服务,以客户为中心,让数据说话,让商业更真实。启信宝基于阿里云数加平台进行数据的整理和分析。
  1. 主要数据来源:互联网采集的数据以及API调用的第三方的企业数据。
  2. 数据处理分析:应用数据采集到阿里云存储容器,通过数加平台进行二次加工处理,最终同步到阿里云存储容器中进行数据展现分析。
  3. 应用层:支撑企业图谱、企业监控、深度报告、搜索引擎等不同产品形态。

方案涉及的阿里云数加平台组件有:
  1. 大数据计算服务(MaxCompute)
  2. 大数据开发套件(DataIDE)
  3. 分析型数据库(AnalyticDB)

启信宝云平台选择思考

1. 阿里云数加和基础云服务平台的敏捷性很好的支撑了启信宝产品的快速迭代。启信宝的第一个版本微信版本于2015年5月初上线,到现如今启信宝已上线APP版、Web版,同时还支持API外接,业务也做了相应扩充,分别面向个人和企业客户,通过客户需求不断的推进和拓展,期间经历了大量的小版本迭代。目前,2C的业务,客户反馈较好、活跃度较高,反映在是使用时长等各方面;2B业务,结合行业应用场景以及启信宝自身数据,正在不断提供一些更好的行业解决方案。启信宝创始人金志浩说:“从2015年开始,启信宝伴随着阿里云一起高速发展,通过阿里云产品的使用,确实能帮我们节省很多时间,要不然我们全部自己搞定,时间周期太长,自建的话时效性根本跟不上。”

2. 使用阿里云数加,成本大大降低。“阿里云数加的整个数据处理流程非常完善;其次,我觉得这一块的成本会比较便宜,而且可以节省我们大量的人力,这也是很重要的一块;另外,售后技术服务周到快速也是我们选择阿里云数加的原因之一。”创始人金志浩谈到为什么选择阿里云数加时讲到。

3. 阿里云数加的按需付费模式以及产品功能完备性,使得启信宝对未来快速发展更具信心。阿里云完全满足启信宝未来数据吞吐量和可扩展性的需要,阿里云数加包含大数据基础服务、数据分析与展现、数据应用以及人工智能的大数据全链路产品,经过阿里内部锤炼和业务验证,可以支撑EB级数据海量处理。

4. 阿里云的大数据产品生态具有完备性和开放性两大特点,打破数据融合瓶颈,大大提升了产品开发效率。阿里云提供四通八达的数据传输交互服务,让数据不再成为孤岛,加速数据融合。

版权声明:本文内容由阿里云实名注册用户自发贡献,版权归原作者所有,阿里云开发者社区不拥有其著作权,亦不承担相应法律责任。具体规则请查看《阿里云开发者社区用户服务协议》和《阿里云开发者社区知识产权保护指引》。如果您发现本社区中有涉嫌抄袭的内容,填写侵权投诉表单进行举报,一经查实,本社区将立刻删除涉嫌侵权内容。

相关文章
阿里云服务器怎么设置密码?怎么停机?怎么重启服务器?
如果在创建实例时没有设置密码,或者密码丢失,您可以在控制台上重新设置实例的登录密码。本文仅描述如何在 ECS 管理控制台上修改实例登录密码。
4059 0
怎么设置阿里云服务器安全组?阿里云安全组规则详细解说
阿里云服务器安全组设置规则分享,阿里云服务器安全组如何放行端口设置教程
6892 0
阿里云服务器端口号设置
阿里云服务器初级使用者可能面临的问题之一. 使用tomcat或者其他服务器软件设置端口号后,比如 一些不是默认的, mysql的 3306, mssql的1433,有时候打不开网页, 原因是没有在ecs安全组去设置这个端口号. 解决: 点击ecs下网络和安全下的安全组 在弹出的安全组中,如果没有就新建安全组,然后点击配置规则 最后如上图点击添加...或快速创建.   have fun!  将编程看作是一门艺术,而不单单是个技术。
4464 0
使用OpenApi弹性释放和设置云服务器ECS释放
云服务器ECS的一个重要特性就是按需创建资源。您可以在业务高峰期按需弹性的自定义规则进行资源创建,在完成业务计算的时候释放资源。本篇将提供几个Tips帮助您更加容易和自动化的完成云服务器的释放和弹性设置。
7745 0
阿里云服务器安全组设置内网互通的方法
虽然0.0.0.0/0使用非常方便,但是发现很多同学使用它来做内网互通,这是有安全风险的,实例有可能会在经典网络被内网IP访问到。下面介绍一下四种安全的内网互联设置方法。 购买前请先:领取阿里云幸运券,有很多优惠,可到下文中领取。
9416 0
阿里云服务器如何登录?阿里云服务器的三种登录方法
购买阿里云ECS云服务器后如何登录?场景不同,云吞铺子总结大概有三种登录方式: 登录到ECS云服务器控制台 在ECS云服务器控制台用户可以更改密码、更换系统盘、创建快照、配置安全组等操作如何登录ECS云服务器控制台? 1、先登录到阿里云ECS服务器控制台 2、点击顶部的“控制台” 3、通过左侧栏,切换到“云服务器ECS”即可,如下图所示 通过ECS控制台的远程连接来登录到云服务器 阿里云ECS云服务器自带远程连接功能,使用该功能可以登录到云服务器,简单且方便,如下图:点击“远程连接”,第一次连接会自动生成6位数字密码,输入密码即可登录到云服务器上。
16791 0
阿里云ECS云服务器初始化设置教程方法
阿里云ECS云服务器初始化是指将云服务器系统恢复到最初状态的过程,阿里云的服务器初始化是通过更换系统盘来实现的,是免费的,阿里云百科网分享服务器初始化教程: 服务器初始化教程方法 本文的服务器初始化是指将ECS云服务器系统恢复到最初状态,服务器中的数据也会被清空,所以初始化之前一定要先备份好。
3225 0
+关注
38
文章
30
问答
来源圈子
更多
MaxCompute(原ODPS)是一项面向分析的大数据计算服务,它以Serverless架构提供快速、全托管的在线数据仓库服务,消除传统数据平台在资源扩展性和弹性方面的限制,最小化用户运维投入,使您经济并高效的分析处理海量数据。
+ 订阅
文章排行榜
最热
最新
相关电子书
更多
文娱运维技术
立即下载
《SaaS模式云原生数据仓库应用场景实践》
立即下载
《看见新力量:二》电子书
立即下载