OSDI '18重磅解密:蚂蚁金服实时金融级分布式图数据库GeaBase

简介: 蚂蚁金服在2015年成立了专门研发图数据库的技术团队,在仅仅3年多时间里,成功研发出具有高性能、高可用性、扩展能力强和极佳移植性的GeaBase。

导读:GeaBase是具备高性能、高可用、高扩展性及可移植性强的实时金融级分布式图数据库。

当地时间2018年10月8日-10日,全球极富盛名的计算机学界顶级学术会议OSDI '18(USENIX Symposium on Operating Systems Design and Implementation,简称OSDI)在美国加州卡尔斯巴德举办。
1

OSDI大会期间,在蚂蚁金服主办的专题研讨会上,主题为《GeaBase: A High-Performance Distributed Graph Database for Industry-Scale Applications》的演讲吸引了数十位来自全球的顶尖技术专家和学者,并引发了现场热烈的讨论。

2
蚂蚁金服集团计算存储首席架构师何昌华

图数据库“明星”——蚂蚁金服GeaBase

众所周知,近十年来,图数据库一直是业界关注的焦点,未来的前景也被普遍看好,其最大优点是通过节点和关联的数据模型去快速解决复杂的关系问题。毫不夸张地说,图数据库是为当前丰富、快速变化的互联网应用场景而生的,因为它非常善于处理大量的、复杂的、关联的、多变的网状数据,而且具备奇高的效率。

由于图数据库拥有独一无二的特性,因此它非常适合在社交网络、实时推荐、银行交易环路、金融征信系统等领域应用。基于此,蚂蚁金服前瞻性地在2015年成立了专门研发图数据库的技术团队,在仅仅3年多时间里,成功研发出具有高性能、高可用性、扩展能力强和极佳移植性的GeaBase。

3
蚂蚁金服平台数据技术事业群高级算法专家付志嵩

据蚂蚁金服集团相关技术专家介绍,GeaBase(Graph Exploration and Analytics Database)是蚂蚁金服完全自主研发的实时金融级分布式图数据库,目前,GeaBase不仅广泛应用于蚂蚁金服的生态体系内,而且已经技术开放,正与多家银行等企业开展合作。

4
蚂蚁金服平台数据技术事业群高级技术专家肖涵

GeaBase到底强在哪里?

据介绍,蚂蚁金服研发GeaBase的初衷是为了满足超大规模复杂关系网络在金融领域中的各类应用场景,既要支撑线上高并发、低延迟的实时查询需求,又要满足大规模模型训练的迭代运算。

5
GeaBase的技术架构

一起看看GeaBase的基本特性。

首先,GeaBase支持海量的数据。目前,GeaBase支撑着蚂蚁金服的多个关键应用场景,包括风控关系网络、资金关系网络,都达到百亿个节点、千亿条边的海量数据规模,其计算查询能力达到了非常高的水准。

其次,GeaBase拥有非常强悍的在线查询性能,支持高并发,且具备毫秒级的低延时能力。通过与Titan的对比,可以看到无论是延时还是吞吐量,GeaBase的查询性能都领先许多。

GeaBase还具备高可用的特性。其配置了多种容错机制,引入了多集群和多方位的监控体系,并配备了分布式架构的容灾方案,这一切都是为了保证高可用性。

蚂蚁金服还为GeaBase研发了灵活且可扩展的查询语言。另外,为了和开源结合,GeaBase还将支持Gremlin图遍历语言。

GeaBase的雄心:技术开放

据了解,GeaBase现在支撑着蚂蚁金服旗下支付的风险控制、反洗钱、反欺诈、反刷单、反套现、金融案件审理、知识图谱、会员拉新、好友推荐、理财资讯推荐等众多的业务和应用。

尽管已经在蚂蚁金服的生态的多个业务场景得到广泛应用,但GeaBase的雄心显然不止于此,它是蚂蚁金服整体技术开放战略的坚定执行者。

目前,业界很多互联网公司都在做图数据库方面的研究工作,但其中绝大多数都是基于自身系统的,因此具有较强的依赖性,剥离起来比较麻烦。而现在市面上已经商业化的图数据库又几乎都不是分布式的系统,其目标用户也主要是数据量较小的中小型企业。

蚂蚁金服在设计之初就充分考虑了GeaBase系统移植的问题,因此,将其封装成产品,打造为高效易用的接入和管控产品化平台。这样的好处显而易见,那就是GeaBase可以轻松地移植到外部客户的系统之中,也正因为如此,GeaBase受到银行等企业的热烈追捧。据介绍,目前已经有十余家银行有意向配置GeaBase,而且部分企业已经与蚂蚁金服签订合作协议。

关于GeaBase的更多内容,请浏览蚂蚁金融科技官网:https://tech.antfin.com/

相关实践学习
阿里云图数据库GDB入门与应用
图数据库(Graph Database,简称GDB)是一种支持Property Graph图模型、用于处理高度连接数据查询与存储的实时、可靠的在线数据库服务。它支持Apache TinkerPop Gremlin查询语言,可以帮您快速构建基于高度连接的数据集的应用程序。GDB非常适合社交网络、欺诈检测、推荐引擎、实时图谱、网络/IT运营这类高度互连数据集的场景。 GDB由阿里云自主研发,具备如下优势: 标准图查询语言:支持属性图,高度兼容Gremlin图查询语言。 高度优化的自研引擎:高度优化的自研图计算层和存储层,云盘多副本保障数据超高可靠,支持ACID事务。 服务高可用:支持高可用实例,节点故障迅速转移,保障业务连续性。 易运维:提供备份恢复、自动升级、监控告警、故障切换等丰富的运维功能,大幅降低运维成本。 产品主页:https://www.aliyun.com/product/gdb
目录
打赏
0
0
0
0
3375
分享
相关文章
乐观锁在分布式数据库中如何与事务隔离级别结合使用
乐观锁在分布式数据库中如何与事务隔离级别结合使用
乐观锁在分布式数据库中如何与事务隔离级别结合使用
乐观锁在分布式数据库中如何与事务隔离级别结合使用
【YashanDB 知识库】用 yasldr 配置 Bulkload 模式作单线程迁移 300G 的业务数据到分布式数据库,迁移任务频繁出错
问题描述 详细版本:YashanDB Server Enterprise Edition Release 23.2.4.100 x86_64 6db1237 影响范围: 离线数据迁移场景,影响业务数据入库。 外场将部分 NewCIS 的报表业务放到分布式数据库,验证 SQL 性能水平。 操作系统环境配置: 125G 内存 32C CPU 2T 的 HDD 磁盘 问题出现的步骤/操作: 1、部署崖山分布式数据库 1mm 1cn 3dn 单线启动 yasldr 数据迁移任务,设置 32 线程的 bulk load 模式 2、观察 yasldr.log 是否出现如下错
体验用分布式数据库突破资源瓶颈,完成任务领智能台灯!
体验用分布式数据库突破资源瓶颈,完成任务领智能台灯!
PolarDB分布式版:与云融合的分布式数据库发展新阶段
PolarDB分布式版标志着分布式数据库与云融合的新阶段。它经历了三个发展阶段:从简单的分布式中间件,到一体化分布式架构,再到云原生分布式数据库。PolarDB充分利用云资源的弹性、高性价比、高可用性和隔离能力,解决了大规模数据扩展性问题,并支持多租户场景和复杂事务处理。零售中台的建设背景包括国家数字化转型战略及解决信息孤岛问题,采用分布式数据库提升高可用性和性能,满足海量订单处理需求。展望未来,零售中台将重点提升容灾能力、优化资源利用并引入AI技术,以实现更智能的服务和更高的业务连续性。
115 9
OceanBase 入门:分布式数据库的基础概念
【8月更文第31天】在当今的大数据时代,随着业务规模的不断扩大,传统的单机数据库已经难以满足高并发、大数据量的应用需求。分布式数据库应运而生,成为解决这一问题的有效方案之一。本文将介绍一款由阿里巴巴集团自主研发的分布式数据库——OceanBase,并通过一些基础概念和实际代码示例来帮助读者理解其工作原理。
635 0
PolarDB 分布式版 V2.0,安全可靠的集中分布式一体化数据库管理软件
阿里云PolarDB数据库管理软件(分布式版)V2.0 ,安全可靠的集中分布式一体化数据库管理软件。
Citus 简介,将 Postgres 转换为分布式数据库
【10月更文挑战第4天】Citus 简介,将 Postgres 转换为分布式数据库
166 4
|
5月前
|
一款基于分布式文件存储的数据库MongoDB的介绍及基本使用教程
一款基于分布式文件存储的数据库MongoDB的介绍及基本使用教程
98 0

热门文章

最新文章

AI助理

你好,我是AI助理

可以解答问题、推荐解决方案等