OSDI '18重磅解密:蚂蚁金服实时金融级分布式图数据库GeaBase

简介: 小蚂蚁说: GeaBase是具备高性能、高可用、高扩展性及可移植性强的实时金融级分布式图数据库,广泛应用于蚂蚁金服风控、社交、推荐等技术场景。“过无人区” 、“Made in China” 、“反哺”是GeaBase的几个耀眼标签。

小蚂蚁说:

GeaBase是具备高性能、高可用、高扩展性及可移植性强的实时金融级分布式图数据库,广泛应用于蚂蚁金服风控、社交、推荐等技术场景。“过无人区” 、“Made in China” 、“反哺”是GeaBase的几个耀眼标签。每年的支付宝春节红包、每一笔交易的反洗钱识别等等,背后的技术都少不了它的身影。

背景阅读:以往文章《GeaBase,中国首个金融级分布式图数据库诞生记》


5acd7828b35d92d75a1b9ab574fc92b1a397b020


当地时间2018年10月8日-10日,全球极富盛名的计算机学界顶级学术会议OSDI '18(USENIX Symposium on Operating Systems Design and Implementation,简称OSDI)在美国加州卡尔斯巴德举办。


OSDI '18重磅解密:蚂蚁金服实时金融级分布式图数据库GeaBase


OSDI大会期间,在蚂蚁金服主办的专题研讨会上,其中主题为《GeaBase: A High-Performance Distributed Graph Database for Industry-Scale Applications》的演讲吸引了多位来自全球的顶尖技术专家和学者,并引发了现场热烈的讨论。


OSDI '18重磅解密:蚂蚁金服实时金融级分布式图数据库GeaBase


蚂蚁金服集团计算存储首席架构师何昌华

图数据库“明星”——蚂蚁金服GeaBase

众所周知,近十年来,图数据库一直是业界关注的焦点,未来的前景也被普遍看好,其最大优点是通过节点和关联的数据模型去快速解决复杂的关系问题。毫不夸张地说,图数据库是为当前丰富、快速变化的互联网应用场景而生的,因为它非常善于处理大量的、复杂的、关联的、多变的网状数据,而且具备奇高的效率。

由于图数据库拥有独一无二的特性,因此它非常适合在社交网络、实时推荐、银行交易环路、金融征信系统等领域应用。基于此,蚂蚁金服前瞻性地在2015年成立了专门研发图数据库的技术团队,在仅仅3年多时间里,成功研发出具有高性能、高可用性、扩展能力强和极佳移植性的GeaBase。


OSDI '18重磅解密:蚂蚁金服实时金融级分布式图数据库GeaBase


蚂蚁金服平台数据技术事业群高级算法专家付志嵩

据蚂蚁金服集团相关技术专家介绍,GeaBase(Graph Exploration and Analytics Database)是蚂蚁金服完全自主研发的实时金融级分布式图数据库,目前,GeaBase不仅广泛应用于蚂蚁金服的生态体系内,而且已经商业化和技术对外开发,正与多家银行等企业开展合作。


OSDI '18重磅解密:蚂蚁金服实时金融级分布式图数据库GeaBase


蚂蚁金服平台数据技术事业群高级技术专家肖涵

GeaBase到底强在哪里?

据介绍,蚂蚁金服研发GeaBase的初衷是为了满足超大规模复杂关系网络在金融领域中的各类应用场景,既要支撑线上高并发、低延迟的实时查询需求,又要满足大规模模型训练的迭代运算。


OSDI '18重磅解密:蚂蚁金服实时金融级分布式图数据库GeaBase


GeaBase的技术架构

一起看看GeaBase的基本特性。

首先,GeaBase支持海量的数据。目前,GeaBase支撑着蚂蚁金服的多个关键应用场景,包括风控关系网络、资金关系网络,都达到百亿个节点、千亿条边的海量数据规模,其计算查询能力达到了非常高的水准。

其次,GeaBase拥有非常强悍的在线查询性能,支持高并发,且具备毫秒级的低延时能力。通过与Titan的对比,可以看到无论是延时还是吞吐量,GeaBase的查询性能都领先许多。

GeaBase还具备高可用的特性。其配置了多种容错机制,引入了多集群和多方位的监控体系,并配备了分布式架构的容灾方案,这一切都是为了保证高可用性。

蚂蚁金服还为GeaBase研发了灵活且可扩展的查询语言。另外,为了和开源结合,GeaBase还将支持Gremlin图遍历语言。

GeaBase的雄心:商业化和技术开发

据了解,GeaBase现在支撑着蚂蚁金服旗下支付的风险控制、反洗钱、反欺诈、反刷单、反套现、金融案件审理、知识图谱、会员拉新、好友推荐、理财资讯推荐等众多的业务和应用。

尽管已经在蚂蚁金服的生态的多个业务场景得到广泛应用,但GeaBase的雄心显然不止于此,它是蚂蚁金服整体的金融科技开放战略的坚定执行者。

目前,业界很多互联网公司都在做图数据库方面的研究工作,但其中绝大多数都是基于自身系统的,因此具有较强的依赖性,剥离起来比较麻烦。而现在市面上已经商业化的图数据库又几乎都不是分布式的系统,其目标用户也主要是数据量较小的中小型企业。

蚂蚁金服在设计之初就充分考虑了GeaBase系统移植的问题,因此,将其封装成产品,打造为高效易用的接入和管控产品化平台。这样的好处显而易见,那就是GeaBase可以轻松地移植到外部客户的系统之中,也正因为如此,GeaBase受到银行等企业的热烈追捧。据介绍,目前已经有十余家银行有意向配置GeaBase,而且部分企业已经与蚂蚁金服签订合作协议。

关于GeaBase的更多内容,请浏览蚂蚁金融科技官网:

https://tech.antfin.com/


— END —

蚂蚁金服官方唯一对外技术传播渠道

投稿邮箱:anttechpr@service.alipay.com

欢迎留言及个人转发,媒体转载请联系授权

OSDI '18重磅解密:蚂蚁金服实时金融级分布式图数据库GeaBase
相关实践学习
阿里云图数据库GDB入门与应用
图数据库(Graph Database,简称GDB)是一种支持Property Graph图模型、用于处理高度连接数据查询与存储的实时、可靠的在线数据库服务。它支持Apache TinkerPop Gremlin查询语言,可以帮您快速构建基于高度连接的数据集的应用程序。GDB非常适合社交网络、欺诈检测、推荐引擎、实时图谱、网络/IT运营这类高度互连数据集的场景。 GDB由阿里云自主研发,具备如下优势: 标准图查询语言:支持属性图,高度兼容Gremlin图查询语言。 高度优化的自研引擎:高度优化的自研图计算层和存储层,云盘多副本保障数据超高可靠,支持ACID事务。 服务高可用:支持高可用实例,节点故障迅速转移,保障业务连续性。 易运维:提供备份恢复、自动升级、监控告警、故障切换等丰富的运维功能,大幅降低运维成本。 产品主页:https://www.aliyun.com/product/gdb
目录
相关文章
|
6天前
|
机器学习/深度学习 存储 人工智能
新一代数据库技术:融合人工智能与分布式系统的未来前景
传统数据库技术在应对大规模数据处理和智能化需求方面逐渐显露出瓶颈。本文探讨了新一代数据库技术的发展趋势,重点关注了人工智能与分布式系统的融合,以及其在未来数据管理和分析中的潜在优势。通过深度学习和自动化技术,新型数据库系统能够实现更高效的数据处理和智能化决策,为企业带来更灵活、可靠的数据解决方案。
|
6天前
|
算法 Go 分布式数据库
构建高可用的分布式数据库集群:使用Go语言与Raft共识算法
随着数据量的爆炸式增长,单一数据库服务器已难以满足高可用性和可扩展性的需求。在本文中,我们将探讨如何使用Go语言结合Raft共识算法来构建一个高可用的分布式数据库集群。我们不仅会介绍Raft算法的基本原理,还会详细阐述如何利用Go语言的并发特性和网络编程能力来实现这一目标。此外,我们还将分析构建过程中可能遇到的挑战和解决方案,为读者提供一个完整的实践指南。
|
6天前
|
存储 Cloud Native 关系型数据库
PolarDB-X 是面向超高并发、海量存储和复杂查询场景设计的云原生分布式数据库系统
【5月更文挑战第14天】PolarDB-X 是面向超高并发、海量存储和复杂查询场景设计的云原生分布式数据库系统
43 2
|
6天前
|
存储 Java 分布式数据库
【分布式计算框架】HBase数据库编程实践
【分布式计算框架】HBase数据库编程实践
13 1
|
6天前
|
存储 NoSQL 大数据
分布式数据库有哪几种
数据库的发展从早期的单机数据库,到现在的分布式数据库。在单机数据库时代,所有的数据都存储在单机中,随着计算机技术的发展,开始出现了多台计算机联合处理数据的需求,从而诞生了分布式数据库。
|
6天前
|
存储 负载均衡 Go
【Go 语言专栏】使用 Go 语言实现分布式数据库操作
【4月更文挑战第30天】本文探讨了使用Go语言实现分布式数据库操作,强调其在并发性能、网络编程、语法简洁和跨平台性上的优势。关键技术和步骤包括数据分片、数据同步、负载均衡及故障转移。通过实例分析和挑战解决,展示了Go语言在大规模数据处理中的高效与可靠性,为开发者提供指导。
|
6天前
|
SQL 监控 关系型数据库
TiDB 分布式数据库快速入门详解
这些示例展示了TiDB的一些基本操作。实际使用时,你可能需要根据具体的业务需求和环境进行调整和优化。
|
6天前
|
存储 运维 物联网
【专栏】OceanBase 是一款先进的分布式数据库系统,以其分布式架构、高扩展性、高可用性和强一致性特点,应对大规模数据处理挑战
【4月更文挑战第29天】OceanBase 是一款先进的分布式数据库系统,以其分布式架构、高扩展性、高可用性和强一致性特点,应对大规模数据处理挑战。它支持混合负载,适用于金融、电商和物联网等领域,提供高性能、低成本的解决方案。尽管面临技术复杂性、数据迁移和性能优化等问题,通过合理策略可克服挑战。随着技术发展,OceanBase 在数字化时代将持续发挥关键作用。
|
6天前
|
存储 安全 数据管理
新一代数据库技术:融合区块链与分布式存储的未来趋势
传统数据库技术在数据安全性和分布式处理方面存在局限,而新一代数据库技术正日益融合区块链和分布式存储,为数据管理带来革命性变革。本文探讨了这一趋势的发展方向,以及如何利用新技术实现更高效的数据管理与保护。
|
6天前
|
运维 关系型数据库 分布式数据库
PolarDB产品使用合集之在选择分布式数据库时,主要考虑是什么
PolarDB产品使用合集涵盖了从创建与管理、数据管理、性能优化与诊断、安全与合规到生态与集成、运维与支持等全方位的功能和服务,旨在帮助企业轻松构建高可用、高性能且易于管理的数据库环境,满足不同业务场景的需求。用户可以通过阿里云控制台、API、SDK等方式便捷地使用这些功能,实现数据库的高效运维与持续优化。