2019年7月10日,在中国互联网大会数字金融发展论坛上,蚂蚁金服OceanBase商业化资深总监韩鸿源(老邯)发表主题演讲,分享了蚂蚁金服分布式架构的核心技术能力,以及以OceanBase数据库为代表的分布式产品的最佳业务实践。
很多人对蚂蚁金服的了解还仅仅停留在支付宝,其实今天的蚂蚁金服已经逐步成长为大型的金融集团,覆盖了很多范围的业务,这些业务中不仅包括超过8.7亿实名注册用户,日活2亿多的支付宝APP,还包括服务亿级免押业务的芝麻信用,以及累积发放超过17000亿贷款已全面上云的网商银行等等。
所有这些业务的后台实际上是基于蚂蚁金服的一整套技术能力,通过分布式架构和分布式产品有效支撑这些业务持续、稳定、可靠地运行。今天,从技术能力完整性的角度来看,没有一个企业能够做成所有的事情。
作为金融科技行业的领先企业,蚂蚁金服和我们背后的阿里巴巴集团共同深耕,持续多年做了大量的技术积累,在技术方面做了全堆栈的技术覆盖:从最底层的硬件,到上层系统的软件,再到更上层的应用系统,都是由我们自己完全自主研发,独立建设的系统。
图1:蚂蚁金服分布式金融核心套件
从蚂蚁金服的技术积累来看,整体的分布式金融核心实际上是来源于分布式架构的使用。当产品有机的跟分布式架构结合之后,形成了一套整体的支撑能力,包括了海量业务的处理能力和高可靠高可用的核心技术能力,来帮助我们有效地运行所有的业务。
蚂蚁金服拥有自研的分布式数据库和中间件,同时也拥有技术风险防控和开发运维两大数据平台。当完成了这样一套分布式的整体架构的搭建之后,如何在庞大的分布式架构下持续、稳定、可靠的运行成为了更核心的问题。我们在业务层面做了这些抽象之后,形成了自己特有的行业性的业务能力,这些产品都是面向市场对客户输出并且不断从市场中收集反馈优化迭代而成的,而不是关起门自己研究自己用,这些产品已经实际帮助了很多企业业务系统的构建和发展。
图2:分布式架构带来的价值
阿里巴巴每年都有大规模的促销活动,业务驱动了技术的飞速发展,创造了很多世界瞩目的纪录。这些纪录里有很多跟性能、稳定性相关的因素,而这些都来源于我们背后持续不断的的技术能力的积累和沉淀。今天大家可以看到,蚂蚁金服已经能够达到99.99%的高可用性和超过25万笔/秒的高并发交易数等等。这些数据的背后是蚂蚁金服分布式金融核心的整体技术能力的体现。
图3:OceanBase发展历程
在蚂蚁金服整体架构中,其中有一个很基础的要素,同时也是非常核心的产品——就是我们的OceanBase分布式数据库。OceanBase至今已经发展了近十年时间。在过去十年,OceanBase经历了一个漫长的发展过程。从2010年开始发布第一个版本,应用在淘宝收藏夹的核心业务中,到2014年的0.5版本全面应用于网商银行,再到2019年最新发布的2.x版本,目前已经有非常多的内外部用户都在核心系统中使用。
OceanBase是由阿里巴巴和蚂蚁金服拥有100%自主知识产权的分布式关系数据库。OceanBase没有依赖任何开源数据库或者存储引擎的相关代码,而是从第一行代码开始就完全自主研发的分布式数据库产品。
图4:OceanBase特性
从客户使用角度来看,OceanBase数据库对于用户来说有一个很大的优势,我们以分布式的方式把分布式的机器搭建起来以后,用户在实际使用的时候依然是集中式的使用方式。客户可以忽略掉所有后台的差异,而把分布式数据库当成跟传统集中式数据库一样的方式使用。
从性能角度来看,在2017年,OceanBase就已经创造了非常高的性能指标。在2017年的双11,已经达到了每秒25.6万笔的交易峰值。大家在谈数据库的时候,往往感兴趣的都是一个单一的性能指标。实际上对于数据库来说,可靠性、可用性和可扩展性往往比单一的性能指标更重要。对于一个数据库来说,很多时候它能否做到在扩展之后仍然能够快速把资源利用起来,这在实际业务中其实有比较大的挑战。
在兼容性方面来看,其实今天很多金融机构已经运行在传统数据库里了,当我们想把这些客户从原有的数据库迁移到一个更有效运行的数据库的时候,兼容性是必须要考虑的一项能力。所以OceanBase做了很大的努力跟主流的技术栈做兼容,方便用户发挥既有投资的价值,并且让用户能够维持原来已经形成的使用习惯。
最后一点,也是今天很多金融机构都非常关心的一项能力——容灾。当分布式架构改造完成之后,实际上已经可以把你的能力提升到一个更高的阶段。 如下方的示意图所示,今天蚂蚁金服/支付宝的主生产系统和我们支撑的网商银行的整个银行系统,其实都运行在这个架构之上。它已经不是一个多中心之间互相做灾备的架构,而是一个多地多中心多活的架构。
图5:蚂蚁金服三地五中心高可用方案示意图
在多活架构情况下,实际上我们可以做到在不同的中心之间任意的去划拨用户的流量。 在2018年的云栖大会上蚂蚁金服副CTO胡喜在ATEC主论坛现场模拟挖断支付宝近一半服务器的光缆。结果只用了26秒,模拟环境中的支付宝就完全恢复了正常。而这场26秒自断服务器现场演示的技术核心其实正是基于OceanBase的三地五中心架构方案。
图6:2018年云栖大会现场剪光缆
今天如果剪掉任何一根光纤,切掉任何一个数据中心都完全不会影响到支付宝和网商银行的业务运行。OceanBase数据库的这些核心技术能力,在金融机构的众多应用场景里具有非常大的发挥空间和使用前景。未来,蚂蚁金服OceanBase数据库将在金融科技领域持续深耕不断打磨自身,通过不断迭代的产品帮助更多企业、更多业务稳妥创新,持续成长。