第三代分布式数据库来了,真香!-阿里云开发者社区

开发者社区> 技术小达人> 正文

第三代分布式数据库来了,真香!

简介: 从3.0开始,OceanBase 正式步入第三代企业级分布式数据库序列。其实很多人不知道,今年6月,OceanBase 开源的版本能力并不弱于2020年双十一支付宝在线使用的版本。
+关注继续查看


121.gif


从3.0开始,OceanBase 正式步入第三代企业级分布式数据库序列。其实很多人不知道,今年6月,OceanBase 开源的版本能力并不弱于2020年双十一支付宝在线使用的版本。


集中式和分布式怎么选?是数据库选型中最让人纠结的问题。之所以纠结,是因为二者各有优势,却熊掌与鱼不能兼得。

比如:1、 不想分库分表,应用开发都要哭了……2、 业务发展特别快,数据库又要扩容了……3、 不知道哪些是AP哪些是TP,没办法把业务拆分出来……4、 大机挂了,只能等厂商恢复,不敢切流……5、 为什么备库不能提供服务?服务器白白浪费了……6、 分布式数据库部署了几十台服务器,性能还不如一套 Oracle RAC……7、 原先使用 Oracle,迁移到国内某数据库应用,改业务快崩溃了……8、 跑批的时候交易性能总是抖动……9、 多个部门使用一套数据库,互相干扰……

以上问题均来自真实的用户声音,这些需求从本质上来说,是用户既需要分布式可扩展、高可用的能力、也需要集中式的功能、性能及易用性。那么,有没有一个产品或者解决方案能解决以上所有问题?以前没有,但现在有了,那就是第三代企业级分布式数据库。

近日,在刚刚结束的 DTCC 2021大会上,OceanBase CTO 杨传辉(花名:日照)发表了《一体化架构的原生分布式数据库》的主题演讲,其中谈到一些新的概念,如一体化架构,第三代分布式数据库等,一些理念跟其它厂商有些不同。image.png
image.gifOceanBase CTO 杨传辉(花名:日照)

什么是一体化架构?一体化架构的原生分布式数据库又跟我们所熟知的分布式数据库有什么不同?能解决哪些问题?


带着这些问题?笔者采访了杨传辉。
在杨传辉看来,分布式数据库迭代分为三个阶段:


第一代分布式存储系统(NoSQL):以牺牲SQL,牺牲事务一致性,牺牲企业级功能,从而获得可扩展、高性能的能力。


第二代分布式数据库(Scalable SQL):支持基本的SQL功能,往往牺牲单机性能和成本,延迟比较大,企业级功能支持不全。


第三代企业级分布式数据库(Scalable Enterprise DB):采用一体化的方式,功能和性能可以兼得。兼容SQL标准,支持丰富的企业级功能,追求单机性能。

从描述可以看出,一体化架构是第三代企业级分布式数据库的核心技术,那么什么是一体化?


杨传辉表示,所谓一体化包含了两层意思:“集中式与分布式的一体化融合”和“OLTP与OLAP一体化融合”。

image.gifimage.png
OLTP 与 OLAP 的一体化融合,这并不是新概念,其实就是 HTAP,早期 E.F.Codd关系模型提出时,并不区分是做TP还是AP。Oracle 其实就是 HTAP 数据库,只不过 Oracle 只能处理小数据量的 HTAP,而不能做大数量。那么,后来为什么会分开?是因为随着数据越来越大越来越多,集中式数据库无法在一套系统里既处理TP又处理AP,所以,就进行了拆分,一个TP系统,一个AP系统,定期做同步。

现在为什么又要融合?杨传辉认为,天下大势合久必分,分久必合,分布式和云计算发展到一定程度,让(一套)系统的处理能力又变强了,基于用户简单化需求驱动的一体化融合,于是又有了把AP、TP合在一起的想法。2014年,Gartner 也提了这样一个概念,今天 HTAP 也成了数据库中的一种类型。

但集中式与分布式的一体化融合,这绝对是一个很新的概念,同时具备集中式和分布式系统的技术优势,这听起来就很香。

这种融合的好处是什么?杨传辉说,一体化融合下的数据库选型,不再需要一开始考虑容量问题,比如选 OceanBase,业务初期一台机器就可以先用起来,当业务迅速增长,系统出现能力不足就做扩展, OceanBase 能够做到一台机器使用时,即不用分布式时,性能、功能不损失。

总的来说,一体化融合对用户的好处是显而易见的,那就是好用且成本降低。

一体化架构,理论听起来很香,但做起来并不容易,否则就不会是一个新概念了。杨传辉说,这个架构非常难,里面都是坑。

OceanBase 为什么能做到别人做不到的事?杨传辉说,是脚踏实地,一体化架构没有捷径。OceanBase 坚持长期主义,坚持用十年、二十年的时间打造下一步分布式数据库。这里涉及三个理念:第一坚持完全自研,第二坚持原生分布式数据库,第三坚持核心场景。OceanBase 认为,想要做好下一代支持核心场景的原生分布式数据库一定需要自研。成立之初,OceanBase 选择走完全自研的路线,并不是因为预测到今天国产化、自主可控的趋势,完全是技术选择。

多次打榜TPC,既不是喜欢也不是为了炫耀,而是为了打磨产品和证明架构的可行性。杨传辉表示,因为 OceanBase 定位为下一代原生分布式数据库,所以,需要用集中式数据库最高、最苛刻的标准要求自己。那怎么证明 OceanBase 是强一致?TPC-C 是一种很好的方式,通过 TPC-C 测试,证明在分布式架构之下的也能具备强一致能力,这很重要,说明基于分布式架构实现 ACID,也能管理20万亿行这样的大规模数据,并且能做到完全无抖动,这是 TPC-C 的意义。而打榜TPC-H亦是如此,为的是证明 OceanBase 的 HTAP 能力。

OceanBase 通过了 TPC-C 测试证明了分布式数据库这条路的可能性,并证明了OceanBase 的扩展性、高可用的能力,防抖动能力是领先的。杨传辉表示,OceanBase 在单机性能和功能,还要向经典数据库学习,虽然证明了架构的可行性,但并不意味着我们现在就比原来的好,这里还有很长的一段路要走。

此次DTCC大会上,OceanBase 3.1.1开源版本正式发布,该版本进一步强化OceanBase 内核能力,提升易用性及开源能力。紧接着,云栖大会上,OceanBase 3.2商业版正式对外发布,数据分析性能提升6倍。

杨传辉指出,实际上 OceanBase 从3.0开始,就属于第三代分布式数据库,因为主体架构基本具备,但还需要不断追求单机性能极致,并做好兼容性功能和细节打磨。 

OceanBase 开源是认真的,且货真价实的。杨传辉最后说,今年6月开源的版本能力不弱于去年支付宝双十一在线使用的版本。


版权声明:本文内容由阿里云实名注册用户自发贡献,版权归原作者所有,阿里云开发者社区不拥有其著作权,亦不承担相应法律责任。具体规则请查看《阿里云开发者社区用户服务协议》和《阿里云开发者社区知识产权保护指引》。如果您发现本社区中有涉嫌抄袭的内容,填写侵权投诉表单进行举报,一经查实,本社区将立刻删除涉嫌侵权内容。

相关文章
阿里云服务器怎么设置密码?怎么停机?怎么重启服务器?
如果在创建实例时没有设置密码,或者密码丢失,您可以在控制台上重新设置实例的登录密码。本文仅描述如何在 ECS 管理控制台上修改实例登录密码。
10089 0
赠票福利 | DTCC 2020数聚英雄,企业级分布式数据库实践专场见!
中国数据库技术大会 DTCC 2020 将在 12.21-23 于北京国际会议中心隆重召开。OceanBase 将在12月21日下午携手山东移动、网商银行等行业伙伴及OB 核心技术及产品团队共同开启 OceanBase 企业级分布式数据库实践专场,从产品创新到客户实践,从能力探讨到价值挖掘, 7大主题演讲,待你与 OceanBase 一同感知数据新视界,精彩干货不容错过!进入文章扫描二维码即可免费获取专场门票,限量50张先到先得哦~
197 0
阿里云开源PolarDB数据库,与社区共建云原生分布式数据库生态
5月29日,阿里云开发者大会上,阿里巴巴宣布开源云原生数据库能力,对外开放关系型数据库PolarDB for PostgreSQL 源代码,服务百万开发者,与社区开发者一起共建云原生分布式数据库生态。“我们希望将阿里云在云原生分布式数据库技术上积累的丰富经验,通过标准技术组件和系统的方式开放出来,共建开源数据库生态。”阿里云智能数据库产品事业部负责人李飞飞表示。
18154 0
DTCC 回顾:技术破局,分布式数据库创赢未来
2020 年 12 月 21 日第十一届中国数据库技术大会(DTCC 2020)于北京召开,蚂蚁集团 OceanBase 资深总监、北京奥星贝斯科技研发中心总经理杨传辉,带来了《OceanBase 原生分布式数据库》的主题分享,以下为演讲实录:
928 0
阿里云服务器如何登录?阿里云服务器的三种登录方法
购买阿里云ECS云服务器后如何登录?场景不同,阿里云优惠总结大概有三种登录方式: 登录到ECS云服务器控制台 在ECS云服务器控制台用户可以更改密码、更换系.
13891 0
阿里云ECS云服务器初始化设置教程方法
阿里云ECS云服务器初始化是指将云服务器系统恢复到最初状态的过程,阿里云的服务器初始化是通过更换系统盘来实现的,是免费的,阿里云百科网分享服务器初始化教程: 服务器初始化教程方法 本文的服务器初始化是指将ECS云服务器系统恢复到最初状态,服务器中的数据也会被清空,所以初始化之前一定要先备份好。
11893 0
三款典型国产分布式数据库的对比评测
编者按:近几年国产数据库市场风生水起,涌现了多款优秀的国产数据库产品,本文选取了三款典型的国产分布式数据库进行全方位对比压测,呈现了国产分布式数据库的发展现状。
775 0
阿里云ECS云服务器初始化设置教程方法
阿里云ECS云服务器初始化是指将云服务器系统恢复到最初状态的过程,阿里云的服务器初始化是通过更换系统盘来实现的,是免费的,阿里云百科网分享服务器初始化教程: 服务器初始化教程方法 本文的服务器初始化是指将ECS云服务器系统恢复到最初状态,服务器中的数据也会被清空,所以初始化之前一定要先备份好。
7365 0
692
文章
0
问答
来源圈子
更多
蚂蚁OceanBase数据库团队,用于OceanBase技术原理、运维经验和案例分享、对外交流。
+ 订阅
文章排行榜
最热
最新
相关电子书
更多
《2021云上架构与运维峰会演讲合集》
立即下载
《零基础CSS入门教程》
立即下载
《零基础HTML入门教程》
立即下载