DRDS可以看成是PolarDB-X 1.0,而现在的PolarDB-X为PolarDB-X 2.0。 DRDS本质是一个阿里云上的分库分表中间件,具有很高的灵活性。而PolarDB-X是使用云原生技术的分布式数据库,具有一体化的数据库体验,存储节点是经过高度定制的MySQL,从而提供了大量中间件无法提供的如分布式事务等能力。
分布式关系型数据库服务(Distributed Relational Database Service,简称DRDS)是阿里致力于解决单机数据库服务瓶颈问题而自主研发的分布式数据库产品。DRDS高度兼容MySQL协议和语法,支持自动化水平拆分、在线平滑扩缩容、弹性扩展、透明读写分享,具备数据库全生命周期运维管控能力。
DRDS前身为淘宝TDDL,可以认为是云上的TDDL中间件。DRDS必须依赖RDS。
PolarDB-X与DRDS的几点区别有:
PolarDB-X使用X-DB作为数据节点,X-DB使用Paxos一致性共识协议进行多副本复制。
PlarDB-X相比DRDS引入一个新的组件GMS(Global Meta Service),提供分布式事务所使用的全局自增时间戳,根据负载情况调度数据的分布使节点之间达到均衡,提供统一的元数据等。
DRDS扩容基于Binlog,依赖外围管控系统完成。PolarDB-X扩容基于分布式事务,由内核完成。
DRDS的RDS是传统的主备架构,正常情况下备库不提供服务,PolarDB-X下的数据节点以分片为单位,一个节点可以同时是一个分片的Leader与另一个分片的Follower,资源利用率更高。
在事务实现上,DRDS使用MySQL官方提供的XA事务,可以保证写入操作的原子性,但是存在的问题是可能会在一个分片读到已提交的数据在另一个分片上读到未提交的数据。为了解决这一问题,DRDS使用加锁的方式,在冲突多的情况下有比较高的代价。PolarDB-X使用自研的全局MVCC事务,在两阶段提交的基础上,增加了事务快照时间戳和提交时间戳的支持。时间戳来自于全局TSO的分配,因此做到外部一致的事务保证,并且避免了额外的加锁。
在性能上,DRDS连接RDS使用的是RDS标准的访问链路,中间需要经过SLB中转,会增加一跳的网络延迟,PolarDB-X的CN与DN是点对点直连。第二点,DRDS使用标准的MySQL协议连接RDS,导致有不少开销,PolarDB-X对MySQL进行大量定制,中间的通信用私有的RPC协议,提升了性能。对OLAP查询,DRDS使用的是SMP(单机并行)技术,PolarDB-X使用的是MPP(多机并行)技术。
PolarDB-X 2.0(简称PolarDB-X)与DRDS(DRDS也称为PolarDB-X 1.0)都是阿里云上的分布式数据库产品。看起来她们都是Share-Nothing的架构,用水平扩展来解决单机数据库瓶颈问题。
DRDS,其本质是搭建在标准MySQL(阿里云上的RDS For MySQL)上的分库分表中间件,具有很高的灵活性。
PolarDB-X是使用云原生技术的分布式数据库,具有一体化的数据库体验,其存储节点是经过了高度定制的MySQL,从而提供了大量中间件无法提供的能力(使用全局MVCC的强一致的分布式事务、私有RPC协议带来的性能提升、Follower上的一致性读能力等等)。
它两相似的地方:
他们都能基于Share-Nothing的架构,具备极强的水平扩展能力,
它们都基于MySQL的生态体系,具有很高的MySQL兼容性。
她们使用同样的SQL引擎,具备相似的SQL执行能力,
她们均提供分布式事务、全局索引等常见中间件不具备的高阶能力,
她们都在阿里巴巴内部广泛使用,历经多年双十一的考验,稳定可靠。
它俩在产品体验上的异同。
购买实例:
由于DRDS是一个中间件,所以其和MySQL的接线划分得比较清晰,DRDS本身不包含MySQL(RDS)资源,MySQL由用户单独购买。你需要在两个产品的控制台上单独进行购买,并在DRDS控制台上将其组装在一起。
PolarDB-X提供的是一个整体的数据库服务,你只需要创建一个PolarDB-X实例即可,其中包含了所需要的计算资源、存储资源。
2.建库:
DRDS中,建库需要在控制台完成,并且在建库过程中需要选择已有或者购买新的MySQL资源:
PolarDB-X中,你可以像使用单机数据库一样,使用你习惯的工具进行连接,然后使用CREATE DATABASE指令创建数据库:
3.扩容:
DRDS中,你需要评估每个MySQL的容量,并选择将哪些分库挪到新的MySQL存储上。
PolarDB-X中,你只需要选择节点数,数据将自动均衡地分布在各个存储节点上。
4.数据同步:
如果你要将DRDS中的数据同步到下游,很多时候你需要使用DTS来订阅其中的每一个MySQL实例,并仔细处理同一个逻辑表的不同分表之间例如表名的差异等细节,并且DDL操作会让这个同步链路中断。
PolarDB-X提供一个统一的binlog服务,你可以使用DTS像订阅一个单机MySQL一样来订阅它。这个binlog服务完全兼容MySQL,其屏蔽了所有的分布式的细节,让下游服务认为它是一个普通的单机MySQL(例如PolarDB-X支持包括SHOW BINLOG EVENTS在内的所有BINLOG相关的指令)。
5.读写分离:
DRDS中,你可以使用只读实例(备库)来进行一些高消耗的SQL,避免对在线业务产生影响。但是,你需要手动来判断这些SQL的类型,并通过HINT、不同的连接串等方式,将其放到正确的地方来执行。同时,你需要注意备库上存在延迟,你需要改造你的业务系统,使其能够容忍这种延迟。
PolarDB-X中,应用使用一个连接串即可,你无需关注这些SQL的类型和代价(用不着给它们加HINT),它的优化器会自动识别这些SQL的代价,并且使用正确的资源池来执行它们,尽最大可能避免AP的SQL影响到TP的SQL。
同时,PolarDB-X的存储节点,支持Follower上的一致性读,因此你不需要担心在备库上读取数据会读到老的数据,任何时候去读,都能读到最新的数据。
6.运维:
由于DRDS允许使用你自己购买的MySQL实例进行组件,因此你拥有这些MySQL实例完整的运维权限,你可以对它们做任何你想做的事情。
例如: * 负载不均衡时,单独对其中一个节点进行规格的升级 * 将其中的某个存储节点给其他的业务使用 * 使用任意版本的RDS(5.6、5.7、8.0均可) * 订阅任意一个RDS的binlog
但是,这种灵活性也存在一定的风险,例如,我们没有办法阻止你直接删除其中的一个分库,这会导致DRDS无法正常访问这个分库上的数据。
PolarDB-X对用户屏蔽了存储节点,你不能、也不需要直接访问其存储节点,它将一个数据库的整体视角呈现给用户,它通过自动的负载均衡、逻辑binlog、混合负载的HTAP等能力来减少你对存储节点直接访问的需求。目前PolarDB-X DN主要基于的的MySQL版本为5.7,后续8.0的支持也已经在规划中。
PolarDB-X与DRDS上的事务机制,有着非常巨大的差异。
DRDS使用的是MySQL官方提供的XA事务。XA事务可以保证写入操作的原子性。
但是,标准的XA存在一个问题是,可能会在一个分片读到已提交的数据,再另一个分片读到未提交的数据。
DRDS中,为了解决这个问题,使用的是加锁的实现,在冲突多的情况下,有比较高的代价。
PolarDB-X使用自研的全局MVCC事务,在两阶段提交(2PC)的基础上,增加了事务快照时间戳(snapshot_ts)和提交时间戳(commit_ts)的支持。时间戳来自于全局 TSO 的分配,因此能做到外部一致的事务保证,并且避免了额外的加锁。在上述例子中,t1的时间由于比commit的时间晚,因此一定能读到两张表都是1的结果。
DRDS中使用的是SMP(单机并行)技术,PolarDB-X中使用的是MPP(多机并行)技术。这使得PolarDB-X相对于DRDS,在面对复杂分析查询时,可以使用更多的资源来加速。这个性能差异体现在TPC-H上非常显著。
DRDS是分库分表中间件的代表,PolarDB-X是云原生分布式数据库。有一个形象的比喻,DRDS和PolarDB-X的关系相当于宝马3系和5系,她们将长期共存,为不同需求的用户提供服务。
PolarDB-X和DRDS都是阿里云上的分布式数据库产品,但是它们的架构不同。DRDS是搭建在标准的MySQL(阿里云上的RDS)上的分库分表中间件,具有很高的灵活性。而PolarDB-X是使用云原生技术的分布式数据库,存储节点是经过了高度定制的MySQL,从而提供了大量中间件无法提供的能力。PolarDB-X的存储节点是经过了高度定制的MySQL,从而提供了大量中间件无法提供的能力。PolarDB-X的存储节点是经过了高度定制的MySQL,从而提供了大量中间件无法提供的能力。-此回答整理自钉群“里云 PolarDB-X 开源交流群”
版权声明:本文内容由阿里云实名注册用户自发贡献,版权归原作者所有,阿里云开发者社区不拥有其著作权,亦不承担相应法律责任。具体规则请查看《阿里云开发者社区用户服务协议》和《阿里云开发者社区知识产权保护指引》。如果您发现本社区中有涉嫌抄袭的内容,填写侵权投诉表单进行举报,一经查实,本社区将立刻删除涉嫌侵权内容。
PolarDB 分布式版 (PolarDB for Xscale,简称“PolarDB-X”) 是阿里云自主设计研发的高性能云原生分布式数据库产品,为用户提供高吞吐、大存储、低延时、易扩展和超高可用的云时代数据库服务。