一、 PolarDB总体架构设计
传统数据库的部署方式,有主库、备库和Standby,主备库之间通过流复制进行同步。节点扩展时,需要将数据全部进行复制,速度极慢。另外,主备之间复制一般使用异步复制,可能存在数据丢失。主备之间存在延迟,因此可用性较差。此外,随着副本数的增加,存储成本呈线性增加。
针对以上问题,PolarDB实现了计算存储分离架构。
在PolarDB架构中,共有三个节点,其中一个读写节点,两个只读节点。存储数据时,通过网络存储到后端存储池。
该架构具有四个优势:
第一, 扩展性较好。计算能力不足时,只需简单操作即可增加计算节点。因为数据存储在共享存储上,无需再做一次复制。且计算节点无状态,扩展快。而当计算资源过多时,可以将三个节点迅速缩为两个节点。
第二, 成本低。多个计算节点共享一份数据,存储成本显著下降。传统数据库有N个备库,数据需要复制N份。而存储计算分离架构下,数据只需在共享存储上存储一份即可。
第三, 易用性。存储计算分离架构的存储池技术相对较成熟,保证了数据不会丢失。计算侧每一个节点都能看到完整的数据库状态,使用体验接近于单机数据库。
第四, 可靠性。由于共享存储具备了三副本以及秒级备份等特性,其可靠性也得到了保障。
PolarDB计算存储分离的模块栈分为四层。
• 事务层:除了原生事务,还实现了CSN快照。
• 日志层:主库将WAL日志写到共享存储上,备库无需再做一次流复制,从共享存储上读取日志即可。此外还实现了lazy回放、并行回放和LogIndex等核心数据结构。
• 缓存层:实现了常驻BufferPool,节点重启时,buffer数据无需重新预热。另外,实现了多版本页面,解决了fullpage问题。
• 存储层:实现了Direct IO、数据预读、预扩展以及抽象了PolarVFS文件系统接口。
PolarDB除了实现计算存储分离架构,还实现了HTAP架构。
接下篇:https://developer.aliyun.com/article/1223113?groupCode=polardbforpg