技术白皮书—技术原理

简介: 本文介绍了PolarDB-X的主要技术原理。

分布式线性扩展

PolarDB-X将数据表以水平分区的方式,分布在多个存储节点(DN)中。数据分区方式由分区函数决定,PolarDB-X支持哈希(Hash)、范围(Range)等常用的分区函数。

以下图为例,shop库中的orders表根据每行数据的id属性的哈希,被分区水平切分成orders_00~orders_11共计12个分区,均匀分布在4个数据节点上。对于用户来说,通常无需关心具体的数据分布,PolarDB-X的分布式SQL层将会自动完成查询路由、结果合并等。p330838.png

分布式线性扩展

PolarDB-X将数据表以水平分区的方式,分布在多个存储节点(DN)中。数据分区方式由分区函数决定,PolarDB-X支持哈希(Hash)、范围(Range)等常用的分区函数。

以下图为例,shop库中的orders表根据每行数据的id属性的哈希,被分区水平切分成orders_00~orders_11共计12个分区,均匀分布在4个数据节点上。对于用户来说,通常无需关心具体的数据分布,PolarDB-X的分布式SQL层将会自动完成查询路由、结果合并等。p330988.png

高可用与容灾

在生产环境部署数据库时往往会搭建多个副本(Replica),保证数据库集群的高可用性以及数据的持久性。为了保证副本间的强一致性,现代数据库往往采用以Paxos算法为代表的多数派复制协议,它要求集群中至少存在3个节点,每次写入都要获得超过半数节点的确认,即便其中1个节点宕机集群也仍然能正常提供服务。PolarDB-X采用X-Paxos复制协议,X-Paxos是阿里巴巴自研的Paxos协议实现,在功能、性能上都做了大量优化,且经历了数十载的双十一考验,稳定可靠。p330989.png

基于Paxos复制协议,PolarDB-X可以部署到多个机房中,以实现机房级容灾。常见的部署方式有同城三机房、两地三中心等,其中后者主要应用在混合云部署中。由于Paxos协议的特性,通常三个机房中有一个主机房负责对外提供服务。p330990.png

分布式事务

PolarDB-X原生支持分布式事务,并保证事务的ACID性质——原子性(Atomicity)、一致性(Consistency)、隔离性(Isolation)、持久性(Durability)。

PolarDB-X通过引入中心授时节点(TSO),结合多版本并发控制(MVCC),保证读取到的一定是一致的快照,而不会读到转账事务的中间状态。如下图所示,提交事务时,计算节点(CN)执行事务时从TSO 获取到时间戳,随着数据一同提交到存储节点 (DN)多版本存储引擎上。读取时,如果查询操作的数据涉及多个分区,PolarDB-X首先会获取全局时钟作为读取版本,对每行数据的MVCC多版本进行可见性判断,确保读到全局一致的数据版本。p330993.png

分布式事务也是许多分布式特性的基础,例如:对于读写分离,数据的事务多版本信息也会被同步到 Learner 副本,保证读只读实例不会因为同步延迟读到过期数据;全局变更日志中,通过时间戳保证分布式事务顺序;任意时间点的数据恢复(PITR,point-in-time recovery)中,利用分布式事务时间戳,能够精准找到相应时间的、全局一致的数据版本。

混合负载 HTAP

PolarDB-X是一款支持 HTAP (Hybrid Transaction/Analytical Processing) 的数据库:在支持高并发、事务性请求的同时,也对分析型的复杂查询提供了良好的支持。分析型查询指的是涉及数据量较大、计算比较复杂的查询,例如对一定时间区间内的数据进行聚合。相比于业务中常见的简单查询,这类查询往往要执行数秒甚至分钟,需要消耗较多的计算资源。

为了加速复杂分析型查询,PolarDB-X将计算任务切分并调度到多个计算节点上,从而利用多个节点的计算能力,加速查询的执行。这种方式也称为MPP并行计算。p330996.png

PolarDB-X的优化器面向HTAP负载设计,对复杂查询有着良好的支持。PolarDB-X采用了基于代价的优化器技术,能够根据实际数据量、数据分布情况等,搜索到较优的执行计划,例如,对Join顺序进行调整、选择合适的Join或聚合算法、对关联子查询去关联化等。

PolarDB-X优化器会基于代价估计将请求区分为TP与AP负载,其中AP查询会被进一步改写为分布式执行计划,发往只读集群进行计算,避免它对主实例的TP查询造成影响。

MySQL生态兼容

PolarDB-X将兼容MySQL以及周边生态作为核心设计目标之一。本文从SQL语法、事务行为、导入导出等角度总结了兼容性相关特性,具体用法可以参见相关功能文档。

PolarDB-X通讯协议兼容MySQL协议,可以使用常见的MySQL客户端直接连接到PolarDB-X集群,包括 JDBC Driver、ODBC Driver、Golang Driver等。兼容MySQL SSL、Prepare、Load等传输协议。

PolarDB-X兼容MySQL的各种DML、DAL、DDL语法,包括:

  • 兼容绝大部分MySQL函数(包括JSON函数、加密解密函数等)。
  • 兼容MySQL 8.0的视图、CTE、窗口函数、分析函数等。
  • 支持MySQL的各种数据类型,包括类型精度支持(比如时间戳、Decimal 类型)。
  • 兼容常见的MySQL字符串Charset及Collation。
  • 兼容绝大部分information_schema视图。
相关文章
|
Linux C语言
Linux: 僵尸进程究竟是什么?有什么危害?
Linux: 僵尸进程究竟是什么?有什么危害?
325 0
|
Rust 安全
深入理解Rust语言的所有权系统
深入理解Rust语言的所有权系统
399 0
|
机器学习/深度学习 人工智能 算法
体验升级:扫描全能王智能高清滤镜2.0全面测评
**扫描全能王智能高清滤镜2.0测评概览** - **技术亮点:** 结合深度学习与多尺度感知融合,提升图像清晰度。 - **智能处理:** 利用深度学习识别透字、颜色和文字,自适应调整处理策略。 - **测评场景:** - **透字文件**:有效抑制透字噪声,增强文字可读性。 - **有阴影的发票**:去除阴影,清晰呈现内容。 - **曲度较大书籍**:准确扫描曲面,保持文字形状。 - **电脑屏幕文本**:优化屏幕显示文本的扫描质量。 - **图画扫描**:颜色还原准确,保持图像细节。 - **总结展望:** 强大的处理能力,满足多样化文档需求,期待未来功能拓展。
431 6
|
JavaScript 前端开发
「Vue3系列」Vue3 事件处理
在 Vue 3 中,事件处理与 Vue 2 非常相似,但有一些细微的改进和新的语法。Vue 3 仍然使用 `v-on` 指令来处理 DOM 事件,或者更常见的是使用其简写形式 `@`。
989 0
港澳台居民大陆居住证号码正则表达式
港澳台居民大陆居住证号码正则表达式
2761 0
|
SQL 人工智能 移动开发
Memory Analyzer(MAT)分析内存
MAT是Memory Analyzer tool的缩写,是一款非常强大的内存分析工具,只需要打开采集的hprof文件即可开始对内存开始分析对比,一款“傻瓜式“的堆转储文件分析工具,谁都能学会。
1734 0
浅析PCIe链路LTSSM状态机
我们知道,在PCIe链路可以正常工作之前,需要对PCIe链路进行链路训练,在这个过程中,就会用LTSSM状态机。LTSSM全称是Link Training and Status State Machine。这个状态机在哪里呢?
|
编解码 算法 前端开发
Cartographer参数调整来降低延迟的策略
Cartographer参数调整来降低延迟的策略