快人一步,X-DB如何实现极速DDL

本文涉及的产品
RDS MySQL Serverless 基础系列,0.5-2RCU 50GB
云数据库 RDS MySQL,集群系列 2核4GB
推荐场景:
搭建个人博客
云数据库 RDS MySQL,高可用系列 2核4GB
简介: X-DB是阿里巴巴自研的分布式关系型数据库,它不仅具备可全球部署的分布式能力,在性能和成本方面也有可观提升,并且增加了不少惠及用户的新功能。本文将详细介绍X-DB如何近乎瞬时完成MySQL等传统数据需要数小时完成的DDL操作

数据库DDL操作面临的问题

互联网业务发展迅速,应用模式频繁更改是常态。相应地,数据库访问模式和schema也随之变化。DDL(Data Definition Language)是SQL的一类,主要作用是创建和更改数据的schema信息,最常见的操作包括:加减列、更改列类型、加减索引等。熟悉MySQL的同学都知道,在8.0以前,虽然Online DDL不阻塞其它DML(Insert/Update/Delete)操作,但许多重要的DDL操作,如加列、减列等,仍旧需要等待数小时(依据数据量的大小)才会生效。更改列类型等操作甚至仍需要锁表执行,阻塞DML操作。


DDL操作运行时间长,占用系统资源,需要额外的磁盘空间(建立临时表),影响系统吞吐,并且一旦DDL过程中实例crash,恢复时间也会很久。以加列DDL为例,MySQL经历如下过程:

1.以新schema建立空表。
2.拷贝数据到新表,并且将新加列的值赋为默认值,同时更新索引表。数据库接受到的DML操作被记录在临时文件。
3.加exclusive lock,阻塞写操作,将临时文件记录的DML操作apply到新表。如果DML很多,这一阶段将花费较多时间。
4.删除旧表,将新表命名为旧表的名字。

显然,这个过程加锁时间长,拷贝数据操作会占用系统资源和临时空间,并需要大量I/O。为了适应变化频繁的业务,不立即更改存储层数据、可以快速完成的DDL(我们称之为Fast DDL)成为了一个必要feature。今年发布的MySQL 8.0,增加了instant add column功能,可以在短时间内只修改table元信息,完成加列操作。遗憾的是,它还不支持其它类型的DDL。得益于阿里自研的存储引擎X-Engine存储了多版本Table Schema,每一行记录在引擎层就完成了解析,并且可以依据更新版本schema实现格式转换,X-DB因此支持多种类型的Fast DDL。


业界Fast ddl实现方案


MySQL 8.0



MariaDB10.3

整体实现方案与MySQL8.0类似,record记录了列个数,在leftmost leaf page中记录所有列的default值.

支持类型:

Add column

Drop column

Extend VARCHAR maximum (Only if the physical format allows; not VARCHAR(255) to VARCHAR(256))


Aurora

发生ddl后,更新系统表,新、旧版本的schema均要记录下来。然后广播该修改。之后接受DML请求,首先转换相关leaf page的所有记录,然后执行DML。

select请求会将旧版本的记录拼接成新版本记录

支持类型

only supports adding nullable columns, without default values


X-Engine多版本schema


顾名思义,Fast DDL指数据库能够在极短的时间内完成用户发出的DDL指令并返回。之所以这么快,是因为只修系统表里的元数据,不变更引擎层存储的数据。其实现的关键在于:元信息变更之后,内存、磁盘中的物理记录该如何解析。


X-DB基于新一代存储引擎X-Engine,它的架构采用了LSM-Tree的思想,将新写入的数据以追加方式写入内存memtable,memtable到一定大小后switch为immutable memtable,不再修改。然后逐渐以extent的形式,flush到持久化存储中。当extent到一定数量后,通过合并(Compaction)操作,将相同Key的多个版本合并。为了让每行记录可解析,最直观简单的方案便是将元信息附着在记录上面。为了能够不依赖系统表解析记录,X-Engine存储了较为详细的元数据,如果为每一行都附着一份,会占用大量的空间。为了减少存储成本,我们保证每个memtable和extent内部的数据schema一致,并将schema信息存储在memtable和extent之上。

a53cd07734902c953fca4e3638ba4da4c7a4453d


schema信息包含了诸如列个数、列类型、列长度、默认值等关键信息。利用这些信息,X-Engine可以在返回结果之前,完成列解析,并只需返回查询目标列的对应结果。下面给出了一个具体的例子,同一张表存在不同schema版本的extent时,如何返回结果。

0b79a937e4c4f9b81aa2b968b2e40c6e886906ee


X-DB fast ddl实现


X-DB是一个分布式关系型数据库,所有元信息都由名为GMS(Global Management Service)的模块管理。当X-DB接收到一条fast ddl语句时,GMS更新相关元数据表信息(分布式DDL的执行流程的详细过程,会在另一篇文章介绍,不是本文重点),新版本的表结构随之生效,这时这条DDL语句就执行成功啦!到现在为止X-Engine存储的信息没有发生任何变化。


读请求

当系统接收到Select请求时,X-DB Server会将请求本身,连同当前最新版本schema信息(称之为target schema)传递到X-Engine。X-Engine首先定位到记录的位置(某个memtable或extent),并取相应数据schema解析记录得到初步结果。接着,对比数据schema和target schema,对初步结果做适当填充、删减或修改得到最终结果返回。


X-Engine schema更新

Fast DDL命令执行成功,新版本的schema生效,X-Engine还对此无感知。当X-DB接收到第一条针对该表的DML(Insert/Update/ Delete)请后,如果发现X-Engine的活跃memtable的schema版本落后于最新版本,会触发switch memtable行为:冻结当前活跃memtable,产生新活跃memtable,将新schema赋予新活跃memtable。为了保证数据的正确性,该操作会等待所有正在进行的写事务完成后再执行。


写请求

每个写事务可能涉及到n(n>=1)个表。事务在提交时,需要在写入活跃memtable之前判断:事务写入数据的schema版本是否与活跃memtable的schema版本一致,如果不一致则应该报错退出,提醒用户重试。


Flush/Compaction

内存中memtable数量到一定个数时会触发Flush操作,被选中memtable的数据以extent的形式写入磁盘,schema也随之由memtable传递到extent。Compaction操作会合并多个extent,如果参与同一任务的extent schema版本不一致,X-Engine会以其中最新版本为准,生成新extent。


X-DB支持的Fast DDL类型


目前X-DB支持的Fast DDL类型包括:


Renaming a table

Renaming an index

Renaming a column

Adding a column

Dropping a column

Reordering columns

Setting a column default value

Dropping the column default value

Changing the column data type, including:

  • TINYINT->SMALLINT->MEDIUMINT->INT->BIGINT

  • TINYTEXT->TEXT->LONGTEXT

  • TINYBLOB->BLOB->LONGBLOB

  • VARCHAR<->TEXT , not supported if column size decreased

  • VARBINARY<->BLOB, not supported if column size decreased

Extending CHAR/BINARY column size

Extending VARCHAR/VARBINARY column size

Adding a virtual column

Modifying virtual column order

Dropping a virtual column


总结


X-DB Fast DDL可以解决很多应用的痛点,加列、扩展列的常用的操作不用再需要漫长的等待。技术上,X-Engine通过存储详细的多版本schema信息,不仅无需借助系统表解析记录,而且可以轻易地实现不同版本schema之间的数据转换,进而可以支持类型丰富的Fast DDL。


相关实践学习
如何在云端创建MySQL数据库
开始实验后,系统会自动创建一台自建MySQL的 源数据库 ECS 实例和一台 目标数据库 RDS。
全面了解阿里云能为你做什么
阿里云在全球各地部署高效节能的绿色数据中心,利用清洁计算为万物互联的新世界提供源源不断的能源动力,目前开服的区域包括中国(华北、华东、华南、香港)、新加坡、美国(美东、美西)、欧洲、中东、澳大利亚、日本。目前阿里云的产品涵盖弹性计算、数据库、存储与CDN、分析与搜索、云通信、网络、管理与监控、应用服务、互联网中间件、移动服务、视频服务等。通过本课程,来了解阿里云能够为你的业务带来哪些帮助 &nbsp; &nbsp; 相关的阿里云产品:云服务器ECS 云服务器 ECS(Elastic Compute Service)是一种弹性可伸缩的计算服务,助您降低 IT 成本,提升运维效率,使您更专注于核心业务创新。产品详情: https://www.aliyun.com/product/ecs
相关文章
|
6月前
|
Oracle 关系型数据库 数据库
Oracle示例模式Scott:数据库世界的“小导游”
【4月更文挑战第19天】Oracle的Scott模式是数据库学习的向导,提供操作性的环境,包含表(如EMP和DEPT)、视图和索引。通过它,学习者能掌握基本语法和操作,如创建表、插入数据和编写查询。它是通往Oracle数据库世界的起点,帮助新手奠定基础,开启数据库探索之旅。
|
SQL 关系型数据库 MySQL
MYSQL的DDL和DML综合案例练习
#DDL和DML综合案例 #1:创建名为test01_library的数据库 CREATE DATABASE IF NOT EXISTS test01_library; #2:创建books表 CREATE TABLE IF NOT EXISTS books( id INT, `name` VARCHAR(50), `authors` VARCHAR(100), price FLOAT, pubdate YEAR, note VARCHAR(100), num INT ); SELECT * FROM b.
173 0
|
SQL Oracle 前端开发
摸鱼不如来了解一下--数据库DB与数据仓库DW区别和联系
数据库(DB)和数据仓库(DW)的区别与联系
213 0
|
SQL 消息中间件 存储
【DB吐槽大会】第33期 - PG 逻辑复制不支持DDL
大家好,这里是DB吐槽大会,第33期 - PG 逻辑复制不支持DDL
|
存储 JSON 搜索推荐
【DB吐槽大会】第35期 - “富人”的烦恼?PG 不会自动选择索引类型
大家好,这里是DB吐槽大会,第35期 - “富人”的烦恼?PG 不会自动选择索引类型
|
存储 Oracle 关系型数据库
【DB吐槽大会】第67期 - PG 存储过程和函数内对自治事务支持不完整
大家好,这里是DB吐槽大会,第67期 - PG 存储过程和函数内对自治事务支持不完整
|
关系型数据库 Java 分布式数据库
【DB吐槽大会】第9期 - PG 大量连接写小事务性能差
大家好,这里是DB吐槽大会,第9期 - PG 大量连接写小事务性能差
|
SQL 关系型数据库 中间件
【DB吐槽大会】第42期 - PG 读写分离不友好
大家好,这里是DB吐槽大会,第42期 - PG 读写分离不友好
|
SQL Oracle 关系型数据库
【DB吐槽大会】第49期 - PG 不支持打印慢SQL锁等待信息
大家好,这里是DB吐槽大会,第49期 - PG 不支持打印慢SQL锁等待信息
|
SQL 关系型数据库 Java
【DB吐槽大会】第16期 - PG Standby不支持解析逻辑日志
大家好,这里是DB吐槽大会,第16期 - PG Standby不支持解析逻辑日志