MySQL5.7并行复制中并行的真正含义

本文涉及的产品
RDS MySQL Serverless 基础系列,0.5-2RCU 50GB
云数据库 RDS MySQL,集群系列 2核4GB
推荐场景:
搭建个人博客
云数据库 RDS MySQL,高可用系列 2核4GB
简介: mysql5.7 LOGICAL_CLOCK并行复制的演进



MySQL5.7并行复制中并行的真正含义

MySQL5.7并行复制初理解

  • 我们知道MySQL5.7并行复制引入了两个值last_committed和sequence_number。last_committed表示事务提交的时候,上次事务提交的编号,在主库上同时提交的事务设置成相同的last_committed。如果事务具有相同的last_committed,表示这些事务都在一组内,可以进行并行的回放。这个机制也是Commit-Parent-Based Scheme[WL#6314](https://dev.mysql.com/worklog/task/?id=6314)中的实现方式。不过之后,官方对这种模式做了改进,所以最新的并行回放机制和[WL#6314](https://dev.mysql.com/worklog/task/?id=6314)有了不同,详情见Lock-Based Scheme[WL#7165](https://dev.mysql.com/worklog/task/?id=7165)
  • 下面介绍一下旧模式Commit-Parent-Based Scheme[WL#6314](https://dev.mysql.com/worklog/task/?id=6314)和新模式Lock-Based Scheme[WL#7165](https://dev.mysql.com/worklog/task/?id=7165)的不同之处,以及改进的地方。


Commit-Parent-Based Scheme [WL#6314](https://dev.mysql.com/worklog/task/?id=6314)

Commit-Parent-Based Scheme简介

  • 在master上,有一个全局计数器(global counter)。在每一次存储引擎提交之前,计数器值就会增加。
  • 在master上,在事务进入prepare阶段之前,全局计数器的当前值会被储存在事务中。这个值称为此事务的commit-parent。
  • 在master上,commit-parent会在事务的开头被储存在binlog中。
  • 在slave上,如果两个事务有同一个commit-parent,他们就可以并行被执行。

    此commit-parent就是我们在binlog中看到的last_committed。如果commit-parent相同,即last_committed相同,则被视为同一组,可以并行回放。


Commit-Parent-Based Scheme的问题

一句话:Commit-Parent-Based Scheme会降低复制的并行程度。

image.png

解释一下图:

  • 水平虚线表示事务按时间顺序往后走。
  • P表示事务在进入prepare阶段之前读到的commit-parent值的那个时间点。可以简单的视为加锁时间点。
  • C表示事务增加了全局计数器(global counter)的值的那个时间点。可以简单的视为释放锁的时间点
  • P对应的commit-parent(last_commited)是取自所有已经执行完的事务的最大的C对应的sequence_number。举例来说:
  • Trx4的P对应的commit-parent(last_commited)取自所有已经执行完的事务的最大的C对应的sequence_number,也就是Trx1的C对应的sequence_number。因为这个时候Trx1已经执行完,但是Trx2还未执行完。
  • Trx5的P对应的commit-parent(last_commited)取自所有已经执行完的事务的最大的C对应的sequence_number,也就是Trx2的C对应的sequence_number;Trx6的P对应的commit-parent(last_commited)取自所有已经执行完的事务的最大的C对应的sequence_number,也就是Trx2的C对应的sequence_number。所以Trx5和Trx6具有相同的commit-parent(last_commited),在进行回放的时候,Trx5和Trx6可以并行回放。
  • 由图可见,Trx5 和 Trx6可以并发执行,因为他们的commit-parent是相同的,都是由Trx2设定的。但是,Trx4和Trx5不能并发执行, Trx6和Trx7也不能并发执行。
  • 我们可以注意到,在同一时段,Trx4和Trx5、Trx6和Trx7分别持有他们各自的锁,事务互不冲突。所以,如果在slave上并发执行,也是不会有问题的。
  • 根据以上例子,可以得知:
  • Trx4, Trx5和Trx6 在同一时间持有各自的锁,但Trx4无法并发执行。
  • Trx6 和Trx7在同一时间持有各自的锁,但Trx7无法并发执行。
  • 但是,实际上,Trx4是可以和Trx5、Trx6并行执行,Trx6可以和Trx7并行执行。

如果能实现这个,那么并行复制的效果会更好。所以官方对并行复制的机制做了改进,提出了一种新的并行复制的方式:Lock-Based Scheme


Lock-Based Scheme [WL#7165](https://dev.mysql.com/worklog/task/?id=7165)

实现:如果两个事务在同一时间持有各自的锁,就可以并发执行。

Lock-Based Scheme简介

  • 首先,定义了一个称为lock interval的概念,含义:一个事务持有锁的时间间隔。
  • 当存储引擎提交,第一把锁释放,lock interval结束。
  • 当最后一把锁获取,lock interval开始。假定:最后一把锁获取是在binlog_prepare阶段。
  • 假设有两个事务:Trx1、Trx2。Trx1先于Trx2。<font color="red"><b>那么,当且仅当Trx1、Trx2的lock interval有重叠,则可以并行执行。</b></font>换言之,当且仅当Trx1结束自己的lock interval要早于Trx2开始自己的lock interval,则不能并行执行。

image.png

L表示lock interval的开始点

C表示lock interval的结束

  • 对于C(lock interval的结束点),MySQL会给每个事务分配一个逻辑时间戳(logical timestamp),命名为:transaction.sequence_number。此外,MySQL会获取全局变量global.max_committed_transaction,含义:所有已经结束lock interval的事务的最大的sequence_number。
  • 对于L(lock interval的开始点),MySQL会把global.max_committed_timestamp分配给一个变量,并取名叫transaction.last_committed。
  • transaction.sequence_number和transaction.last_committed这两个时间戳都会存放在binlog中。
  • 根据以上分析,我们可以得出在slave上执行事务的条件:
  • 如果所有正在执行的事务的最小的sequence_number大于一个事务的transaction.last_committed,那么这个事务就可以并发执行。换言之:
  • slave 的work线程不能开始执行一个事务,直到这个事务的last_committed值小于所有其他正在执行事务的sequence_number。
  • 根据以上分析,回过头来看前面的那幅图

image.png

  • 可以看到Trx3、Trx4、Trx5、Trx6四个事务可以并发执行。因为Trx3的sequence_number大于Trx4、Trx5、Trx6的last_committed,所以可以并发执行。
  • Trx3、Trx4、Trx5执行完成之后,Trx6和Trx7可以并发执行。因为Trx6的sequence_number大于Trx7的last_committed,即两者的lock interval存在重叠。Trx5和Trx7不能并发执行,因为:Trx5的sequence_number小于Trx7的last_committed,即两者的lock interval不存在重叠。
  • 综上所述,可以有三种方法来判断slave上事务是否可以并行执行:
  • 假设有两个事务:Trx1、Trx2。Trx1先于Trx2。那么,当且仅当Trx1、Trx2的lock interval有重叠,则可以并行执行。
  • 如果所有正在执行的事务的最小的sequence_number大于一个事务的transaction.last_committed,那么这个事务就可以并发执行。
  • slave 的work线程不能开始执行一个事务,直到这个事务的last_committed值小于所有其他正在执行事务的sequence_number。
  • 由上分析,新模式Lock-Based Scheme机制的并发度比旧模式Commit-Parent-Based Scheme的并发度要好。

下面举一个例子,详细描述基于Lock-Based Scheme并行复制的整个过程。


Lock-Based Scheme例子

image.png

  • 对于第一个事务,last_committed=0, sequence_number=1。第一个work线程会接手这个事务并开始工作。
  • 第二个事务,last_committed=1, sequence_number=2。直到第一个事务完成,这个事务才能开始。因为last_committed=1不小于正在执行执行事务的sequence_number=1。所以这两个事务只能串行。
  • 第三个事务,last_committed=2, sequence_number=3。和之前情况一样,只有等到sequence_number=2的事务完成才能开始。
  • 第四个事务,last_committed=3        sequence_number=4。同样如此。
  • 虽然前四个事务可能会被分配到不同的work线程,但实际上他们是串行的,就像单线程复制那样。
  • 当sequence_number=4的事务完成,last_committed=4的三个事务就可以并发执行。

last_committed=4           sequence_number=5

last_committed=4           sequence_number=6

last_committed=4           sequence_number=7

  • 一旦前两个执行完成,下面这两个可以开始执行:

last_committed=6        sequence_number=8

last_committed=6        sequence_number=9

sequence_number=7正在执行的时候,sequence_number=8和sequence_number=9这两个也可以并发执行。

这三个事务的结束没有前后顺序的限制。因为这三个事务的lock interval有重叠,因此可以并发执行,所以事务之间并不会相互影响。

注:实际上这三个事务是否存在提交的前后顺序的限制,取决于是否设置了slave_preserve_commit_order参数。如果此参数设置为on,则这三个事务在slave上提交的顺序和主库上一致;如果此参数设置为off,则这三个事务在slave上提交的顺序不能保证与主库上一致,也就可能会造成slave的复制存在gap的情况。何为gap:A gap is a transaction that has not been (fully) applied, even though some later transaction has been applied.

  • 等到前面的事务均完成之后,下面这个事务才可以进行:

last_committed=9        sequence_number=10


Lock-Based Scheme 往前的并发度计算

  • 从上面的描述,可以发现,如果sequence_number - last_committed的差值越大,并发度会越高。如果差值为1,那么这个事务必须等到前面的事务完成才能开始执行。如果差值为2,那么这个事务可以和前面的一个事务并发执行。

和后面的事务是否能并发进行,这个当前事务是无法判断的;当前事务只能与前面事务的sequence_number比较,得出自己是否可以并发执行。

  • 我们可以通过以下命令粗略查看并发度:
mysqlbinlog mysql-bin.000124 | grep -o 'last_committed.*' | sed 's/=/ /g' | awk '{print $4-$2}' | sort -g | uniq -c
    854 1
   1846 2
   2573 3
   3145 4
   3628 5
   4076 6
   4591 7
   5192 8
   5741 9
   6371 10
   7024 11
   7646 12
   8299 13
   8976 14
   9592 15
  10274 16
  10871 17
  11392 18
  11832 19
  12245 20
  12316 21
  12405 22
  11958 23
  12951 24
    160 25
      1 50
      1 66

差值为1的有854个,只是表示这854个事务的sequence_number - last_committed=1,必须等到所有前面的事务完成之后才能开始;但,并不表示不能和后面的事务并发执行。比如,上面的那个例子:

last_committed=4           sequence_number=5

last_committed=4           sequence_number=6

last_committed=4           sequence_number=7

sequence_number=5的这个事务只是表明必须等到前面事务完成,此事务才能开始执行;但它可以和后面的另两个事务并发执行。


  • 我们也可以通过以下的方式来优化并行复制的work数。

https://www.percona.com/blog/2016/02/10/estimating-potential-for-mysql-5-7-parallel-replication/


引申:slave_preserve_commit_order参数

这个参数设置为yes是为了确保,在slave上事务的提交顺序与relay log中一致。

但是经过测试,这个参数在MySQL5.7.18中设置之后,也无法保证slave上事务提交的顺序与relay log一致。

MySQL5.7.19设置后,slave上事务的提交顺序与relay log中一致。

For multi-threaded slaves, enabling this variable ensures that transactions are externalized on the slave in the same order as they appear in the slave's relay log. Setting this variable has no effect on slaves for which multi-threading is not enabled. All replication threads (for all replication channels if you are using multiple replication channels) must be stopped before changing this variable. --log-bin and --log-slave-updates must be enabled on the slave. In addition --slave-parallel-type must be set to LOGICAL_CLOCK.


参考

https://dev.mysql.com/worklog/task/?id=7165

https://dev.mysql.com/worklog/task/?id=6314

http://thenoyes.com/littlenoise/?p=525

https://dev.mysql.com/doc/refman/5.7/en/replication-options-slave.html#sysvar_slave_preserve_commit_order



相关实践学习
如何快速连接云数据库RDS MySQL
本场景介绍如何通过阿里云数据管理服务DMS快速连接云数据库RDS MySQL,然后进行数据表的CRUD操作。
全面了解阿里云能为你做什么
阿里云在全球各地部署高效节能的绿色数据中心,利用清洁计算为万物互联的新世界提供源源不断的能源动力,目前开服的区域包括中国(华北、华东、华南、香港)、新加坡、美国(美东、美西)、欧洲、中东、澳大利亚、日本。目前阿里云的产品涵盖弹性计算、数据库、存储与CDN、分析与搜索、云通信、网络、管理与监控、应用服务、互联网中间件、移动服务、视频服务等。通过本课程,来了解阿里云能够为你的业务带来哪些帮助 &nbsp; &nbsp; 相关的阿里云产品:云服务器ECS 云服务器 ECS(Elastic Compute Service)是一种弹性可伸缩的计算服务,助您降低 IT 成本,提升运维效率,使您更专注于核心业务创新。产品详情: https://www.aliyun.com/product/ecs
相关文章
|
8月前
|
关系型数据库 MySQL 分布式数据库
PolarDB MySQL版并行查询技术探索与实践
PolarDB MySQL版并行查询技术探索与实践 PolarDB MySQL版在企业级查询加速特性上进行了深度技术探索,其中并行查询作为其重要组成部分,已经在线稳定运行多年,持续演进。本文将详细介绍并行查询的背景、挑战、方案、特性以及实践。
271 2
|
8月前
|
SQL 关系型数据库 MySQL
实时计算 Flink版产品使用合集之支持 MySQL 的并行复制吗
实时计算Flink版作为一种强大的流处理和批处理统一的计算框架,广泛应用于各种需要实时数据处理和分析的场景。实时计算Flink版通常结合SQL接口、DataStream API、以及与上下游数据源和存储系统的丰富连接器,提供了一套全面的解决方案,以应对各种实时计算需求。其低延迟、高吞吐、容错性强的特点,使其成为众多企业和组织实时数据处理首选的技术平台。以下是实时计算Flink版的一些典型使用合集。
|
7月前
|
存储 缓存 关系型数据库
心得经验总结:理解MySQL——并行数据库与分区(Partion)
心得经验总结:理解MySQL——并行数据库与分区(Partion)
55 0
|
SQL 关系型数据库 MySQL
Flink CDC 现在支持mysql 的并行复制吗?
Flink CDC 现在支持mysql 的并行复制吗?
138 1
|
关系型数据库 MySQL
MySQL 5.7 基于GTID主从复制+并行复制+半同步复制
MySQL 5.7 基于GTID主从复制+并行复制+半同步复制
190 0
|
SQL 存储 算法
MySQL并行复制
一、MySQL的主从复制 1.1 主从复制基本原理   MySQL的主从架构依赖于MySQL Binlog功能,Master节点上产生Binlog并且写入到文件中。  Master节点上启动一个DUMP线程:当Slave节点I/O线程连接Master时,Master创建这个线程,DUMP线程负责从Master的binlog文件读取记录,然后发送给Slave。
1207 0
|
存储 SQL Cloud Native
基于 PolarDB for MySQL 实现并行创建索引赛题解析 | 学习笔记
快速学习基于 PolarDB for MySQL 实现并行创建索引赛题解析
基于 PolarDB for MySQL 实现并行创建索引赛题解析 | 学习笔记
|
SQL 关系型数据库 MySQL
MySQL 8.0.31并行构建索引特性管窥
测试效率提升36% ~ 100%,相当可观
251 0
MySQL 8.0.31并行构建索引特性管窥
|
SQL 关系型数据库 MySQL
MySQL并行复制的深入浅出
一、并行复制的背景 首先,为什么会有并行复制这个概念呢?1. DBA都应该知道,MySQL的复制是基于binlog的。 2. MySQL复制包括两部分,IO线程 和 SQL线程。 3. IO线程主要是用于拉取接收Master传递过来的binlog,并将其写入到relay log 4. SQL线程主要负责解析relay log,并应用到slave中 5. 不管怎么说,IO和SQL线程都是单线程的,然后master却是多线程的,所以难免会有延迟,为了解决这个问题,多线程应运而生了。
13400 0
|
关系型数据库 MySQL
MySQL 5.7 基于 GTID 主从复制 + 并行复制 + 半同步复制
MySQL 5.7 基于 GTID 主从复制 + 并行复制 + 半同步复制
639 0