MySQL学习笔记-MVCC数据多版可见性

本文涉及的产品
RDS MySQL DuckDB 分析主实例,集群系列 4核8GB
简介: MySQL学习笔记-MVCC数据多版可见性

InnoDB 最大的特点之一就是支持事务,而不同时刻启动的事务对于其他事务来说,可见性不一样,比如可重复读隔离级别下,启动一个事务,查询数据之后会创建一个一致性视图,该事务提交之前的查询都将依赖于这个一致性视图,就好像给所有数据 拍了一个快照 一样,这篇文章就学习一下 MVCC 数据的多版本并发控制是如何实现秒级快照的。

1.笔记图

2.事务的执行流程


  • 事务启动的时机
  • 第一种启动方式,一致性视图是在执行第一个快照读语句时创建的
  • 第二种启动方式,一致性视图是在执行 start transaction with consistent snapshot 时创建的
  • 假设隔离级别是可重复读

  • 事务 C 这个 update 语句本身就是一个事务,语句完成的时候会自动提交
  • 事务 A 在一个只读事务中查询,并且时间顺序上是在事务 B 的查询之后
  • 事务 B 在更新了行之后查询
  • 事务 B 查到的 k 的值是 3,事务 A 查到的 k 的值是 1

3.两个视图概念

  • view:它是一个用查询语句定义的虚拟表,在调用的时候执行查询语句并生成结果
  • 一致性读视图InnoDB 在实现 MVCC 时用到的一致性读视图 consistent read view,用于支持 RC(Read Committed,读提交)RR(Repeatable Read,可重复读)隔离级别的实现

4.MVCC 工作原理

  • 在可重复读隔离级别下,事务在启动的时候 拍了个基于整库的快照,并不需要拷贝数据
  • InnoDB 里面每个事务有一个唯一的事务 transaction id,是按申请顺序严格递增的
  • 每次事务更新数据的时候,都会生成一个新的数据版本,并且把 transaction id 赋值给这个数据版本的事务 ID,记为row trx_id
  • 数据表中的一行记录,其实可能有多个版本 (row),每个版本有自己的 row trx_id
  • undo log

  • 图中的三个虚线箭头,就是 undo log
  • V1、V2、V3 并不是物理上真实存在的,而是每次需要的时候根据当前版本和 undo log 计算出来的

5.当前读

  • 更新数据都是先读后写的,而这个读,只能读当前的值
  • select 语句如果加锁,也是当前读
select k from t where id=1 lock in share mode;
select k from t where id=1 for update;

6.查询数据可见性规则

  • InnoDB 为每个事务构造了一个数组,用来保存这个事务启动瞬间,当前正在 活跃 的所有事务 ID(活跃 指的就是,启动了但还没提交)
  • 数组里面事务 ID 的最小值记为低水位
  • 系统里面已经创建过的事务 ID 的最大值加 1 记为高水位
  • 视图数组和高水位,就组成了当前事务的一致性视图(read-view)

  • 一个数据版本的 row trx_id 如果落在绿色部分,这个数据是可见的
  • 一个数据版本的 row trx_id 如果落在红色部分,是不可见的
  • 一个数据版本的 row trx_id 如果落在黄色部分,包括两种情况
  • row trx_id 在数组中,表示这个版本是由还没提交的事务生成的,不可见
  • row trx_id 不在数组中,表示这个版本是已经提交了的事务生成的,可见

  • 事务 A 开始前,系统里面只有一个活跃事务 ID99
  • 事务 A、B、C 的版本号分别是 100、101、102,且当前系统里只有这四个事务
  • 三个事务开始前,(1,1) 这一行数据的 row trx_id90
  • 事务 A 要读数据,它的视图数组是 [99,100],读数据都是从当前版本读起的
  • 找到 (1,3) 的时候,判断出 row trx_id=101,比高水位大,不可见
  • 接着,找到上一个历史版本,一看 row trx_id=102,比高水位大,不可见
  • 再往前找,找到 (1,1),它的 row trx_id=90,比低水位小,处于绿色区域,可见

Tips:在可重复读隔离级别下,事务在启动之后,若更新某行数据后,会对改行加一个行锁,直到事务提交之后才释放。

相关实践学习
每个IT人都想学的“Web应用上云经典架构”实战
本实验从Web应用上云这个最基本的、最普遍的需求出发,帮助IT从业者们通过“阿里云Web应用上云解决方案”,了解一个企业级Web应用上云的常见架构,了解如何构建一个高可用、可扩展的企业级应用架构。
MySQL数据库入门学习
本课程通过最流行的开源数据库MySQL带你了解数据库的世界。   相关的阿里云产品:云数据库RDS MySQL 版 阿里云关系型数据库RDS(Relational Database Service)是一种稳定可靠、可弹性伸缩的在线数据库服务,提供容灾、备份、恢复、迁移等方面的全套解决方案,彻底解决数据库运维的烦恼。 了解产品详情: https://www.aliyun.com/product/rds/mysql 
相关文章
|
6月前
|
存储 SQL 关系型数据库
mysql底层原理:索引、慢查询、 sql优化、事务、隔离级别、MVCC、redolog、undolog(图解+秒懂+史上最全)
mysql底层原理:索引、慢查询、 sql优化、事务、隔离级别、MVCC、redolog、undolog(图解+秒懂+史上最全)
mysql底层原理:索引、慢查询、 sql优化、事务、隔离级别、MVCC、redolog、undolog(图解+秒懂+史上最全)
|
8月前
|
缓存 NoSQL 关系型数据库
美团面试:MySQL有1000w数据,redis只存20w的数据,如何做 缓存 设计?
美团面试:MySQL有1000w数据,redis只存20w的数据,如何做 缓存 设计?
美团面试:MySQL有1000w数据,redis只存20w的数据,如何做 缓存 设计?
|
6月前
|
SQL 人工智能 关系型数据库
如何实现MySQL百万级数据的查询?
本文探讨了在MySQL中对百万级数据进行排序分页查询的优化策略。面对五百万条数据,传统的浅分页和深分页查询效率较低,尤其深分页因偏移量大导致性能显著下降。通过为排序字段添加索引、使用联合索引、手动回表等方法,有效提升了查询速度。最终建议根据业务需求选择合适方案:浅分页可加单列索引,深分页推荐联合索引或子查询优化,同时结合前端传递最后一条数据ID的方式实现高效翻页。
329 0
|
5月前
|
存储 关系型数据库 MySQL
在CentOS 8.x上安装Percona Xtrabackup工具备份MySQL数据步骤。
以上就是在CentOS8.x上通过Perconaxtabbackup工具对Mysql进行高效率、高可靠性、无锁定影响地实现在线快速全量及增加式数据库资料保存与恢复流程。通过以上流程可以有效地将Mysql相关资料按需求完成定期或不定期地保存与灾难恢复需求。
426 10
|
6月前
|
SQL 存储 缓存
MySQL 如何高效可靠处理持久化数据
本文详细解析了 MySQL 的 SQL 执行流程、crash-safe 机制及性能优化策略。内容涵盖连接器、分析器、优化器、执行器与存储引擎的工作原理,深入探讨 redolog 与 binlog 的两阶段提交机制,并分析日志策略、组提交、脏页刷盘等关键性能优化手段,帮助提升数据库稳定性与执行效率。
164 0
|
9月前
|
关系型数据库 MySQL Linux
在Linux环境下备份Docker中的MySQL数据并传输到其他服务器以实现数据级别的容灾
以上就是在Linux环境下备份Docker中的MySQL数据并传输到其他服务器以实现数据级别的容灾的步骤。这个过程就像是一场接力赛,数据从MySQL数据库中接力棒一样传递到备份文件,再从备份文件传递到其他服务器,最后再传递回MySQL数据库。这样,即使在灾难发生时,我们也可以快速恢复数据,保证业务的正常运行。
409 28
|
8月前
|
存储 SQL 缓存
mysql数据引擎有哪些
MySQL 提供了多种存储引擎,每种引擎都有其独特的特点和适用场景。以下是一些常见的 MySQL 存储引擎及其特点:
217 0
|
10月前
|
SQL 关系型数据库 MySQL
【YashanDB知识库】字符集latin1的MySQL中文数据如何迁移到YashanDB
本文探讨了在使用YMP 23.2.1.3迁移MySQL Server字符集为latin1的中文数据至YashanDB时出现乱码的问题。问题根源在于MySQL latin1字符集存放的是实际utf8编码的数据,而YMP尚未支持此类场景。文章提供了两种解决方法:一是通过DBeaver直接迁移表数据;二是将MySQL表数据转换为Insert语句后手动插入YashanDB。同时指出,这两种方法适合单张表迁移,多表迁移可能存在兼容性问题,建议对问题表单独处理。
【YashanDB知识库】字符集latin1的MySQL中文数据如何迁移到YashanDB
|
分布式计算 关系型数据库 MySQL
E-Mapreduce如何处理RDS的数据
目前网站的一些业务数据存在了数据库中,这些数据往往需要做进一步的分析,如:需要跟一些日志数据关联分析,或者需要进行一些如机器学习的分析。在阿里云上,目前E-Mapreduce可以满足这类进一步分析的需求。
5100 0
|
4月前
|
缓存 关系型数据库 BI
使用MYSQL Report分析数据库性能(下)
使用MYSQL Report分析数据库性能
176 3

推荐镜像

更多