MySQL学习笔记-MVCC数据多版可见性

本文涉及的产品
RDS MySQL Serverless 基础系列,0.5-2RCU 50GB
云数据库 RDS MySQL,集群系列 2核4GB
推荐场景:
搭建个人博客
RDS MySQL Serverless 高可用系列,价值2615元额度,1个月
简介: MySQL学习笔记-MVCC数据多版可见性

InnoDB 最大的特点之一就是支持事务,而不同时刻启动的事务对于其他事务来说,可见性不一样,比如可重复读隔离级别下,启动一个事务,查询数据之后会创建一个一致性视图,该事务提交之前的查询都将依赖于这个一致性视图,就好像给所有数据 拍了一个快照 一样,这篇文章就学习一下 MVCC 数据的多版本并发控制是如何实现秒级快照的。

1.笔记图

2.事务的执行流程


  • 事务启动的时机
  • 第一种启动方式,一致性视图是在执行第一个快照读语句时创建的
  • 第二种启动方式,一致性视图是在执行 start transaction with consistent snapshot 时创建的
  • 假设隔离级别是可重复读

  • 事务 C 这个 update 语句本身就是一个事务,语句完成的时候会自动提交
  • 事务 A 在一个只读事务中查询,并且时间顺序上是在事务 B 的查询之后
  • 事务 B 在更新了行之后查询
  • 事务 B 查到的 k 的值是 3,事务 A 查到的 k 的值是 1

3.两个视图概念

  • view:它是一个用查询语句定义的虚拟表,在调用的时候执行查询语句并生成结果
  • 一致性读视图InnoDB 在实现 MVCC 时用到的一致性读视图 consistent read view,用于支持 RC(Read Committed,读提交)RR(Repeatable Read,可重复读)隔离级别的实现

4.MVCC 工作原理

  • 在可重复读隔离级别下,事务在启动的时候 拍了个基于整库的快照,并不需要拷贝数据
  • InnoDB 里面每个事务有一个唯一的事务 transaction id,是按申请顺序严格递增的
  • 每次事务更新数据的时候,都会生成一个新的数据版本,并且把 transaction id 赋值给这个数据版本的事务 ID,记为row trx_id
  • 数据表中的一行记录,其实可能有多个版本 (row),每个版本有自己的 row trx_id
  • undo log

  • 图中的三个虚线箭头,就是 undo log
  • V1、V2、V3 并不是物理上真实存在的,而是每次需要的时候根据当前版本和 undo log 计算出来的

5.当前读

  • 更新数据都是先读后写的,而这个读,只能读当前的值
  • select 语句如果加锁,也是当前读
select k from t where id=1 lock in share mode;
select k from t where id=1 for update;

6.查询数据可见性规则

  • InnoDB 为每个事务构造了一个数组,用来保存这个事务启动瞬间,当前正在 活跃 的所有事务 ID(活跃 指的就是,启动了但还没提交)
  • 数组里面事务 ID 的最小值记为低水位
  • 系统里面已经创建过的事务 ID 的最大值加 1 记为高水位
  • 视图数组和高水位,就组成了当前事务的一致性视图(read-view)

  • 一个数据版本的 row trx_id 如果落在绿色部分,这个数据是可见的
  • 一个数据版本的 row trx_id 如果落在红色部分,是不可见的
  • 一个数据版本的 row trx_id 如果落在黄色部分,包括两种情况
  • row trx_id 在数组中,表示这个版本是由还没提交的事务生成的,不可见
  • row trx_id 不在数组中,表示这个版本是已经提交了的事务生成的,可见

  • 事务 A 开始前,系统里面只有一个活跃事务 ID99
  • 事务 A、B、C 的版本号分别是 100、101、102,且当前系统里只有这四个事务
  • 三个事务开始前,(1,1) 这一行数据的 row trx_id90
  • 事务 A 要读数据,它的视图数组是 [99,100],读数据都是从当前版本读起的
  • 找到 (1,3) 的时候,判断出 row trx_id=101,比高水位大,不可见
  • 接着,找到上一个历史版本,一看 row trx_id=102,比高水位大,不可见
  • 再往前找,找到 (1,1),它的 row trx_id=90,比低水位小,处于绿色区域,可见

Tips:在可重复读隔离级别下,事务在启动之后,若更新某行数据后,会对改行加一个行锁,直到事务提交之后才释放。

相关实践学习
如何快速连接云数据库RDS MySQL
本场景介绍如何通过阿里云数据管理服务DMS快速连接云数据库RDS MySQL,然后进行数据表的CRUD操作。
全面了解阿里云能为你做什么
阿里云在全球各地部署高效节能的绿色数据中心,利用清洁计算为万物互联的新世界提供源源不断的能源动力,目前开服的区域包括中国(华北、华东、华南、香港)、新加坡、美国(美东、美西)、欧洲、中东、澳大利亚、日本。目前阿里云的产品涵盖弹性计算、数据库、存储与CDN、分析与搜索、云通信、网络、管理与监控、应用服务、互联网中间件、移动服务、视频服务等。通过本课程,来了解阿里云能够为你的业务带来哪些帮助     相关的阿里云产品:云服务器ECS 云服务器 ECS(Elastic Compute Service)是一种弹性可伸缩的计算服务,助您降低 IT 成本,提升运维效率,使您更专注于核心业务创新。产品详情: https://www.aliyun.com/product/ecs
相关文章
|
8天前
|
存储 SQL 关系型数据库
【YashanDB知识库】MySQL迁移至崖山char类型数据自动补空格问题
**简介**:在MySQL迁移到崖山环境时,若字段类型为char(2),而应用存储的数据仅为'0'或'1',查询时崖山会自动补空格。原因是mysql的sql_mode可能启用了PAD_CHAR_TO_FULL_LENGTH模式,导致保留CHAR类型尾随空格。解决方法是与应用确认数据需求,可将崖山环境中的char类型改为varchar类型以规避补空格问题,适用于所有版本。
|
5天前
|
缓存 NoSQL 关系型数据库
Redis和Mysql如何保证数据⼀致?
1. 先更新Mysql,再更新Redis,如果更新Redis失败,可能仍然不⼀致 2. 先删除Redis缓存数据,再更新Mysql,再次查询的时候在将数据添加到缓存中 这种⽅案能解决1 ⽅案的问题,但是在⾼并发下性能较低,⽽且仍然会出现数据不⼀致的问题,⽐如线程1删除了 Redis缓存数据,正在更新Mysql,此时另外⼀个查询再查询,那么就会把Mysql中⽼数据⼜查到 Redis中 1. 使用MQ异步同步, 保证数据的最终一致性 我们项目中会根据业务情况 , 使用不同的方案来解决Redis和Mysql的一致性问题 : 1. 对于一些一致性要求不高的场景 , 不做处理例如 : 用户行为数据 ,
|
1月前
|
SQL 关系型数据库 MySQL
京东面试:MySQL MVCC是如何实现的?如何通过MVCC实现读已提交、可重复读隔离级别的?
1.请解释什么是MVCC,它在数据库中的作用是什么? 2.在MySQL中,MVCC是如何实现的?请简述其工作原理。 3.MVCC是如何解决读-写和写-写冲突的? 4.在并发环境中,当多个事务同时读取同一行数据时,MVCC是如何保证每个事务看到的数据版本是一致的? 5.MVCC如何帮助提高数据库的并发性能?
京东面试:MySQL MVCC是如何实现的?如何通过MVCC实现读已提交、可重复读隔离级别的?
|
1月前
|
存储 SQL 关系型数据库
MySQL底层概述—4.InnoDB数据文件
本文介绍了InnoDB表空间文件结构及其组成部分,包括表空间、段、区、页和行。表空间是最高逻辑层,包含多个段;段由若干个区组成,每个区包含64个连续的页,页用于存储多条行记录。文章还详细解析了Page结构,分为通用部分(文件头与文件尾)、数据记录部分和页目录部分。此外,文中探讨了行记录格式,包括四种行格式(Redundant、Compact、Dynamic和Compressed),重点介绍了Compact行记录格式及其溢出机制。最后,文章解释了不同行格式的特点及应用场景,帮助理解InnoDB存储引擎的工作原理。
MySQL底层概述—4.InnoDB数据文件
|
26天前
|
SQL 关系型数据库 MySQL
基于SQL Server / MySQL进行百万条数据过滤优化方案
对百万级别数据进行高效过滤查询,需要综合使用索引、查询优化、表分区、统计信息和视图等技术手段。通过合理的数据库设计和查询优化,可以显著提升查询性能,确保系统的高效稳定运行。
48 9
|
1月前
|
监控 关系型数据库 MySQL
MySQL和SQLSugar百万条数据查询分页优化
在面对百万条数据的查询时,优化MySQL和SQLSugar的分页性能是非常重要的。通过合理使用索引、调整查询语句、使用缓存以及采用高效的分页策略,可以显著提高查询效率。本文介绍的技巧和方法,可以为开发人员在数据处理和查询优化中提供有效的指导,提升系统的性能和用户体验。掌握这些技巧后,您可以在处理海量数据时更加游刃有余。
100 9
|
1月前
|
存储 关系型数据库 MySQL
MySQL进阶突击系列(09)数据磁盘存储模型 | 一行数据怎么存?
文中详细介绍了MySQL数据库中一行数据在磁盘上的存储机制,包括表空间、段、区、页和行的具体结构,以及如何设计和优化行数据存储以提高性能。
|
1月前
|
存储 SQL 关系型数据库
【YashanDB 知识库】MySQL 迁移至崖山 char 类型数据自动补空格问题
问题分类】功能使用 【关键字】char,char(1) 【问题描述】MySQL 迁移至崖山环境,字段类型源端和目标端都为 char(2),但应用存储的数据为'0'、'1',此时崖山查询该表字段时会自动补充空格 【问题原因分析】mysql 有 sql_mode 控制,检查是否启用了 PAD_CHAR_TO_FULL_LENGTH SQL 模式。如果启用了这个模式,MySQL 才会保留 CHAR 类型字段的尾随空格,默认没有启动。 #查看sql_mode mysql> SHOW VARIABLES LIKE 'sql_mode'; 【解决/规避方法】与应用确认存储的数据,正确定义数据
|
6天前
|
关系型数据库 MySQL 数据库连接
docker拉取MySQL后数据库连接失败解决方案
通过以上方法,可以解决Docker中拉取MySQL镜像后数据库连接失败的常见问题。关键步骤包括确保容器正确启动、配置正确的环境变量、合理设置网络和权限,以及检查主机防火墙设置等。通过逐步排查,可以快速定位并解决连接问题,确保MySQL服务的正常使用。
114 82
|
1天前
|
关系型数据库 MySQL Java
【YashanDB知识库】原生mysql驱动配置连接崖山数据库
【YashanDB知识库】原生mysql驱动配置连接崖山数据库
【YashanDB知识库】原生mysql驱动配置连接崖山数据库