MySQL学习笔记-MVCC数据多版可见性

本文涉及的产品
RDS MySQL Serverless 基础系列,0.5-2RCU 50GB
RDS MySQL Serverless 高可用系列,价值2615元额度,1个月
简介: MySQL学习笔记-MVCC数据多版可见性

InnoDB 最大的特点之一就是支持事务,而不同时刻启动的事务对于其他事务来说,可见性不一样,比如可重复读隔离级别下,启动一个事务,查询数据之后会创建一个一致性视图,该事务提交之前的查询都将依赖于这个一致性视图,就好像给所有数据 拍了一个快照 一样,这篇文章就学习一下 MVCC 数据的多版本并发控制是如何实现秒级快照的。

1.笔记图

2.事务的执行流程


  • 事务启动的时机
  • 第一种启动方式,一致性视图是在执行第一个快照读语句时创建的
  • 第二种启动方式,一致性视图是在执行 start transaction with consistent snapshot 时创建的
  • 假设隔离级别是可重复读

  • 事务 C 这个 update 语句本身就是一个事务,语句完成的时候会自动提交
  • 事务 A 在一个只读事务中查询,并且时间顺序上是在事务 B 的查询之后
  • 事务 B 在更新了行之后查询
  • 事务 B 查到的 k 的值是 3,事务 A 查到的 k 的值是 1

3.两个视图概念

  • view:它是一个用查询语句定义的虚拟表,在调用的时候执行查询语句并生成结果
  • 一致性读视图InnoDB 在实现 MVCC 时用到的一致性读视图 consistent read view,用于支持 RC(Read Committed,读提交)RR(Repeatable Read,可重复读)隔离级别的实现

4.MVCC 工作原理

  • 在可重复读隔离级别下,事务在启动的时候 拍了个基于整库的快照,并不需要拷贝数据
  • InnoDB 里面每个事务有一个唯一的事务 transaction id,是按申请顺序严格递增的
  • 每次事务更新数据的时候,都会生成一个新的数据版本,并且把 transaction id 赋值给这个数据版本的事务 ID,记为row trx_id
  • 数据表中的一行记录,其实可能有多个版本 (row),每个版本有自己的 row trx_id
  • undo log

  • 图中的三个虚线箭头,就是 undo log
  • V1、V2、V3 并不是物理上真实存在的,而是每次需要的时候根据当前版本和 undo log 计算出来的

5.当前读

  • 更新数据都是先读后写的,而这个读,只能读当前的值
  • select 语句如果加锁,也是当前读
select k from t where id=1 lock in share mode;
select k from t where id=1 for update;

6.查询数据可见性规则

  • InnoDB 为每个事务构造了一个数组,用来保存这个事务启动瞬间,当前正在 活跃 的所有事务 ID(活跃 指的就是,启动了但还没提交)
  • 数组里面事务 ID 的最小值记为低水位
  • 系统里面已经创建过的事务 ID 的最大值加 1 记为高水位
  • 视图数组和高水位,就组成了当前事务的一致性视图(read-view)

  • 一个数据版本的 row trx_id 如果落在绿色部分,这个数据是可见的
  • 一个数据版本的 row trx_id 如果落在红色部分,是不可见的
  • 一个数据版本的 row trx_id 如果落在黄色部分,包括两种情况
  • row trx_id 在数组中,表示这个版本是由还没提交的事务生成的,不可见
  • row trx_id 不在数组中,表示这个版本是已经提交了的事务生成的,可见

  • 事务 A 开始前,系统里面只有一个活跃事务 ID99
  • 事务 A、B、C 的版本号分别是 100、101、102,且当前系统里只有这四个事务
  • 三个事务开始前,(1,1) 这一行数据的 row trx_id90
  • 事务 A 要读数据,它的视图数组是 [99,100],读数据都是从当前版本读起的
  • 找到 (1,3) 的时候,判断出 row trx_id=101,比高水位大,不可见
  • 接着,找到上一个历史版本,一看 row trx_id=102,比高水位大,不可见
  • 再往前找,找到 (1,1),它的 row trx_id=90,比低水位小,处于绿色区域,可见

Tips:在可重复读隔离级别下,事务在启动之后,若更新某行数据后,会对改行加一个行锁,直到事务提交之后才释放。

相关实践学习
基于CentOS快速搭建LAMP环境
本教程介绍如何搭建LAMP环境,其中LAMP分别代表Linux、Apache、MySQL和PHP。
全面了解阿里云能为你做什么
阿里云在全球各地部署高效节能的绿色数据中心,利用清洁计算为万物互联的新世界提供源源不断的能源动力,目前开服的区域包括中国(华北、华东、华南、香港)、新加坡、美国(美东、美西)、欧洲、中东、澳大利亚、日本。目前阿里云的产品涵盖弹性计算、数据库、存储与CDN、分析与搜索、云通信、网络、管理与监控、应用服务、互联网中间件、移动服务、视频服务等。通过本课程,来了解阿里云能够为你的业务带来哪些帮助     相关的阿里云产品:云服务器ECS 云服务器 ECS(Elastic Compute Service)是一种弹性可伸缩的计算服务,助您降低 IT 成本,提升运维效率,使您更专注于核心业务创新。产品详情: https://www.aliyun.com/product/ecs
相关文章
|
4天前
|
关系型数据库 MySQL API
实时计算 Flink版产品使用合集之可以通过mysql-cdc动态监听MySQL数据库的数据变动吗
实时计算Flink版作为一种强大的流处理和批处理统一的计算框架,广泛应用于各种需要实时数据处理和分析的场景。实时计算Flink版通常结合SQL接口、DataStream API、以及与上下游数据源和存储系统的丰富连接器,提供了一套全面的解决方案,以应对各种实时计算需求。其低延迟、高吞吐、容错性强的特点,使其成为众多企业和组织实时数据处理首选的技术平台。以下是实时计算Flink版的一些典型使用合集。
79 0
|
4天前
|
SQL 关系型数据库 MySQL
MYSQL根据查询结果删除sql 去除重复id 新增对比前一条与后一条数据 去重3种方法​ 窗口函数
MYSQL根据查询结果删除sql 去除重复id 新增对比前一条与后一条数据 去重3种方法​ 窗口函数
|
1天前
|
自然语言处理 监控 关系型数据库
mysql造数据占用临时表空间
【5月更文挑战第20天】MySQL在处理复杂查询时可能使用临时表,可能导致性能下降。临时表用于排序、分组和连接操作。常见问题包括内存限制、未优化的查询、数据类型不当和临时表清理。避免过度占用的策略包括优化查询、调整系统参数、优化数据类型和事务管理。使用并行查询、分区表和监控工具也能帮助管理临时表空间。通过智能问答工具如通义灵码,可实时续写SQL和获取优化建议。注意监控`Created_tmp_tables`和`Created_tmp_disk_tables`以了解临时表使用状况。
119 5
|
2天前
|
Oracle 关系型数据库 MySQL
实时计算 Flink版操作报错合集之用CTAS从mysql同步数据到hologres,改了字段长度,报错提示需要全部重新同步如何解决
在使用实时计算Flink版过程中,可能会遇到各种错误,了解这些错误的原因及解决方法对于高效排错至关重要。针对具体问题,查看Flink的日志是关键,它们通常会提供更详细的错误信息和堆栈跟踪,有助于定位问题。此外,Flink社区文档和官方论坛也是寻求帮助的好去处。以下是一些常见的操作报错及其可能的原因与解决策略。
45 8
|
3天前
|
SQL 资源调度 关系型数据库
实时计算 Flink版产品使用合集之在抓取 MySQL binlog 数据时,datetime 字段会被自动转换为时间戳形式如何解决
实时计算Flink版作为一种强大的流处理和批处理统一的计算框架,广泛应用于各种需要实时数据处理和分析的场景。实时计算Flink版通常结合SQL接口、DataStream API、以及与上下游数据源和存储系统的丰富连接器,提供了一套全面的解决方案,以应对各种实时计算需求。其低延迟、高吞吐、容错性强的特点,使其成为众多企业和组织实时数据处理首选的技术平台。以下是实时计算Flink版的一些典型使用合集。
12 2
|
4天前
|
消息中间件 关系型数据库 MySQL
实时计算 Flink版产品使用合集之2.2.1版本同步mysql数据写入doris2.0 ,同步完了之后增量的数据延迟能达到20分钟甚至一直不写入如何解决
实时计算Flink版作为一种强大的流处理和批处理统一的计算框架,广泛应用于各种需要实时数据处理和分析的场景。实时计算Flink版通常结合SQL接口、DataStream API、以及与上下游数据源和存储系统的丰富连接器,提供了一套全面的解决方案,以应对各种实时计算需求。其低延迟、高吞吐、容错性强的特点,使其成为众多企业和组织实时数据处理首选的技术平台。以下是实时计算Flink版的一些典型使用合集。
14 1
|
4天前
|
Oracle 关系型数据库 MySQL
实时计算 Flink版产品使用合集之Flink CDC 2.3.0和Flink 1.17,无法从MySQL数据库中抽取数据,是什么原因导致的
实时计算Flink版作为一种强大的流处理和批处理统一的计算框架,广泛应用于各种需要实时数据处理和分析的场景。实时计算Flink版通常结合SQL接口、DataStream API、以及与上下游数据源和存储系统的丰富连接器,提供了一套全面的解决方案,以应对各种实时计算需求。其低延迟、高吞吐、容错性强的特点,使其成为众多企业和组织实时数据处理首选的技术平台。以下是实时计算Flink版的一些典型使用合集。
20 1
|
4天前
|
关系型数据库 MySQL 数据处理
实时计算 Flink版产品使用合集之如果在 MySQL 表中为某个字段设置了默认值,并且在插入数据时指定了该字段为 NULL,那么 MySQL 是否会使用默认值来填充这个字段
实时计算Flink版作为一种强大的流处理和批处理统一的计算框架,广泛应用于各种需要实时数据处理和分析的场景。实时计算Flink版通常结合SQL接口、DataStream API、以及与上下游数据源和存储系统的丰富连接器,提供了一套全面的解决方案,以应对各种实时计算需求。其低延迟、高吞吐、容错性强的特点,使其成为众多企业和组织实时数据处理首选的技术平台。以下是实时计算Flink版的一些典型使用合集。
18 0
|
4天前
|
关系型数据库 MySQL Java
实时计算 Flink版产品使用合集之mysql通过flink cdc同步数据,有没有办法所有表共用一个dump线程
实时计算Flink版作为一种强大的流处理和批处理统一的计算框架,广泛应用于各种需要实时数据处理和分析的场景。实时计算Flink版通常结合SQL接口、DataStream API、以及与上下游数据源和存储系统的丰富连接器,提供了一套全面的解决方案,以应对各种实时计算需求。其低延迟、高吞吐、容错性强的特点,使其成为众多企业和组织实时数据处理首选的技术平台。以下是实时计算Flink版的一些典型使用合集。
8 0
|
4天前
|
关系型数据库 MySQL Java
实时计算 Flink版产品使用合集之如果MySQL的binlog保存时间只有三天,那么三天之前的数据是不是会通过Doris的外表手动插入
实时计算Flink版作为一种强大的流处理和批处理统一的计算框架,广泛应用于各种需要实时数据处理和分析的场景。实时计算Flink版通常结合SQL接口、DataStream API、以及与上下游数据源和存储系统的丰富连接器,提供了一套全面的解决方案,以应对各种实时计算需求。其低延迟、高吞吐、容错性强的特点,使其成为众多企业和组织实时数据处理首选的技术平台。以下是实时计算Flink版的一些典型使用合集。
13 0