MySQL是如何实现可重复读的?

本文涉及的产品
RDS MySQL Serverless 基础系列,0.5-2RCU 50GB
云数据库 RDS MySQL,高可用系列 2核4GB
云数据库 RDS PostgreSQL,高可用系列 2核4GB
简介: 云栖号资讯:【点击查看更多行业资讯】在这里您可以找到不同行业的第一手的上云资讯,还在等什么,快来! 简单理解一下可重复读 可重复读是指:一个事务执行过程中看到的数据,总是跟这个事务在启动时看到的数据是一致的。

云栖号资讯:【点击查看更多行业资讯
在这里您可以找到不同行业的第一手的上云资讯,还在等什么,快来!


简单理解一下可重复读

可重复读是指:一个事务执行过程中看到的数据,总是跟这个事务在启动时看到的数据是一致的。

我们可以简单理解为:在可重复读隔离级别下,事务在启动的时候就”拍了个快照“。注意,这个快照是基于整个库的。

这时,你可能就会想,如果一个库有 100G,那么我启动一个事务,MySQL就要拷贝 100G 的数据出来,这个过程得多慢啊。可是,我平时的事务执行起来很快啊。

实际上,我们并不需要拷贝出这 100G 的数据。我们来看下”快照“是怎么实现的。

拍个快照

InnoDB 里面每个事务都有一个唯一的事务 ID,叫作 transaction id。它在事务开始的时候向 InnoDB 的事务系统申请的,是按申请顺序严格递增的。

每条记录在更新的时候都会同时记录一条 undo log,这条 log 就会记录上当前事务的 transaction id,记为 row trx_id。记录上的最新值,通过回滚操作,都可以得到前一个状态的值。

如下图所示,一行记录被多个事务更新之后,最新值为 k=22。假设事务A在 trx_id=15 这个事务提交后启动,事务A 要读取该行时,就通过 undo log,计算出该事务启动瞬间该行的值为 k=10。

1

在可重复读隔离级别下,一个事务在启动时,InnoDB 会为事务构造一个数组,用来保存这个事务启动瞬间,当前正在”活跃“的所有事务ID。”活跃“指的是,启动了但还没提交。

数组里面事务 ID 为最小值记为低水位,当前系统里面已经创建过的事务 ID 的最大值加 1 记为高水位。

这个视图数组和高水位,就组成了当前事务的一致性视图(read-view)。

这个视图数组把所有的 row trx_id 分成了几种不同的情况。

2

  • 如果 trx_id 小于低水位,表示这个版本在事务启动前已经提交,可见;
  • 如果 trx_id 大于高水为,表示这个版本在事务启动后生成,不可见;
  • 如果 trx_id 大于低水位,小于高水位,分为两种情况:
  • 若 trx_id 在数组中,表示这个版本在事务启动时还未提交,不可见;
  • 若 trx_id 不在数组中,表示这个版本在事务启动时已经提交,可见。

InnoDB 就是利用 undo log 和 trx_id 的配合,实现了事务启动瞬间”秒级创建快照“的能力。

举个栗子

初始化语句

1

下表为事务A, B, C 的执行流程

2

我们假设事务A, B, C 的 trx_id 分别为 100, 101, 102。事务A开始前活跃的事务 ID 只有 99,并且 id=1 这一行数据的 trx_id=90。
根据假设,我们得出事务启动瞬间的视图数组:事务A:[99, 100],事务B:[99, 100, 101],事务C:[99, 100, 101, 102]。

3

  • 事务C通过更新语句,把 k 更新为 2,此时trx_id=102;
  • 事务B通过更新语句,把 k 更新为 3,此时trx_id=101;
  • 事务B通过查询语句,查询到最新一条记录为3,trx_id=101,满足隔离条件,返回 k=3;
  • 事务A通过查询语句:

1.查询到最新一条记录为3,trx_id=101,比高水位大,不可见;
2.通过 undo log,找到上一个历史版本,trx_id=102,比高水位大,不可见;
3.继续找上一个历史版本,trx_id=90,比低水位小,可见。

提出问题:为啥事务B更新的时候能看到事务C的修改?

我们假设事务B在更新的看不到事务C的修改,是什么个情况?

  • 事务B查询到最新一条记录为2,trx_id=102,比高水位大,不可见;
  • 通过 undo log,找到上一个版本,trx_id=90,比低水位小,可见;
  • 返回记录 k=1,执行 k=k+1,把 k 更新为2,此时 trx_id=101。

如果是这种情况,事务C可能就蒙了:“啥子情况,我的更新怎么就丢了”。事务B覆盖了事务C的更新。

所以,InnoDB在更新时运用一条规则:更新数据都是先读后写的,而这个读,只能读当前的值,称为“当前读“ (current read)。

因此,事务B在更新时要拿到最新的数据,在此基础上做更新。紧接着,事务B在读取的时候,查询到最新的记录为3, trx_id=101 为当前事务ID,可见。

我们再假设另一种情况:

事务B在更新之后,事务C紧接着更新,事务B回滚了,事务C成功提交。

3

如果按照当前读的定义,会发生以下事故,假设当前 K=1:

  • 事务B把 k 更新为 2;
  • 事务C读取到当前最新值,k=2,更新为3;
  • 事务B回滚;
  • 事务C提交。

这时候,事务C发现自己想要执行的是 +1 操作,结果变成了 ”+2“ 操作。

InnoDB 肯定不允许这种情况的发生,事务B在执行更新语句时,会给该行加上行锁,直到事务B结束,才会释放这个锁。

4

小结

InnoDB 的行数据有多个版本,每个版本都有 row trx_id。事务根据 undo log 和 trx_id 构建出满足当前隔离级别的一致性视图。可重复读的核心是一致性读,而事务更新数据的时候,只能使用当前读,如果当前记录的行锁被其他事务占用,就需要进入锁等待。

【云栖号在线课堂】每天都有产品技术专家分享!
课程地址:https://yqh.aliyun.com/live

立即加入社群,与专家面对面,及时了解课程最新动态!
【云栖号在线课堂 社群】https://c.tb.cn/F3.Z8gvnK

原文发布时间:2020-06-05
本文作者:超超不会飞
本文来自:“掘金”,了解相关信息可以关注“掘金”

相关实践学习
每个IT人都想学的“Web应用上云经典架构”实战
本实验从Web应用上云这个最基本的、最普遍的需求出发,帮助IT从业者们通过“阿里云Web应用上云解决方案”,了解一个企业级Web应用上云的常见架构,了解如何构建一个高可用、可扩展的企业级应用架构。
MySQL数据库入门学习
本课程通过最流行的开源数据库MySQL带你了解数据库的世界。   相关的阿里云产品:云数据库RDS MySQL 版 阿里云关系型数据库RDS(Relational Database Service)是一种稳定可靠、可弹性伸缩的在线数据库服务,提供容灾、备份、恢复、迁移等方面的全套解决方案,彻底解决数据库运维的烦恼。 了解产品详情: https://www.aliyun.com/product/rds/mysql 
相关文章
|
关系型数据库 MySQL
mysql如何实现可重复读
mysql基于乐观锁原理实现的mvcc(Multi-Version Concurrency Control,多版本并发控制)
8705 0
|
关系型数据库 MySQL C语言
MySQL是如何实现可重复读的?
MySQL是如何实现可重复读的?
459 0
MySQL是如何实现可重复读的?
|
3月前
|
缓存 关系型数据库 BI
使用MYSQL Report分析数据库性能(下)
使用MYSQL Report分析数据库性能
134 3
|
3月前
|
关系型数据库 MySQL 数据库
自建数据库如何迁移至RDS MySQL实例
数据库迁移是一项复杂且耗时的工程,需考虑数据安全、完整性及业务中断影响。使用阿里云数据传输服务DTS,可快速、平滑完成迁移任务,将应用停机时间降至分钟级。您还可通过全量备份自建数据库并恢复至RDS MySQL实例,实现间接迁移上云。
|
4月前
|
存储 运维 关系型数据库
从MySQL到云数据库,数据库迁移真的有必要吗?
本文探讨了企业在业务增长背景下,是否应从 MySQL 迁移至云数据库的决策问题。分析了 MySQL 的优势与瓶颈,对比了云数据库在存储计算分离、自动化运维、多负载支持等方面的优势,并提出判断迁移必要性的五个关键问题及实施路径,帮助企业理性决策并落地迁移方案。
|
3月前
|
关系型数据库 MySQL 分布式数据库
阿里云PolarDB云原生数据库收费价格:MySQL和PostgreSQL详细介绍
阿里云PolarDB兼容MySQL、PostgreSQL及Oracle语法,支持集中式与分布式架构。标准版2核4G年费1116元起,企业版最高性能达4核16G,支持HTAP与多级高可用,广泛应用于金融、政务、互联网等领域,TCO成本降低50%。
|
3月前
|
关系型数据库 MySQL 数据库
阿里云数据库RDS费用价格:MySQL、SQL Server、PostgreSQL和MariaDB引擎收费标准
阿里云RDS数据库支持MySQL、SQL Server、PostgreSQL、MariaDB,多种引擎优惠上线!MySQL倚天版88元/年,SQL Server 2核4G仅299元/年,PostgreSQL 227元/年起。高可用、可弹性伸缩,安全稳定。详情见官网活动页。
|
3月前
|
关系型数据库 分布式数据库 数据库
阿里云数据库收费价格:MySQL、PostgreSQL、SQL Server和MariaDB引擎费用整理
阿里云数据库提供多种类型,包括关系型与NoSQL,主流如PolarDB、RDS MySQL/PostgreSQL、Redis等。价格低至21元/月起,支持按需付费与优惠套餐,适用于各类应用场景。
|
3月前
|
SQL 关系型数据库 MySQL
Mysql数据恢复—Mysql数据库delete删除后数据恢复案例
本地服务器,操作系统为windows server。服务器上部署mysql单实例,innodb引擎,独立表空间。未进行数据库备份,未开启binlog。 人为误操作使用Delete命令删除数据时未添加where子句,导致全表数据被删除。删除后未对该表进行任何操作。需要恢复误删除的数据。 在本案例中的mysql数据库未进行备份,也未开启binlog日志,无法直接还原数据库。
|
3月前
|
Ubuntu 安全 关系型数据库
安装与配置MySQL 8 on Ubuntu,包括权限授予、数据库备份及远程连接指南
以上步骤提供了在Ubuntu上从头开始设置、配置、授权、备份及恢复一个基础但完整的MySQL环境所需知识点。
408 7

推荐镜像

更多