MySQL中的MVCC是怎么实现的,你们知道吗?

本文涉及的产品
RDS MySQL Serverless 基础系列,0.5-2RCU 50GB
RDS MySQL Serverless 高可用系列,价值2615元额度,1个月
简介: 不晓得大家了解不了解MySQL的MVCC机制,这个是MySQL底层原理中比较重要的一项,它能极大的提高MySQL数据库的并发性能。MVCC广泛应用于数据库技术,像Oracle,PostgreSQL等都引入了该技术。本篇文章我们就带大家一起了解一下MySQL的MVCC机制实现原理。

什么是MVCC?

Multi-Version Concurrency Control(MVCC),翻译过来就是多版本并发控制,MVCC是为提高MySQL数据库并发性能的一个重要设计。

同一行数据发生读写请求时,会通过锁来保证数据的一致性。MVCC可以在读写冲突时,让其读数据时通过快照读,而不是当前读,快照读不必加锁。

在前边文章我们也介绍了MySQL中的锁机制,不熟悉的可以翻阅前边的文章。

InnoDB的事务

MySQL中的MVCC是在InnoDB存储引擎中得到支持的,InnoDB中最重要,也是最特殊的可谓就是事务,所以事务相关的一些设计我们必须了解。
  • 行级锁 InnoDB提供了行级锁,行级锁无疑使锁的粒度更细,但是数据过多时,在高并发场景下,同一时刻会产生大量的锁,因此,InnoDB也对锁进行了空间的有效优化,使得其在并发量高的情况下,也不会因为同一时刻锁过多,而导致内存耗尽。

    • 排他锁
    • 共享锁。
  • 隔离级别

    • READ_UNCOMMITTED:脏读
    • READ_COMMITTED:读提交
    • REPEATABLE_READ:重复读
    • SERIALIZABLE:串行化
  • redo log

    redo log 就是保存执行的SQL语句到一个指定的Log文件,当Mysql执行recovery时重新执行redo log记录的SQL操作即可。当客户端执行每条SQL(更新语句)时,redo log会被首先写入log buffer;当客户端执行COMMIT命令时,log buffer中的内容会被视情况刷新到磁盘。redo log在磁盘上作为一个独立的文件存在,即InnoDB的log文件。

  • undo log

    与redo log相反,undo log是为回滚而用,具体内容就是将事务影响到的行的原始数据行写入到到undo buffer,在合适的时间把undo buffer中的内容刷新到磁盘。undo buffer与redo buffer一样,也是环形缓冲,但当缓冲满的时候,undo buffer中的内容会也会被刷新到磁盘;与redo log不同的是,磁盘上不存在单独的undo log文件,所有的undo log均存放在主ibd(表空间)数据文件中,即使客户端设置了每表一个数据文件也是如此。

行更新的过程

InnoDB为每行记录都实现了三个隐藏字段:

  • 隐藏的ID
  • 6字节的事务ID(DB_TRX_ID
  • 7字节的回滚指针(DB_ROLL_PTR

行更新的过程

  1. 数据库新增一条数据,该条数据三个隐藏字段,只有ID有值
  2. T1修改该条数据,开启事务,记录read_view

    • 排它锁锁定该行数据
    • 记录redo log
    • 将该行数据写入undo log
    • 将修改值写入该条数据,填写事务Id,根据undo log记录位置填写回滚指针
  3. T2修改该条数据,开启事务,记录read_view

    • 排它锁锁定该行数据
    • 记录redo log
    • 将该行数据写入undo log
    • 将修改值写入该条数据,填写事务Id,通过回滚指针将undo log 的两条记录连接起来(版本链)
  4. 事务提交,记录read_view

    • 正常提交
    • 如果触发回滚,需要根据回滚指针找到undo log对应记录进行回滚

注意:

  • InnoDB中存在purge线程,它负责查询,并清理那些无效的undo log。
  • 上述过程描述的是UPDATE事务的过程,当INSERT时,原始的数据并不存在,所以在回滚时把insert丢弃即可

MVCC的基本特征

  • 每行数据都存在一个版本,每次更新数据时都更新该版本。
  • 修改时拷贝出当前版本随意修改,各个事务之间无干扰。
  • 保存时比较版本号,如果成功提交事务,则覆盖原记录;如果失败回滚则放弃拷贝的数据。

InnoDB如何实现MVCC?

MVCC则是建立在undo log 之上的。

undo log 中记录的数据就是MVCC中的多版本。

通过回滚指针形成版本链。

通过事务ID可以查找到read-view上的记录

RC隔离级别和RR隔离级别生成read-view的时机不一样,RR是在开始事务时,RC是在每一次查询,所以在RR隔离级别下,MVCC可以解决幻读问题。

read-view记录:

  • m_ids:表示活跃事务id列表
  • min_trx_id:活跃事务中的最小事务id
  • max_trx_id:已创建的最大事务id
  • creator_trx_id:当前的事务id

版本链比对规则:

  1. 如果 trx_id < min_trx_id,表示这个版本是已提交的事务生成的,这个数据是可见的;
  2. 如果 trx_id > max_trx_id,表示这个版本是由将来启动的事务生成的,是肯定不可见的。
  3. 如果 min_trx_id <= trx_id <= max_trx_id,那就包括两种情况

    • 若row的trx_id在m_ids数组中,表示这个版本是由还没提交的事务生成的,不可见,当前自己的事务是可见的。
    • 若row的trx_id不在m_ids数组中,表示这个版本是已经提交了的事务生成的,可见

MySQL的InnoDB实现MVCC,就是在隔离级别为读已提交可重复读,基于乐观锁理论,通过事务ID和read-view的记录进行比较判断分析数据是否可见,从而使其大部分读操作可以无需加锁,从而提高并发性能。

但是在写数据的时候,InnoDB还是需要加排它锁的。

总结,就是用乐观锁代替悲观锁,从而提高并发性能,这就是MVCC。

相关实践学习
基于CentOS快速搭建LAMP环境
本教程介绍如何搭建LAMP环境,其中LAMP分别代表Linux、Apache、MySQL和PHP。
全面了解阿里云能为你做什么
阿里云在全球各地部署高效节能的绿色数据中心,利用清洁计算为万物互联的新世界提供源源不断的能源动力,目前开服的区域包括中国(华北、华东、华南、香港)、新加坡、美国(美东、美西)、欧洲、中东、澳大利亚、日本。目前阿里云的产品涵盖弹性计算、数据库、存储与CDN、分析与搜索、云通信、网络、管理与监控、应用服务、互联网中间件、移动服务、视频服务等。通过本课程,来了解阿里云能够为你的业务带来哪些帮助 &nbsp; &nbsp; 相关的阿里云产品:云服务器ECS 云服务器 ECS(Elastic Compute Service)是一种弹性可伸缩的计算服务,助您降低 IT 成本,提升运维效率,使您更专注于核心业务创新。产品详情: https://www.aliyun.com/product/ecs
目录
相关文章
|
2天前
|
关系型数据库 MySQL
|
2天前
|
Oracle 关系型数据库 MySQL
MySQL相关(六)- 事务隔离级别的实现方案(MVCC)
MySQL相关(六)- 事务隔离级别的实现方案(MVCC)
43 0
|
2天前
|
存储 缓存 关系型数据库
⑩⑧【MySQL】InnoDB架构、事务原理、MVCC多版本并发控制
⑩⑧【MySQL】InnoDB架构、事务原理、MVCC多版本并发控制
114 0
|
2天前
|
存储 SQL 关系型数据库
MySQL事务底层原理和MVCC机制
MySQL事务底层原理和MVCC机制
42 1
|
2天前
|
存储 关系型数据库 MySQL
mysql数据库 mvcc
mysql数据库 mvcc
|
2天前
|
存储 SQL 关系型数据库
MySQL - 深入理解 MySQL 的 MVCC 及实现原理
MySQL - 深入理解 MySQL 的 MVCC 及实现原理
211 0
|
2天前
|
存储 缓存 关系型数据库
Mysql 专栏 - MVCC机制
Mysql 专栏 - MVCC机制
69 0
|
2天前
|
SQL 关系型数据库 MySQL
MySQL事务原理分析(ACID特性、隔离级别、锁、MVCC、并发读异常、并发死锁以及如何避免死锁)
MySQL事务原理分析(ACID特性、隔离级别、锁、MVCC、并发读异常、并发死锁以及如何避免死锁)
105 1
|
9月前
|
算法 关系型数据库 MySQL
MySQL事务隔离实现原理,多版本并发控制MVCC
MySQL事务隔离实现原理,多版本并发控制MVCC
143 0
|
2天前
|
SQL 关系型数据库 MySQL
从 MySQL 的事务 到 锁机制 再到 MVCC
转眼又一年~~2023马上就要到尾声了,在最后的几天中,我想给大家分享一下 MySQL 的一些小知识。在MySQL InnoDB引擎层面,又有新的解决方案 (解决加锁后读写性能问题),叫做MVCC(Multi-Version Concurrency Control)多版本并发控制。在MVCC下,就可以做到读写不阻塞且避免了类似脏读这样的问题。那MVCC是怎么做的呢?MVCC通过生成数据快照 (Snapshot)并用这个快照来提供一定级别 (语句级或事务级)的一致性读取。
68 3

推荐镜像

更多