从 MySQL 的事务 到 锁机制 再到 MVCC

本文涉及的产品
RDS MySQL Serverless 基础系列,0.5-2RCU 50GB
RDS MySQL Serverless 高可用系列,价值2615元额度,1个月
简介: 转眼又一年~~2023马上就要到尾声了,在最后的几天中,我想给大家分享一下 MySQL 的一些小知识。在MySQL InnoDB引擎层面,又有新的解决方案 (解决加锁后读写性能问题),叫做MVCC(Multi-Version Concurrency Control)多版本并发控制。在MVCC下,就可以做到读写不阻塞且避免了类似脏读这样的问题。那MVCC是怎么做的呢?MVCC通过生成数据快照 (Snapshot)并用这个快照来提供一定级别 (语句级或事务级)的一致性读取。

 其他系列文章导航

Java基础合集

数据结构与算法合集

设计模式合集

多线程合集

分布式合集

ES合集


文章目录

其他系列文章导航

文章目录

前言

一、事务

1.1 含义

1.2 ACID

二、锁机制

2.1 锁分类

2.2 隔离级别

三、MVCC

3.1 介绍

3.2 隔离级别

3.3 原理

四、总结


前言

转眼又一年~~2023马上就要到尾声了,在最后的几天中,我想给大家分享一下 MySQL 的一些小知识。


一、事务

1.1 含义

通俗理解:在我的理解下,事务可以使 一组操作,要么全部成功,要么全部失败。事务其目的是为了下保证数据最终的一致性。

举个例子:举个例子,我给你发支付宝转了666块红包。那自然我的支付宝余额会扣减666块,你的支付宝余额会增加666块。

image.gif编辑

1.2 ACID

    • 原子性 (Atomicity)
    • 一致性 (Consistency)
    • 隔离性 (lsolation)
    • 持久性 (Durability)

    原子性指的是:当前事务的操作要么同时成功,要么同时失败。原子性由undo log日志来保证,因为undo log记载着数据修改前的信息。

    比如我们要 insert 一条数据了,那undo log 会记录的一条对应的 delete 日志。我们要 update 一条记录时,那undo log会记录之前的 旧值 的update记录。

    如果执行事务过程中出现异常的情况那执行 [回滚]。InnoDB引擎就是利用undo log记录下的数据,来将数据 恢复 到事务开始之前。

    隔离性指的是:在事务并发执行时,他们内部的操作不能互相干扰。

    如果多个事务可以在同一时刻操作同一份数据,那么就会可能会产生脏读、重复读、幻读的问题。

    于是,事务与事务之间需要存在 一定 的隔离。在InnoDB引擎中,定义了四种隔离级别供我们使用:

      • read uncommit(读未提交)
      • read commit (读已提交)
      • repeatable read(可重复复读)
      • serializable (串行)

      不同的隔离级别对事务之间的隔离性是不一样的 (级别越高事务隔离性越好,但性能就越低) ,而隔离性是由MySQL的各种锁来实现的,只是它屏蔽了加锁的细节。

      持久性指的就是:一旦提交了事务,它对数据库的改变就应该是永久性的。说白了就是,会将数据持久化在硬盘上。

      而持久性由 redo log 日志来保证,当我们要修改数据时,MySQL是先把这条记录所在的页找到,然后把该页加载到内存中,将对应记录进行修改。

      为了防止内存修改完了,MySQL就挂掉了(如果内存改完,直接挂掉,那这次的修改相当于就丢失了)。

      MySQL引入了 redo log,内存写完了然后会写一份 redo log,这份 redo log 记载着这次在某个页上做了什么修改。

      即便 MySQL 在中途挂了,我们还可以根据 redo log来对数据进行恢复。

      redo log 是顺序写的,写入速度很快。并且它记录的是物理修改 (xxxx页做了xxx修改),文件的体积很小,恢复速度也很快。

      一致性指的就是:我们使用事务的目的 ,而[隔离性][原子性][持久性]均是为了保障 [一致性] 的手段,保证一致性需要由应用程序代码来保证。

      比如,如果事务在发生的过程中,出现了异常情况,此时你就得回滚事务,而不是强行提交事务来导致数据不一致。


      二、锁机制

      2.1 锁分类

      在InnoDB引擎下,按锁的粒度分类,可以简单分为:

        • 行锁
        • 表锁

        行锁实际上是作用在索引之上的。

        当我们的 SQL 命中了索引,那锁住的就是命中条件内的索引节点(这种就是行锁),如果没有命中索引,那我们锁的就是整个索引树 (表锁)。

        简单来说就是:锁住的是整棵树还是某几个节点,完全取决于 SQL 条件是否有命中到对应的索引节点。

        而行锁又可以简单分为:

          • 读锁 (共享锁、S锁)
          • 写锁 (排它锁、X锁)

          读写锁区别:

            • 读锁是共享的,多个事务可以同时读取同一个资源,但不允许其他事务修改。
            • 写锁是排他的,写锁会阻塞其他的写锁和读锁。

            image.gif编辑

            2.2 隔离级别

            再回到隔离级别上吧,以例子来说明。

            首先来说下read uncommit(读未提交)比如说: A向B转账,A执行了转账语句,但A还没有提交事务,B读取数据发现自己账户钱变多了! B跟A说,我已经收到钱了。A回滚事务[rollback]等B再查看账户的钱时,发现钱并没有多。

            简单的定义就是:事务B读取到了事务A还没提交的数据,这种用专业术语来说叫做[脏读]。

            对于锁的维度而言,其实就是在read uncommit隔离级别下,读不会加任何锁,而写会加排他锁。读什么锁都不加,这就让排他锁无法排它了。

            而我们又知道,对于更新操作而言,InnoDB是肯定会加写锁的 (数据库是不可能允许在同一时间,更新同一条记录的)。而读操作,如果不加任何锁,那就会造成上面的脏读。

            脏读在生产环境下肯定是无法接受的,,那如果读加锁的话,那意味着:当更新数据的时,就没办法读取了,这会极大地降低数据库性能。


            三、MVCC

            3.1 介绍

            在MySQL InnoDB引擎层面,又有新的解决方案 (解决加锁后读写性能问题),叫做MVCC(Multi-Version Concurrency Control)多版本并发控制。

            在MVCC下,就可以做到读写不阻塞且避免了类似脏读这样的问题。那MVCC是怎么做的呢?

            MVCC通过生成数据快照 (Snapshot)并用这个快照来提供一定级别 (语句级或事务级)的一致性读取。

            3.2 隔离级别

            回到事务隔离级别下,针对于 read commit (读已提交) 隔离级别,它生成的就是语句级快照,而针对于repeatable read(可重复读),它生成的就是事务级的快照。

            前面提到过read uncommit隔离级别下会产生脏读,而read commit (读已提交)隔离级别解决了脏读。

            思想其实很简单:在读取的时候生成一个"版本号",等到其他事务commit了之后,才会读取最新已commit的"版本号"数据。

            比如说: 事务A读取了记录(生成版本号),事务B修改了记录(此时加了写锁)事务A再读取的时候,是依据最新的版本号来读取的(当事务B执行commit了之后,会生成一个新的版本号),如果事务B还没有commit,那事务A读取的还是之前版本号的数据。

            通过[版本]的概念,这样就解决了脏读的问题,而通过 版本,又可以对应快照的数据。

            read commit (读已提交) 解决了脏读,但也会有其他并发的问题。 [不可重复读]:一个事务读取到另外一个事务已经提交的数据,也就是说一个事务可以看到其他事务所做的修改。

            不可重复读的例子: A查询数据库得到数据,B去修改数据库的数据,导致A多次查询数据库的结果都不一样[危害: A每次查询的结果都是受B的影响的]。

            了解MVCC基础之后,就很容易想到repeatable read (可重复复读)隔离级别是怎么避免不可重复读的问题了 (前面也提到了)。

            repeatable read (可重复复读)隔离级别是 事务级别]的快照!每次读取的都是厂当前事务的版本],即使当前数据被其他事务修改了(commit),也只会读取当前事务版本的数据。

            在InnoDB引擎下的的repeatable read(可重复复读)隔离级别下,在MVCC下快照读,已经解决了幻读的问题 (因为它是读历史版本的数据)。

            而如果是当前读 (比如 select * from table for update),则需要配合间隙锁来解决幻读的问题。

            剩下的就是serializable (串行)隔离级别了,它的最高的隔离级别,相当于不允许事务的并发,事务与事务之间执行是串行的,它的效率最低,但同时也是最安全的。

            3.3 原理

            MVCC的主要是通过read view和undo log来实现的。

            undo log前面也提到了,它会记录修改数据之前的信息,事务中的原子性就是通过undo log来实现的。所以,有undo log可以帮我们找到 版本]的数据。

            而read view 实际上就是在查询时,InnoDB会生成一个read view,read view 有几个重要的字段,看下去就懂了。

              • trx ids (尚未提交commit的事务版本号集合)
              • low limit id (下一次要生成的事务ID值)
              • low limit id (尚未提交版本号的事务ID最小值)
              • creator_trx_id (当前的事务版本号)

              在每行数据有两列隐藏的字段,分别是DB TRX ID (记录着当前ID) 以及DB ROLL PTR (指向上一个版本数据在undolog 里的位置指针)。

              铺垫到这了,很容易就发现,MVCC其实就是靠[比对版本,来实现读写不阻塞,而版本的数据存在于undo log中。

              而针对于不同的隔离级别 (read commit和repeatable read) ,无非就是read commit隔离级别下,每次都获取一个新的1ead view,repeatable read隔离级别则每次事务只获取一个read view


              四、总结

              事务、锁机制和 MVCC 是数据库管理系统中的三个核心概念,它们协同工作以确保数据的完整性和并发性。

              在 MySQL 中,事务提供了一种方法来管理数据库操作的逻辑边界,锁机制用于控制对数据的并发访问,而 MVCC 则通过允许多个事务同时读取数据来提高并发性能。

              了解和正确使用这些概念对于数据库管理员和开发人员来说至关重要,以确保数据库应用的性能和可靠性。


              相关实践学习
              基于CentOS快速搭建LAMP环境
              本教程介绍如何搭建LAMP环境,其中LAMP分别代表Linux、Apache、MySQL和PHP。
              全面了解阿里云能为你做什么
              阿里云在全球各地部署高效节能的绿色数据中心,利用清洁计算为万物互联的新世界提供源源不断的能源动力,目前开服的区域包括中国(华北、华东、华南、香港)、新加坡、美国(美东、美西)、欧洲、中东、澳大利亚、日本。目前阿里云的产品涵盖弹性计算、数据库、存储与CDN、分析与搜索、云通信、网络、管理与监控、应用服务、互联网中间件、移动服务、视频服务等。通过本课程,来了解阿里云能够为你的业务带来哪些帮助     相关的阿里云产品:云服务器ECS 云服务器 ECS(Elastic Compute Service)是一种弹性可伸缩的计算服务,助您降低 IT 成本,提升运维效率,使您更专注于核心业务创新。产品详情: https://www.aliyun.com/product/ecs
              目录
              相关文章
              |
              6天前
              |
              SQL 存储 缓存
              【MySQL】事务
              【MySQL】事务
              15 0
              |
              6天前
              |
              关系型数据库 MySQL 数据库
              MySQL的行级锁锁的到底是什么?
              本文简述了InnoDB的行级锁机制,包括记录锁、间隙锁和Next-Key锁。记录锁锁定索引记录,防止其他事务对相同值的行进行操作;间隙锁锁定索引记录间的间隙,防止插入。Next-Key锁是两者的结合,锁定记录及其前后间隙。在可重复读(RR)隔离级别下,加锁策略涉及Next-Key锁,但会因查询条件退化为行锁或间隙锁。MySQL的加锁机制遵循两个原则和两个优化,例如唯一索引等值查询时退化为行锁。RR级别虽能防止幻读,但也可能降低并发并引发死锁,因此有些场景下会选择读已提交(RC)级别。
              MySQL的行级锁锁的到底是什么?
              |
              6天前
              |
              SQL 存储 关系型数据库
              MySQL索引及事务
              MySQL索引及事务
              25 2
              |
              6天前
              |
              存储 关系型数据库 MySQL
              MySQL事务简述
              MySQL事务简述
              6 0
              |
              6天前
              |
              存储 算法 关系型数据库
              MySQL事务与锁,看这一篇就够了!
              MySQL事务与锁,看这一篇就够了!
              |
              4天前
              |
              关系型数据库 MySQL API
              实时计算 Flink版产品使用合集之可以通过mysql-cdc动态监听MySQL数据库的数据变动吗
              实时计算Flink版作为一种强大的流处理和批处理统一的计算框架,广泛应用于各种需要实时数据处理和分析的场景。实时计算Flink版通常结合SQL接口、DataStream API、以及与上下游数据源和存储系统的丰富连接器,提供了一套全面的解决方案,以应对各种实时计算需求。其低延迟、高吞吐、容错性强的特点,使其成为众多企业和组织实时数据处理首选的技术平台。以下是实时计算Flink版的一些典型使用合集。
              79 0
              |
              6天前
              |
              关系型数据库 MySQL 数据库
              docker MySQL删除数据库时的错误(errno: 39)
              docker MySQL删除数据库时的错误(errno: 39)
              60 0
              |
              6天前
              |
              Java 关系型数据库 MySQL
              【MySQL × SpringBoot 突发奇想】全面实现流程 · xlsx文件,Excel表格导入数据库的接口(下)
              【MySQL × SpringBoot 突发奇想】全面实现流程 · xlsx文件,Excel表格导入数据库的接口
              44 0
              |
              6天前
              |
              Java 关系型数据库 MySQL
              【MySQL × SpringBoot 突发奇想】全面实现流程 · xlsx文件,Excel表格导入数据库的接口(上)
              【MySQL × SpringBoot 突发奇想】全面实现流程 · xlsx文件,Excel表格导入数据库的接口
              47 0
              |
              6天前
              |
              前端开发 关系型数据库 MySQL
              【MySQL × SpringBoot 突发奇想】全面实现流程 · 数据库导出Excel表格文件的接口
              【MySQL × SpringBoot 突发奇想】全面实现流程 · 数据库导出Excel表格文件的接口
              38 0