从 MySQL 的事务 到 锁机制 再到 MVCC

本文涉及的产品
RDS MySQL Serverless 基础系列,0.5-2RCU 50GB
云数据库 RDS MySQL,集群系列 2核4GB
推荐场景:
搭建个人博客
云数据库 RDS MySQL,高可用系列 2核4GB
简介: 转眼又一年~~2023马上就要到尾声了,在最后的几天中,我想给大家分享一下 MySQL 的一些小知识。在MySQL InnoDB引擎层面,又有新的解决方案 (解决加锁后读写性能问题),叫做MVCC(Multi-Version Concurrency Control)多版本并发控制。在MVCC下,就可以做到读写不阻塞且避免了类似脏读这样的问题。那MVCC是怎么做的呢?MVCC通过生成数据快照 (Snapshot)并用这个快照来提供一定级别 (语句级或事务级)的一致性读取。

 其他系列文章导航

Java基础合集

数据结构与算法合集

设计模式合集

多线程合集

分布式合集

ES合集


文章目录

其他系列文章导航

文章目录

前言

一、事务

1.1 含义

1.2 ACID

二、锁机制

2.1 锁分类

2.2 隔离级别

三、MVCC

3.1 介绍

3.2 隔离级别

3.3 原理

四、总结


前言

转眼又一年~~2023马上就要到尾声了,在最后的几天中,我想给大家分享一下 MySQL 的一些小知识。


一、事务

1.1 含义

通俗理解:在我的理解下,事务可以使 一组操作,要么全部成功,要么全部失败。事务其目的是为了下保证数据最终的一致性。

举个例子:举个例子,我给你发支付宝转了666块红包。那自然我的支付宝余额会扣减666块,你的支付宝余额会增加666块。

image.gif编辑

1.2 ACID

    • 原子性 (Atomicity)
    • 一致性 (Consistency)
    • 隔离性 (lsolation)
    • 持久性 (Durability)

    原子性指的是:当前事务的操作要么同时成功,要么同时失败。原子性由undo log日志来保证,因为undo log记载着数据修改前的信息。

    比如我们要 insert 一条数据了,那undo log 会记录的一条对应的 delete 日志。我们要 update 一条记录时,那undo log会记录之前的 旧值 的update记录。

    如果执行事务过程中出现异常的情况那执行 [回滚]。InnoDB引擎就是利用undo log记录下的数据,来将数据 恢复 到事务开始之前。

    隔离性指的是:在事务并发执行时,他们内部的操作不能互相干扰。

    如果多个事务可以在同一时刻操作同一份数据,那么就会可能会产生脏读、重复读、幻读的问题。

    于是,事务与事务之间需要存在 一定 的隔离。在InnoDB引擎中,定义了四种隔离级别供我们使用:

      • read uncommit(读未提交)
      • read commit (读已提交)
      • repeatable read(可重复复读)
      • serializable (串行)

      不同的隔离级别对事务之间的隔离性是不一样的 (级别越高事务隔离性越好,但性能就越低) ,而隔离性是由MySQL的各种锁来实现的,只是它屏蔽了加锁的细节。

      持久性指的就是:一旦提交了事务,它对数据库的改变就应该是永久性的。说白了就是,会将数据持久化在硬盘上。

      而持久性由 redo log 日志来保证,当我们要修改数据时,MySQL是先把这条记录所在的页找到,然后把该页加载到内存中,将对应记录进行修改。

      为了防止内存修改完了,MySQL就挂掉了(如果内存改完,直接挂掉,那这次的修改相当于就丢失了)。

      MySQL引入了 redo log,内存写完了然后会写一份 redo log,这份 redo log 记载着这次在某个页上做了什么修改。

      即便 MySQL 在中途挂了,我们还可以根据 redo log来对数据进行恢复。

      redo log 是顺序写的,写入速度很快。并且它记录的是物理修改 (xxxx页做了xxx修改),文件的体积很小,恢复速度也很快。

      一致性指的就是:我们使用事务的目的 ,而[隔离性][原子性][持久性]均是为了保障 [一致性] 的手段,保证一致性需要由应用程序代码来保证。

      比如,如果事务在发生的过程中,出现了异常情况,此时你就得回滚事务,而不是强行提交事务来导致数据不一致。


      二、锁机制

      2.1 锁分类

      在InnoDB引擎下,按锁的粒度分类,可以简单分为:

        • 行锁
        • 表锁

        行锁实际上是作用在索引之上的。

        当我们的 SQL 命中了索引,那锁住的就是命中条件内的索引节点(这种就是行锁),如果没有命中索引,那我们锁的就是整个索引树 (表锁)。

        简单来说就是:锁住的是整棵树还是某几个节点,完全取决于 SQL 条件是否有命中到对应的索引节点。

        而行锁又可以简单分为:

          • 读锁 (共享锁、S锁)
          • 写锁 (排它锁、X锁)

          读写锁区别:

            • 读锁是共享的,多个事务可以同时读取同一个资源,但不允许其他事务修改。
            • 写锁是排他的,写锁会阻塞其他的写锁和读锁。

            image.gif编辑

            2.2 隔离级别

            再回到隔离级别上吧,以例子来说明。

            首先来说下read uncommit(读未提交)比如说: A向B转账,A执行了转账语句,但A还没有提交事务,B读取数据发现自己账户钱变多了! B跟A说,我已经收到钱了。A回滚事务[rollback]等B再查看账户的钱时,发现钱并没有多。

            简单的定义就是:事务B读取到了事务A还没提交的数据,这种用专业术语来说叫做[脏读]。

            对于锁的维度而言,其实就是在read uncommit隔离级别下,读不会加任何锁,而写会加排他锁。读什么锁都不加,这就让排他锁无法排它了。

            而我们又知道,对于更新操作而言,InnoDB是肯定会加写锁的 (数据库是不可能允许在同一时间,更新同一条记录的)。而读操作,如果不加任何锁,那就会造成上面的脏读。

            脏读在生产环境下肯定是无法接受的,,那如果读加锁的话,那意味着:当更新数据的时,就没办法读取了,这会极大地降低数据库性能。


            三、MVCC

            3.1 介绍

            在MySQL InnoDB引擎层面,又有新的解决方案 (解决加锁后读写性能问题),叫做MVCC(Multi-Version Concurrency Control)多版本并发控制。

            在MVCC下,就可以做到读写不阻塞且避免了类似脏读这样的问题。那MVCC是怎么做的呢?

            MVCC通过生成数据快照 (Snapshot)并用这个快照来提供一定级别 (语句级或事务级)的一致性读取。

            3.2 隔离级别

            回到事务隔离级别下,针对于 read commit (读已提交) 隔离级别,它生成的就是语句级快照,而针对于repeatable read(可重复读),它生成的就是事务级的快照。

            前面提到过read uncommit隔离级别下会产生脏读,而read commit (读已提交)隔离级别解决了脏读。

            思想其实很简单:在读取的时候生成一个"版本号",等到其他事务commit了之后,才会读取最新已commit的"版本号"数据。

            比如说: 事务A读取了记录(生成版本号),事务B修改了记录(此时加了写锁)事务A再读取的时候,是依据最新的版本号来读取的(当事务B执行commit了之后,会生成一个新的版本号),如果事务B还没有commit,那事务A读取的还是之前版本号的数据。

            通过[版本]的概念,这样就解决了脏读的问题,而通过 版本,又可以对应快照的数据。

            read commit (读已提交) 解决了脏读,但也会有其他并发的问题。 [不可重复读]:一个事务读取到另外一个事务已经提交的数据,也就是说一个事务可以看到其他事务所做的修改。

            不可重复读的例子: A查询数据库得到数据,B去修改数据库的数据,导致A多次查询数据库的结果都不一样[危害: A每次查询的结果都是受B的影响的]。

            了解MVCC基础之后,就很容易想到repeatable read (可重复复读)隔离级别是怎么避免不可重复读的问题了 (前面也提到了)。

            repeatable read (可重复复读)隔离级别是 事务级别]的快照!每次读取的都是厂当前事务的版本],即使当前数据被其他事务修改了(commit),也只会读取当前事务版本的数据。

            在InnoDB引擎下的的repeatable read(可重复复读)隔离级别下,在MVCC下快照读,已经解决了幻读的问题 (因为它是读历史版本的数据)。

            而如果是当前读 (比如 select * from table for update),则需要配合间隙锁来解决幻读的问题。

            剩下的就是serializable (串行)隔离级别了,它的最高的隔离级别,相当于不允许事务的并发,事务与事务之间执行是串行的,它的效率最低,但同时也是最安全的。

            3.3 原理

            MVCC的主要是通过read view和undo log来实现的。

            undo log前面也提到了,它会记录修改数据之前的信息,事务中的原子性就是通过undo log来实现的。所以,有undo log可以帮我们找到 版本]的数据。

            而read view 实际上就是在查询时,InnoDB会生成一个read view,read view 有几个重要的字段,看下去就懂了。

              • trx ids (尚未提交commit的事务版本号集合)
              • low limit id (下一次要生成的事务ID值)
              • low limit id (尚未提交版本号的事务ID最小值)
              • creator_trx_id (当前的事务版本号)

              在每行数据有两列隐藏的字段,分别是DB TRX ID (记录着当前ID) 以及DB ROLL PTR (指向上一个版本数据在undolog 里的位置指针)。

              铺垫到这了,很容易就发现,MVCC其实就是靠[比对版本,来实现读写不阻塞,而版本的数据存在于undo log中。

              而针对于不同的隔离级别 (read commit和repeatable read) ,无非就是read commit隔离级别下,每次都获取一个新的1ead view,repeatable read隔离级别则每次事务只获取一个read view


              四、总结

              事务、锁机制和 MVCC 是数据库管理系统中的三个核心概念,它们协同工作以确保数据的完整性和并发性。

              在 MySQL 中,事务提供了一种方法来管理数据库操作的逻辑边界,锁机制用于控制对数据的并发访问,而 MVCC 则通过允许多个事务同时读取数据来提高并发性能。

              了解和正确使用这些概念对于数据库管理员和开发人员来说至关重要,以确保数据库应用的性能和可靠性。


              相关实践学习
              如何快速连接云数据库RDS MySQL
              本场景介绍如何通过阿里云数据管理服务DMS快速连接云数据库RDS MySQL,然后进行数据表的CRUD操作。
              全面了解阿里云能为你做什么
              阿里云在全球各地部署高效节能的绿色数据中心,利用清洁计算为万物互联的新世界提供源源不断的能源动力,目前开服的区域包括中国(华北、华东、华南、香港)、新加坡、美国(美东、美西)、欧洲、中东、澳大利亚、日本。目前阿里云的产品涵盖弹性计算、数据库、存储与CDN、分析与搜索、云通信、网络、管理与监控、应用服务、互联网中间件、移动服务、视频服务等。通过本课程,来了解阿里云能够为你的业务带来哪些帮助     相关的阿里云产品:云服务器ECS 云服务器 ECS(Elastic Compute Service)是一种弹性可伸缩的计算服务,助您降低 IT 成本,提升运维效率,使您更专注于核心业务创新。产品详情: https://www.aliyun.com/product/ecs
              目录
              相关文章
              |
              6天前
              |
              SQL 关系型数据库 MySQL
              MySQL事务日志-Undo Log工作原理分析
              事务的持久性是交由Redo Log来保证,原子性则是交由Undo Log来保证。如果事务中的SQL执行到一半出现错误,需要把前面已经执行过的SQL撤销以达到原子性的目的,这个过程也叫做"回滚",所以Undo Log也叫回滚日志。
              MySQL事务日志-Undo Log工作原理分析
              |
              15天前
              |
              SQL 安全 关系型数据库
              【MySQL基础篇】事务(事务操作、事务四大特性、并发事务问题、事务隔离级别)
              事务是MySQL中一组不可分割的操作集合,确保所有操作要么全部成功,要么全部失败。本文利用SQL演示并总结了事务操作、事务四大特性、并发事务问题、事务隔离级别。
              【MySQL基础篇】事务(事务操作、事务四大特性、并发事务问题、事务隔离级别)
              |
              1天前
              |
              SQL 存储 关系型数据库
              MySQL进阶突击系列(05)突击MVCC核心原理 | 左右护法ReadView视图和undoLog版本链强强联合
              2024年小结:感谢阿里云开发者社区每月的分享交流活动,支持持续学习和进步。过去五个月投稿29篇,其中17篇获高分认可。本文详细介绍了MySQL InnoDB存储引擎的MVCC机制,包括数据版本链、readView视图及解决脏读、不可重复读、幻读问题的demo演示。
              |
              21天前
              |
              SQL 关系型数据库 MySQL
              MySQL进阶突击系列(04)事务隔离级别、AICD、CAP、BASE原则一直搞不懂? | 看这篇就够了
              本文详细介绍了数据库事务的四大特性(AICD原则),包括原子性、隔离性、一致性和持久性,并深入探讨了事务并发问题与隔离级别。同时,文章还讲解了分布式系统中的CAP理论及其不可能三角关系,以及BASE原则在分布式系统设计中的应用。通过具体案例和图解,帮助读者理解事务处理的核心概念和最佳实践,为应对相关技术面试提供了全面的知识准备。
              |
              2月前
              |
              关系型数据库 MySQL 数据库
              MySQL事务隔离级别及默认隔离级别的设置
              在数据库系统中,事务隔离级别是一个关键的概念,它决定了事务在并发执行时如何相互隔离。MySQL提供了四种事务隔离级别,每种级别都解决了不同的并发问题。本文将详细介绍这些隔离级别以及MySQL的默认隔离级别。
              |
              17天前
              |
              存储 Oracle 关系型数据库
              数据库传奇:MySQL创世之父的两千金My、Maria
              《数据库传奇:MySQL创世之父的两千金My、Maria》介绍了MySQL的发展历程及其分支MariaDB。MySQL由Michael Widenius等人于1994年创建,现归Oracle所有,广泛应用于阿里巴巴、腾讯等企业。2009年,Widenius因担心Oracle收购影响MySQL的开源性,创建了MariaDB,提供额外功能和改进。维基百科、Google等已逐步替换为MariaDB,以确保更好的性能和社区支持。掌握MariaDB作为备用方案,对未来发展至关重要。
              42 3
              |
              17天前
              |
              安全 关系型数据库 MySQL
              MySQL崩溃保险箱:探秘Redo/Undo日志确保数据库安全无忧!
              《MySQL崩溃保险箱:探秘Redo/Undo日志确保数据库安全无忧!》介绍了MySQL中的三种关键日志:二进制日志(Binary Log)、重做日志(Redo Log)和撤销日志(Undo Log)。这些日志确保了数据库的ACID特性,即原子性、一致性、隔离性和持久性。Redo Log记录数据页的物理修改,保证事务持久性;Undo Log记录事务的逆操作,支持回滚和多版本并发控制(MVCC)。文章还详细对比了InnoDB和MyISAM存储引擎在事务支持、锁定机制、并发性等方面的差异,强调了InnoDB在高并发和事务处理中的优势。通过这些机制,MySQL能够在事务执行、崩溃和恢复过程中保持
              47 3
              |
              17天前
              |
              SQL 关系型数据库 MySQL
              数据库灾难应对:MySQL误删除数据的救赎之道,技巧get起来!之binlog
              《数据库灾难应对:MySQL误删除数据的救赎之道,技巧get起来!之binlog》介绍了如何利用MySQL的二进制日志(Binlog)恢复误删除的数据。主要内容包括: 1. **启用二进制日志**:在`my.cnf`中配置`log-bin`并重启MySQL服务。 2. **查看二进制日志文件**:使用`SHOW VARIABLES LIKE 'log_%';`和`SHOW MASTER STATUS;`命令获取当前日志文件及位置。 3. **创建数据备份**:确保在恢复前已有备份,以防意外。 4. **导出二进制日志为SQL语句**:使用`mysqlbinlog`
              60 2
              |
              30天前
              |
              关系型数据库 MySQL 数据库
              Python处理数据库:MySQL与SQLite详解 | python小知识
              本文详细介绍了如何使用Python操作MySQL和SQLite数据库,包括安装必要的库、连接数据库、执行增删改查等基本操作,适合初学者快速上手。
              205 15
              |
              24天前
              |
              SQL 关系型数据库 MySQL
              数据库数据恢复—Mysql数据库表记录丢失的数据恢复方案
              Mysql数据库故障: Mysql数据库表记录丢失。 Mysql数据库故障表现: 1、Mysql数据库表中无任何数据或只有部分数据。 2、客户端无法查询到完整的信息。
              下一篇
              开通oss服务