Mysql 事务原理

本文涉及的产品
RDS MySQL Serverless 基础系列,0.5-2RCU 50GB
云数据库 RDS MySQL,集群版 2核4GB 100GB
推荐场景:
搭建个人博客
日志服务 SLS,月写入数据量 50GB 1个月
简介: Mysql 事务原理

1、事务

事务 (transaction) :并发控制的前提下,用户定义的一个操作序列。这些操作要么都做(提交),要么都不做(回滚),不可分割。

目的:将数据库从一种一致性状态转换为另一种一致性状态,保证系统始终处于一个完整且正确的状态。

1.1、ACID 特性

  • 原子性 (Atomicity)
  • 一致性 (Consistency)
  • 隔离性 (Isolation)
  • 持久性 (Durability)

1.1.1、原子性

一个事务中的操作,要么都做,要么都不做,不存在中间状态,是一个不可分割的工作单位。若事务执行过程发生错误,回滚到事务初始状态。

实现机制: undo log

* undo log

undo log 回滚日志,存放在共享表空间内,用于存储旧版本的数据。

undo log是逻辑日志,回滚时将数据库逻辑地恢复到原来的样子,也就是说,根据 undo log 记录的事务 DML 操作,做之前的相反操作,实现回滚操作,保证了事务的原子性和一致性。

此外,undo log 也可以用来实现 MVCC。用户读取记录时,若该记录被其他事务占用,当前事务可以通过 undo log 读取之前事务 DML 操作提交后的行版本信息,以此实现非锁定读。

总结 undo log 的作用

  • 事务回滚:记录事务 DML 操作步骤,通过逆运算(逻辑取反)实现事务回滚。
  • MVCC:记录事务 DML 操作提交后产生的行版本信息。

1.1.2、一致性

事务的前后,数据满足完整性约束,数据库保持一致性状态。

一致性指的是事务将数据库从一种一致性状态转变为下一种一致性的状态,在事务执行前后,数据库完整性约束没有被破坏。一个事务需要提交后才会被其他事务可见。

一致性的种类

  • 数据一致性(完整性约束),必须遵守,例如主键特性、外键特性等
  • 预期一致性(逻辑一致性),适当破坏,提高并发速度。例:查询是否存在,不存在写入,可能出现数据查询不存在,插入时却存在,报错。

实现机制:原子性 + 隔离性 + 一致性实现。

1.1.3、* 隔离性

并发事务间相互隔离,互不影响,避免多个事务并发异步执行进而导致数据的不一致。

实现机制:为了提升性能,设定不同程度的隔离级别,适度破坏逻辑一致性。

  • :用来并发处理 DML 操作。数据库中提供粒度锁的策略,针对表(聚集索引 B+ 树)、页(聚集索引 B+ 树叶子节点)、行(叶子节点中某一段行记录)三种粒度加锁
  • MVCC :多版本并发控制。主要解决一致性非锁定读,通过记录和获取行版本信息,而不是使用锁来限制读操作,从而实现高效并发读性能。

1.1.4、持久性

事务一旦提交,其结果就是永久性的,即使系统故障也不丢失。

实现机制: redo log

redo log

redo log 重做日志,用于实现事务的持久性。

事务提交后,事务 DML 操作持久化,记录事务 DML 操作对应物理页修改的内容,写入 redo log 磁盘文件。发生宕机等故障时,恢复数据库数据。

redo log 属于 WAL (Write Ahead Log)预写日志,用于数据恢复,顺序写磁盘,再通过其他线程异步刷到 B+ 树。与 redis 的aof类似。

1.2、事务控制语句

innoDB 中一条 sql 语句是一个事务。若想多条语句构成事务,采用事务控制语句。

-- 显示开启事务
 START | BEGIN TRANSACTION
 -- 提交事务,并使得已对数据库做的所有修改持久化
 COMMIT
 -- 回滚事务,结束用户的事务,并撤销正在进行的所有未提交的修改
 ROLLBACK
 -- 创建一个保存点,一个事务可以有多个保存点
 SAVEPOINT identifier
 -- 删除一个保存点
 RELEASE SAVEPOINT identifier
 -- 事务回滚到保存点
 ROLLBACK TO [SAVEPOINT] identifier

2、隔离级别

ISO 和 ANIS SQL 标准制定了四种事务隔离级别,目的在于提升数据库并发性能。

不同隔离级别的区别在于读操作的加锁,写操作均加排他锁。隔离级别的高低,与事务请求锁的数量和保持锁时间的长短相关。级别越高,性能越低;级别越低,逻辑一致性受到的影响越大。

2.1、隔离级别的分类

2.1.1、读未提交 RU

读未提交,READ UNCOMMITTED。事务还未提交,其他事务就看到修改。

  • 读:不做处理
  • 写:自动加 X 锁

逻辑错误:脏读。

2.1.2、读已提交 RC

读已提交 (RC) ,READ COMMITTED。事务提交后,其他事务可以看到修改。大部分数据库采用的隔离级别,如 oracle, SQL Server 等。

  • 读:MVCC,读取最新版本的行数据
  • 写:自动加 X 锁

MVCC 在事务期间每次读取数据时,生成新的 read view,这也意味着同一事务多次读取同一条数据可能出现数据不一致(不可重复读)。因为在多次读取数据期间可能有其他事务修改并提交了该条记录。

逻辑错误:不可重复读。

2.1.3、可重复读 RR

可重复读 (RR) ,REPEATABLE READ。Mysql 采用的默认隔离级别

  • 读:MVCC,读取事务开始前版本的行数据
  • 写:自动加 X 锁

MVCC 在事务启动时,生成新的 read view,整个事务期间读取数据使用这个 read view,这样保证了在事务期间读到的数据都是事务启动前的记录。

逻辑错误:幻读。

2.1.4、可串行化 SC

可串行化,SERIALIZABLE

  • 读:自动加 S 锁 (next-key locking)
  • 写:自动加 X 锁

2.2、并发读异常

不同隔离级别由于逻辑一致性问题造成的并发异常。

2.2.1、脏读

一个事务读到了另一个事务未提交的修改(读到脏数据)。

脏读在 RU 隔离级别存在。在读写分离的场景下,可以将 slave 节点设置为 READ UNCOMMITTED。此时脏读不影响,在 slave 上查询并不需要特别精准的返回值。

例如:session B 读到了 session A 中事务未提交的脏数据。

seq session A session B
1 SET @@tx_isolation = 'READ UNCOMMITTED'; SET @@tx_isolation = 'READ UNCOMMITTED';
2 BEGIN; BEGIN;
4 UPDATE account_t SET money = money - 100 WHERE name = 'A';
5 SELECT money FROM account_t WHERE name = 'A';
6 COMMIT; COMMIT;

2.2.2、不可重复读

一个事务读到了另一个事务的提交的修改,同一事务内两次读取同一个数据不一样。

不可重复读在 RC 隔离级别存在。一般来说,不可重复读的问题可以接受,因为读到已经提交的数据,不会带来很大的问题。

例如:session B 读到了 session A 中事务提交的修改,造成两次读取同一个数据不一样。

seq session A session B
1 SET @@tx_isolation = 'READ COMMITTED'; SET @@tx_isolation = 'READ COMMITTED';
2 BEGIN; BEGIN;
4 SELECT money FROM account_t WHERE name = 'A';
5 UPDATE account_t SET money = money - 100 WHERE name = 'A';
6 COMMIT ; SELECT money FROM account_t WHERE name = 'A';
7 COMMIT;

2.2.3、幻读

同一事务两次读取同一个范围内的记录得到的结果集不一样。

幻读在 RR 隔离级别存在,仅在当前读下出现。

例如:由于 session A 的事务提交了插入操作,导致 session B 两次查询范围的结果不一样。

seq session A session B
1 SET @@tx_isolation = 'REPEATABLE READ'; SET @@tx_isolation = 'REPEATABLE READ';
2 BEGIN; BEGIN;
4 SELECT * FROM account_t WHERE id >= 2;
5 INSERT INTO account_t VALUES (4, 'D', 1000);
6 COMMIT ;
7 SELECT * FROM account_t WHERE id >= 2;
COMMIT;

解决:通过读加锁(next-key locking)

seq session A session B
1 SET @@tx_isolation = 'REPEATABLE READ'; SET @@tx_isolation = 'REPEATABLE READ';
2 BEGIN; BEGIN;
4 SELECT * FROM account_t WHERE id >= 2 FOR UPDATE | IN SHARE MODE;
INSERT INTO account_t VALUES (4, 'D', 1000);
6 COMMIT ;
7 SELECT * FROM account_t WHERE id >= 2;
COMMIT;

2.2.4、总结

  • 脏读:一个事务读到了另一个事务未提交的修改
  • 不可重复读:一个事务读到了另一个事务提交后的修改,UPDATE
  • 幻读:同一事务两次读取同一个范围内的记录得到的结果集不一样,INSERT DELETE

2.2.5、测试代码

DROP TABLE IF EXISTS `account_t`;
 CREATE TABLE `account_t` (
     `id` INT(11) NOT NULL,
     `name` VARCHAR(225) DEFAULT NULL,
     `money` INT(11) DEFAULT 0,
     PRIMARY KEY(`id`),
     KEY `idx_name` (`name`)
 ) ENGINE = innoDB AUTO_INCREMENT=0 DEFAULT CHARSET = utf8;
 SELECT * FROM `account_t`;
 INSERT INTO `account_t` VALUES (1, 'A', 1000), (2, 'B', 1000), (3, 'B', 1000);
 ROLLBACK;
 -- 脏读:一个事务读取了另一个未提交事务的修改
 -- 隔离级别:READ UNCOMMITTED
 SET TRANSACTION ISOLATION LEVEL READ UNCOMMITTED;
 BEGIN
 -- 脏读事务1
 UPDATE `account_t` SET `money` = `money` - 100 WHERE `name` = 'A';
 -- 脏读事务2
 SELECT `money` FROM `account_t` WHERE `name` = 'A';
 COMMIT;
 -- 不可重复读:一个事务内两次读取同一个数据不一样
 -- 隔离级别:READ COMMITTED,解决了脏读问题
 SET TRANSACTION ISOLATION LEVEL READ COMMITTED;
 BEGIN
 -- 不可重复读事务1
 UPDATE `account_t` SET `money` = `money` - 100 WHERE `name` = 'A';
 -- 不可重复读事务2
 SELECT `money` FROM `account_t` WHERE `name` = 'A';
 COMMIT;
 -- 幻读:一个事务内两次读取同一个范围内的记录得到的结果集不一样。
 -- 隔离级别:REPEATABLE READ,解决了不可重复读
 SET TRANSACTION ISOLATION LEVEL REPEATABLE READ;
 BEGIN
 -- 幻读事务1
 INSERT INTO `account_t` VALUES (4, 'D', 1000);
 -- 幻读事务2
 SELECT * FROM `account_t` WHERE `id` >= 2;
 -- 幻读事务2:解决幻读问题
 SELECT * FROM `account_t` WHERE `id` >= 2 FOR UPDATE;
 COMMIT;

3、MVCC

多版本并发控制 MVCC(Multiversion Concurrency Control),用来实现一致性的非锁定读。非锁定读是指不需要等待访问记录 X 锁的释放。因此 MVCC 没有读写阻塞,只有写写阻塞,提高了并发性。

MVCC 只在读已提交和可重复读的隔离级别下工作,与其他隔离级别不兼容。

MVCC 通过 read view,聚集索引隐藏列,undo log 来实现,关键是解决事务的可见性问题。

3.1、当前读 & 快照读

innoDB 支持的读方式

  • 当前读(锁定读):读取最新版本的记录,对读取的记录加锁(悲观锁),保证其他并发事务不能修改当前记录
  • select ... lock in share mode | for update
  • insert, delete, update,不管什么隔离级别,DML 操作均加锁。
  • undo log
  • 快照读(非锁定读):读取记录的一个快照,对读取的记录不加锁。普通 SELECT 语句

MVCC 的读指的是快照读(非锁定读),因为没有事务需要对历史数据进行 DML 操作。

在读已提交和可重复读的隔离级别下,对于快照数据的定义不同

  • RC 级别:读取当前事务锁定行的最新行记录。
  • RR 级别:读取启动事务时的行记录版本。

3.2、read view

read view 是事务进行快照读的时候产生的读视图,保存了当前事务开启时所有活跃事务的列表。

3.2.1、read view 生成

在读已提交和可重复读的隔离级别下,read view 的区别仅在于创建 read view 的时机不同:

  • RC 级别:每次读取数据时,生成新的 read view。
  • RR 级别:启动事务时,生成新的 read view,一直使用到事务提交。

3.2.2、read view 属性

  • m_ids:创建 read view 时,活跃事务的事务 id 列表。活跃事务指的是已启动但是未提交的事务。
  • min_trx_id:创建 read view 时,活跃事务的最小事务 id
  • max_trx_id:创建 read view 时,预分配给下一个未开启事务的 id,即全局事务的最大事务 id + 1
  • creator_trx_id:创建该 read view 的事务的事务 id

创建 read view 时,read view 属性与事务状态(已提交 - 启动未提交 - 未启动)的关系

事务状态


3.3、聚集索引隐藏列

聚集索引记录的隐藏列

  • trx_id:事务修改记录时,trx_id 记录生成该版本的事务 id。
  • roll_pointer:事务修改记录时,将旧记录写入 undo log,roll_pointer 指向旧版本记录,通过它可以找到修改前的记录。

聚集索引隐藏列

3.4、undo log

用户读取记录时,若该记录被其他事务占用,当前事务可以通过 undo 读取之前事务 DML 操作提交后的行版本信息,以此实现非锁定读。

innoDB 通过 undo log 保存每个记录的多个版本,每个事务读到的记录版本可能是不一样的。在同一个事务中,用户只能看到该事务创建快照之前已经提交的修改和该事务本身做的修改。

3.4、事务的可见性

事务的可见性问题:当前事务访问某条记录时该记录是否可见

判断规则是:判断生成该版本的事务 id (trx_id)与生成 read view 的当前事务 id 的关系。具体来说,生成 read view 的当前事务处于启动未提交状态,重点判断生成该版本事务的所处状态。

  • trx_id = creator_trx_id:当前事务访问自己修改的记录,该版本记录对当前事务可见。
  • trx_id < min_trx_id:生成该版本的事务在当前事务生成 read view 前已提交,该版本记录对当前事务可见。
  • trx_id > max_trx_id:生成该版本的事务在当前事务生成 read view 后启动,该版本记录对当前事务不可见。
  • min_trx <= trx_id <= max_trx_id,判断生成该版本的事务 id 是否在启动未提交的事务 id 列表中
  • 存在:生成该版本记录的事务已启动但未提交,该版本记录对当前事务不可见
  • 不在:生成该版本记录的事务已提交,该版本记录对当前事务可见

整理一下,方便记忆:

  • trx_id = creator_trx_id,版本事务 = 当前事务
  • trx_id < min_trx_id:版本事务已提交,可见。
  • trx_id > max_trx_id: 版本事务后启动,不可见。
  • min_trx <= trx_id <= max_trx_id,版本事务 id 是否在启动未提交的事务 id 列表中
  • 存在:版本事务启动未提交,不可见
  • 不在:版本事务已提交,可见
相关实践学习
如何在云端创建MySQL数据库
开始实验后,系统会自动创建一台自建MySQL的 源数据库 ECS 实例和一台 目标数据库 RDS。
全面了解阿里云能为你做什么
阿里云在全球各地部署高效节能的绿色数据中心,利用清洁计算为万物互联的新世界提供源源不断的能源动力,目前开服的区域包括中国(华北、华东、华南、香港)、新加坡、美国(美东、美西)、欧洲、中东、澳大利亚、日本。目前阿里云的产品涵盖弹性计算、数据库、存储与CDN、分析与搜索、云通信、网络、管理与监控、应用服务、互联网中间件、移动服务、视频服务等。通过本课程,来了解阿里云能够为你的业务带来哪些帮助 &nbsp; &nbsp; 相关的阿里云产品:云服务器ECS 云服务器 ECS(Elastic Compute Service)是一种弹性可伸缩的计算服务,助您降低 IT 成本,提升运维效率,使您更专注于核心业务创新。产品详情: https://www.aliyun.com/product/ecs
相关文章
|
8天前
|
SQL 关系型数据库 MySQL
MySQL 事务回滚。在执行删除、更新等操作时,防止误操作
MySQL 事务回滚。在执行删除、更新等操作时,防止误操作
21 2
|
3天前
|
存储 SQL 关系型数据库
深入MySQL锁机制:原理、死锁解决及Java防范技巧
深入MySQL锁机制:原理、死锁解决及Java防范技巧
|
3天前
|
存储 SQL 关系型数据库
深入解析MySQL事务机制和锁机制
深入解析MySQL事务机制和锁机制
|
5天前
|
算法 关系型数据库 MySQL
一天五道Java面试题----第七天(mysql索引结构,各自的优劣--------->事务的基本特性和隔离级别)
这篇文章是关于MySQL的面试题总结,包括索引结构的优劣、索引设计原则、MySQL锁的类型、执行计划的解读以及事务的基本特性和隔离级别。
|
18天前
|
SQL canal 关系型数据库
(二十四)全解MySQL之主从篇:死磕主从复制中数据同步原理与优化
兜兜转转,经过《全解MySQL专栏》前面二十多篇的内容讲解后,基本对MySQL单机模式下的各方面进阶知识做了详细阐述,同时在前面的《分库分表概念篇》、《分库分表隐患篇》两章中也首次提到了数据库的一些高可用方案,但前两章大多属于方法论,并未涵盖真正的实操过程。接下来的内容,会以目前这章作为分割点,开启MySQL高可用方案的落地实践分享的新章程!
113 1
|
19天前
|
SQL 关系型数据库 MySQL
(七)MySQL事务篇:ACID原则、事务隔离级别及事务机制原理剖析
众所周知,MySQL数据库的核心功能就是存储数据,通常是整个业务系统中最重要的一层,可谓是整个系统的“大本营”,因此只要MySQL存在些许隐患问题,对于整个系统而言都是致命的。
|
19天前
|
SQL 算法 关系型数据库
(十)全解MySQL之死锁问题分析、事务隔离与锁机制的底层原理剖析
经过《MySQL锁机制》、《MySQL-MVCC机制》两篇后,咱们已经大致了解MySQL中处理并发事务的手段,不过对于锁机制、MVCC机制都并未与之前说到的《MySQL事务机制》产生关联关系,同时对于MySQL锁机制的实现原理也未曾剖析,因此本篇作为事务、锁、MVCC这三者的汇总篇,会在本章中补全之前空缺的一些细节,同时也会将锁、MVCC机制与事务机制之间的关系彻底理清楚。
|
1天前
|
canal 关系型数据库 MySQL
"揭秘阿里数据同步黑科技Canal:从原理到实战,手把手教你玩转MySQL数据秒级同步,让你的数据处理能力瞬间飙升,成为技术界的新晋网红!"
【8月更文挑战第18天】Canal是一款由阿里巴巴开源的高性能数据同步系统,它通过解析MySQL的增量日志(Binlog),提供低延迟、可靠的数据订阅和消费功能。Canal模拟MySQL Slave与Master间的交互协议来接收并解析Binary Log,支持数据的增量同步。配置简单直观,包括Server和Instance两层配置。在实战中,Canal可用于数据库镜像、实时备份等多种场景,通过集成Canal Client可实现数据的消费和处理,如更新缓存或写入消息队列。
8 0
|
4天前
|
算法 关系型数据库 MySQL
一天五道Java面试题----第七天(mysql索引结构,各自的优劣--------->事务的基本特性和隔离级别)
这篇文章是关于MySQL的面试题总结,包括索引结构的优劣、索引设计原则、MySQL锁的类型、执行计划的解读以及事务的基本特性和隔离级别。
|
6天前
|
SQL 安全 关系型数据库
Go 语言中的 MySQL 事务操作
在现代应用中,确保数据完整与一致至关重要。MySQL的事务机制提供了可靠保障。本文首先解释了事务的概念及其ACID特性,随后介绍了如何在Go语言中使用`database/sql`包进行MySQL事务操作。通过一个银行转账的例子,演示了如何通过Go开启事务、执行操作并在必要时回滚或提交,确保数据一致性。最后,还讨论了不同事务隔离级别的含义及如何在Go中设置这些级别。通过本文的学习,开发者能更好地掌握MySQL事务的应用。
11 0