MySQL 事务原理:事务概述、隔离级别、MVCC-1

本文涉及的产品
云数据库 RDS MySQL,集群系列 2核4GB
推荐场景:
搭建个人博客
RDS MySQL Serverless 基础系列,0.5-2RCU 50GB
RDS MySQL Serverless 高可用系列,价值2615元额度,1个月
简介: MySQL 事务原理:事务概述、隔离级别、MVCC

一、事务


1.1 事务概述

事务:并发连接场景下,用户定义的一个操作序列。这些操作要么都做,要么都不做,是一个不可分割的工作单位。


MySQL的事务就是将多条SQL语句作为整体进行执行。


1)事务的目的:事务将数据库从一种一致性状态转换为另一种一致性状态;保证系统始终处于一个完整且正确的状态。


2)事务的组成:事务可由一条非常简单的 SQL 语句组成,也可以由一组复杂的SQL 语句组成。


3)事务的特征:在数据库提交事务时,可以确保要么所有修改都已经保存,要么所有修改都不保存。事务是访问并更新数据库各种数据项的一个程序执行单元。在 MySQL innodb 下,单条语句都具备事务。


1.2 事务控制语句

-- 显示开启事务
START TRANSACTION | BEGIN
-- 提交事务,并使得已对数据库做的所有修改持久化
COMMIT
-- 回滚事务,结束用户的事务,并撤销正在进行的所有未提交的修改
ROLLBACK
-- 创建一个保存点,一个事务可以有多个保存点
SAVEPOINT identifier
-- 删除一个保存点
RELEASE SAVEPOINT identifier
-- 事务回滚到保存点
ROLLBACK TO [SAVEPOINT] identifier

1.3 ACID特性

1)原子性(A)

事务是访问并更新数据库各种数据项的一个程序执行单元,是不可分割的工作单位。因此事务操作要么全部执行,要么全部不执行,不存在中间状态。若事务执行过程发生错误,通过 undolog 来回滚到事务初始状态。undolog 记录的是事务每步具体操作,当回滚时,回放事务具体操作的逆运算。


undo log 存放在共享表空间内,用于存储旧版本的数据。主要有两个作用:

事务回滚:记录事务 DML 操作步骤,通过逆运算(逻辑取反)实现事务回滚。


MVCC:记录事务 DML 操作提交后产生的行数据版本信息。


2)一致性(C)

事务的前后,所有的数据都保持一个一致的状态,不能违反数据的一致性检测(完整性约束检查);


一致性指事务将数据库从一种一致性状态转变为下一种一致性的状态,在事务执行前后,数据库完整性约束没有被破坏。一个事务单元需要提交之后才会被其他事务可见。一致性由原子性、隔离性以及持久性共同来维护的。


一致性的种类:

数据一致性(数据库完整性约束 – 五大约束),必须遵守。

预期一致性(逻辑一致性),可以适当破坏。例:查询是否存在,不存在写入,可能出现数据查询不存在,插入时却存在,此时会报错。

3)隔离性(I)

事务的隔离性要求每个读写事务的对象对其他事务的操作对象能相互分离,并发事务之间不会相互影响,防止多个并发事务交叉执行导致数据不一致。


不同程度的隔离级别应对不同的现象,如脏读、不可重复读、幻读。可以通过适度破环一致性,得以提高性能。


通过 MVCC和 锁来实现:

MVCC :多版本并发控制,主要解决数据库中多个事务并发执行时可能出现的读写冲突和数据不一致问题。通过记录和获取行版本,而不是使用锁来限制读操作,从而实现高效并发读性能。


锁:用来处理并发 DML 操作;数据库中提供粒度锁的策略,针对表(聚集索引 B+ 树)、页(聚集索引 B+ 树叶子节点)、行(叶子节点当中某一段记录行)三种粒度加锁;


4)持久性(D)

事务一旦完成,要将数据所做的变更记录下来,包括数据存储和多副本的网络备份。


事务提交后,事务 DML 操作将会持久化(写入 redolog 磁盘文件 哪一个页 页偏移值 具体数据);即使发生宕机等故障,数据库也能将数据恢复。


redolog 记录的是物理日志。事务提交后,记录事务 DML 操作对应物理页修改的内容,写入 redo log 磁盘文件。发生宕机等故障时,恢复数据库数据。


二、隔离级别


ISO 和 ANIS SQL 标准制定了四种事务隔离级别,目的在于提升数据库并发性能。MySQL innodb默认支持的隔离级别是REPEATABLE READ。


2.1 隔离级别的分类

读未提交(Read Uncommitted)、读已提交(Read Committed)、可重复读(Repeatable Read)、串行化(Serializable)。


2.1.1 读未提交(RU)

最低级别的隔离级别,事务可以读取到其他事务未提交的数据。即事务还未提交,其变更就能被其他事务看到


问题:可能导致脏读、不可重复读和幻读问题。


加锁情况:该级别下读不加锁,写自动加排他锁,写锁在事务提交或回滚后释放锁。


2.1.2 读已提交(RC)

事务只能读取到其他事务已提交的数据。即事务提交后,其变更才能被其他事务看到


问题:避免了脏读问题。但仍然可能出现不可重复读和幻读问题。


加锁情况:该级别后支持 MVCC (多版本并发控制),也就是提供一致性非锁定读(提供了不加锁的读取操作);此时读取操作读取历史快照数据;该隔离级别下读取历史版本的最新数据,所以读取的是已提交的数据。写自动加排他锁


2.1.3 可重复读(RR)

事务开始后,保证在整个事务过程中读取的数据是一致的。即事务执行过程中看到的数据,一直跟与该事务启动时看到的数据是一致的。


问题:避免了脏读和不可重复读问题,但仍然可能出现幻读问题。


加锁情况:该级别下也支持 MVCC,此时读取操作读取事务开始时的版本数据。写自动加排他锁


2.1.4 串行化

最高级别的隔离级别,事务串行执行,确保了最高程度的隔离性。即,在多个事务对这条记录进行读写操作时,如果发生了读写冲突的时候,后访问的事务必须等前一个事务执行完成,才能继续执行


问题:避免了脏读、不可重复读和幻读问题,但可能导致较高的并发性能开销。


加锁情况:该级别下给读加了共享锁,写自动加排他锁。


2.2 命令

-- 设置隔离级别
SET [GLOBAL | SESSION] TRANSACTION ISOLATION LEVEL REPEATABLE READ;
-- 或者采用下面的方式设置隔离级别
SET @@tx_isolation = 'REPEATABLE READ';
SET @@global.tx_isolation = 'REPEATABLE READ';
-- 查看全局隔离级别
SELECT @@global.tx_isolation;
-- 查看当前会话隔离级别
SELECT @@session.tx_isolation;
SELECT @@tx_isolation;
-- 手动给读加 S 锁
SELECT ... LOCK IN SHARE MODE;
-- 手动给读加 X 锁
SELECT ... FOR UPDATE;
-- 查看当前锁信息
SELECT * FROM information_schema.innodb_locks;

2.3 并发读异常

准备工作


DROP TABLE IF EXISTS `account_t`;
CREATE TABLE `account_t` (
  `id` INT(11) NOT NULL,
  `name` VARCHAR(255) DEFAULT NULL,
  `money` INT(11) DEFAULT 0,
  PRIMARY KEY (`id`),
  KEY `idx_name` (`name`)
)ENGINE = INNODB AUTO_INCREMENT=0 DEFAULT CHARSET = utf8;
INSERT INTO `account_t` VALUES (7,'M',1000), (1, 'C', 1000),(2, 'B', 1000),(3, 'A', 1000);

2.3.1 脏读

一个事务读到了另一个事务未提交的修改(读到脏数据)。


不可重复读在 RU 隔离级别存在。在读写分离的场景下,可以将 slave 节点设置为 READ UNCOMMITTED。此时脏读不影响,在 slave 上查询并不需要特别精准的返回值。


例如:session B 读到了 session A 中事务未提交的脏数据。


seq session A session B
1 SET TRANSACTION ISOLATION LEVEL READ UNCOMMITTED; SET TRANSACTION ISOLATION LEVEL READ UNCOMMITTED;
2 BEGIN; BEGIN;
3 UPDATE account_t SET money = money - 100 WHERE name = ‘A’;
4 UPDATE account_t SET money = money - 100 WHERE name = ‘A’;
5 COMMIT; COMMIT;

af2380d1a4fc4c323194f69e36f67aff_65f78e0ff63b4a04bcf23ad4b4471c1d.png


2.3.2 不可重复读

事务(A) 可以读到另外一个事务(B)中提交的数据;通常发生在一个事务中两次读到的数据是不一样的情况;不可重复读在隔离级别 READ COMMITTED 存在。一般而言,不可重复读的问题是可以接受的,因为读到已经提交的数据,一般不会带来很大的问题.


例如:session B 读到了 session A 中事务提交的修改,造成两次读取同一个数据不一样。


seq session A session B
1 SET TRANSACTION ISOLATION LEVEL READ COMMITTED; SET TRANSACTION ISOLATION LEVEL READ COMMITTED;
2 BEGIN; BEGIN;
3 UPDATE account_t SET money = money - 100 WHERE name = ‘A’;
4 SELECT money FROM account_t WHERE name = ‘A’;
5 COMMIT; SELECT money FROM account_t WHERE name = ‘A’;
6 COMMI;

61fffc87e5d4fd32c36d1943fd68d3ee_8a8c2a55d0ce41268717beb57300c989.png


2.3.3 幻读

两次读取同一个范围内的记录得到的结果集不一样。


例如:以name 为唯一键的表,一个事务中查询 select * from table where name = 'tom'; 不存在,接下来 insert into table (name) values ('tom'); 出现错误,此时另外一个事务也执行了 insert 操作;


幻读在隔离级别 REPEATABLE READ 及以下存在;但是可以在 REPEATABLE READ 级别下通过读加锁(使用 next-key locking)解决;


例如:由于 session A 的事务提交了插入操作,导致 session B 两次查询范围的结果不一样。


seq session A session B
1 SET TRANSACTION ISOLATION LEVEL READ COMMITTED; SET TRANSACTION ISOLATION LEVEL READ COMMITTED;
2 BEGIN; BEGIN;
3 INSERT INTO account_t(id,name,money) VALUES (4,‘D’,1000);
4 SELECT * FROM account_t WHERE id >= 2;
5 COMMIT;
6 SELECT * FROM account_t WHERE id >= 2;
7 INSERT INTO account_t(id,name,money) VALUES (4,‘D’,1000);
8 SELECT * FROM account_t WHERE id >= 2 LOCK IN SHARE MODE;
9 COMMI;

099a9e503685c42b26f68f470fa5df13_e282f2844cbc4ccdb6885ab01a2df45d.png

解决:通过读加锁(next-key locking)


seq session A session B
1 SET TRANSACTION ISOLATION LEVEL READ COMMITTED; SET TRANSACTION ISOLATION LEVEL READ COMMITTED;
2 BEGIN; BEGIN;
3 SELECT * FROM account_t WHERE id >= 2 LOCK IN SHARE MODE;
4 INSERT INTO account_t(id,name,money) VALUES (4,‘D’,1000);
5 INSERT INTO account_t(id,name,money) VALUES (4,‘E’,1000);
6 COMMI;
7 COMMI;


11ad921503af08a0b739df3614216f9d_39623d26ab6a463488a6bf1eceaad8fe.png

相关实践学习
如何在云端创建MySQL数据库
开始实验后,系统会自动创建一台自建MySQL的 源数据库 ECS 实例和一台 目标数据库 RDS。
全面了解阿里云能为你做什么
阿里云在全球各地部署高效节能的绿色数据中心,利用清洁计算为万物互联的新世界提供源源不断的能源动力,目前开服的区域包括中国(华北、华东、华南、香港)、新加坡、美国(美东、美西)、欧洲、中东、澳大利亚、日本。目前阿里云的产品涵盖弹性计算、数据库、存储与CDN、分析与搜索、云通信、网络、管理与监控、应用服务、互联网中间件、移动服务、视频服务等。通过本课程,来了解阿里云能够为你的业务带来哪些帮助     相关的阿里云产品:云服务器ECS 云服务器 ECS(Elastic Compute Service)是一种弹性可伸缩的计算服务,助您降低 IT 成本,提升运维效率,使您更专注于核心业务创新。产品详情: https://www.aliyun.com/product/ecs
目录
相关文章
|
2月前
|
SQL 关系型数据库 MySQL
mysql主从复制概述和配置
【10月更文挑战第22天】MySQL 主从复制是一种将主服务器的数据复制到一个或多个从服务器的技术,实现读写分离,提高系统性能和可用性。主服务器记录变更日志,从服务器通过 I/O 和 SQL 线程读取并应用这些变更。适用于读写分离、数据备份和恢复、数据分析等场景。配置步骤包括修改配置文件、创建复制用户、配置从服务器连接主服务器并启动复制进程。
|
2月前
|
存储 SQL 关系型数据库
MySQL的事务隔离级别
【10月更文挑战第17天】MySQL的事务隔离级别
103 43
|
2月前
|
存储 关系型数据库 MySQL
MySQL主从复制原理和使用
本文介绍了MySQL主从复制的基本概念、原理及其实现方法,详细讲解了一主两从的架构设计,以及三种常见的复制模式(全同步、异步、半同步)的特点与适用场景。此外,文章还提供了Spring Boot环境下配置主从复制的具体代码示例,包括数据源配置、上下文切换、路由实现及切面编程等内容,帮助读者理解如何在实际项目中实现数据库的读写分离。
MySQL主从复制原理和使用
|
2月前
|
缓存 算法 关系型数据库
Mysql(3)—数据库相关概念及工作原理
数据库是一个以某种有组织的方式存储的数据集合。它通常包括一个或多个不同的主题领域或用途的数据表。
65 5
Mysql(3)—数据库相关概念及工作原理
|
2月前
|
存储 缓存 关系型数据库
MySQL事务日志-Redo Log工作原理分析
事务的隔离性和原子性分别通过锁和事务日志实现,而持久性则依赖于事务日志中的`Redo Log`。在MySQL中,`Redo Log`确保已提交事务的数据能持久保存,即使系统崩溃也能通过重做日志恢复数据。其工作原理是记录数据在内存中的更改,待事务提交时写入磁盘。此外,`Redo Log`采用简单的物理日志格式和高效的顺序IO,确保快速提交。通过不同的落盘策略,可在性能和安全性之间做出权衡。
1650 14
|
2月前
|
存储 关系型数据库 MySQL
mysql 引擎概述
MySQL存储引擎是处理不同类型表操作的组件,InnoDB是最常用的默认引擎,支持事务、行级锁定和外键。MySQL采用插件式存储引擎架构,支持多种引擎,如MyISAM、Memory、CSV等,每种引擎适用于不同的应用场景。通过`SHOW ENGINES`命令可查看当前MySQL实例支持的存储引擎及其状态。选择合适的存储引擎需根据具体业务需求和引擎特性来决定。
|
2月前
|
SQL 关系型数据库 MySQL
Mysql中搭建主从复制原理和配置
主从复制在数据库管理中广泛应用,主要优点包括提高性能、实现高可用性、数据备份及灾难恢复。通过读写分离、从服务器接管、实时备份和地理分布等机制,有效增强系统的稳定性和数据安全性。主从复制涉及I/O线程和SQL线程,前者负责日志传输,后者负责日志应用,确保数据同步。配置过程中需开启二进制日志、设置唯一服务器ID,并创建复制用户,通过CHANGE MASTER TO命令配置从服务器连接主服务器,实现数据同步。实验部分展示了如何在两台CentOS 7服务器上配置MySQL 5.7主从复制,包括关闭防火墙、配置静态IP、设置域名解析、配置主从服务器、启动复制及验证同步效果。
Mysql中搭建主从复制原理和配置
|
2月前
|
SQL 关系型数据库 MySQL
阿里面试:MYSQL 事务ACID,底层原理是什么? 具体是如何实现的?
尼恩,一位40岁的资深架构师,通过其丰富的经验和深厚的技術功底,为众多读者提供了宝贵的面试指导和技术分享。在他的读者交流群中,许多小伙伴获得了来自一线互联网企业的面试机会,并成功应对了诸如事务ACID特性实现、MVCC等相关面试题。尼恩特别整理了这些常见面试题的系统化解答,形成了《MVCC 学习圣经:一次穿透MYSQL MVCC》PDF文档,旨在帮助大家在面试中展示出扎实的技术功底,提高面试成功率。此外,他还编写了《尼恩Java面试宝典》等资料,涵盖了大量面试题和答案,帮助读者全面提升技术面试的表现。这些资料不仅内容详实,而且持续更新,是求职者备战技术面试的宝贵资源。
阿里面试:MYSQL 事务ACID,底层原理是什么? 具体是如何实现的?
|
2月前
|
存储 关系型数据库 MySQL
RR隔离级别在MySQL中的实现与幻读问题探讨
【10月更文挑战第3天】在数据库管理系统中,事务隔离级别是确保数据一致性和并发性能的关键要素。MySQL作为广泛使用的关系型数据库管理系统,支持多种事务隔离级别,其中可重复读(Repeatable Read,简称RR)是其默认隔离级别。本文将深入探讨RR隔离级别在MySQL中的实现原理,以及RR隔离级别下幻读问题的产生与解决方案。
85 2
|
2月前
|
存储 SQL 关系型数据库
mysql中主键索引和联合索引的原理与区别
本文详细介绍了MySQL中的主键索引和联合索引原理及其区别。主键索引按主键值排序,叶节点仅存储数据区,而索引页则存储索引和指向数据域的指针。联合索引由多个字段组成,遵循最左前缀原则,可提高查询效率。文章还探讨了索引扫描原理、索引失效情况及设计原则,并对比了InnoDB与MyISAM存储引擎中聚簇索引和非聚簇索引的特点。对于优化MySQL性能具有参考价值。