什么是事务隔离
事务简单的来说是保证一组数据库操作,要么全部成功,要么全部失败。
MySQL 中事务支持是在引擎实现的, MySQL 原生的 MyISAM 引擎不支持事务,这也是 MyISAM 被 InnoDB 引擎取代的重要原因。
隔离性与隔离级别
提到事务, 数据库为了保证事务,必须具备四个特性:ACID,原子性(Atomicity)、一致性(Consistency)、隔离性(Isolation)、持久性(Durability)
事务的四个特性
- 原子性 (Atomicity)
事务操作,要么全部做完,要么全部不做,不可能停止在中间环节。
- 一致性 (Consistency)
事务将数据库从一种状态变成另外一种状态。事务开始前和结束后,数据的完整性约束没有破坏。
- 隔离性(Isolation)
要求每个事物的对象对其他事务的操作对象相互隔离,即该事务提交前对其他事务不可见。多个事务并发访问时,事务之间是隔离的,一个事务不应该影响其他事务运行的效果。
- 持久性 (Durability)
事务一旦提交,其结果是永久的,即使发生宕机故障,数据也能够恢复,事务对数据库所有更新将被保存到数据库,不能回滚。
事务的隔离级别
- READ UNCOMMITTED (读未提交)
一个事务读取了两位一个事务未提交的数据,叫做脏读。
例子
- 准备两个终端,在此命名为 mysql 终端 1 和 mysql 终端 2,再准备一张测试表 test ,写入一条测试数据并调整隔离级别为 READ UNCOMMITTED ,任意一个终端执行即可。
SET @@session.transaction_isolation = 'READ-UNCOMMITTED'; create database test; use test; create table test(id int primary key); insert into test(id) values(1);
- 登录 mysql 终端 1,开启一个事务,将 ID 为 1 的记录更新为 2
begin; update test set id = 2 where id = 1; select * from test; -- 此时看到一条ID为2的记录
- 登录 mysql 终端 2,开启一个事务后查看表中的数据。
use test; begin; select * from test; -- 此时看到一条 ID 为 2 的记录
最后一步读取到了 mysql 终端 1 中未提交的事务(没有 commit 提交动作),即产生了 脏读 ,大部分业务场景都不允许脏读出现,但是此隔离级别下数据库的并发是最好的。
- READ COMMITTED (读提交) 一个事务可以读取另外一个已提交的事务,多次读取会造成不一样的结果,此现象称为不可重复读问题。Oralce 和 SQL Server 的默认隔离级别。
实例
- 准备两个终端,在此命名为 mysql 终端 1 和 mysql 终端 2,再准备一张测试表 test ,写入一条测试数据并调整隔离级别为 READ COMMITTED ,任意一个终端执行即可
SET @@session.transaction_isolation = 'READ-COMMITTED'; create database test; use test; create table test(id int primary key); insert into test(id) values(1);
- 登录 mysql 终端 1,开启一个事务,将 ID 为 1 的记录更新为 2 ,并确认记录数变更过来。
begin; update test set id = 2 where id = 1; select * from test; -- 此时看到一条记录为 2
- 登录 mysql 终端 2,开启一个事务后,查看表中的数据。
use test; begin; select * from test; -- 此时看一条 ID 为 1 的记录
- 登录 mysql 终端 1,提交事务。
commit;
- 切换到 mysql 终端 2。
select * from test; -- 此时看到一条 ID 为 2 的记录
mysql 终端 2 在开启了一个事务之后,在第一次读取 test 表(此时 mysql 终端 1 的事务还未提交)时 ID 为 1 ,在第二次读取 test 表(此时 mysql 终端 1 的事务已经提交)时 ID 已经变为 2 ,说明在此隔离级别下已经读取到已提交的事务。
- REPEATABLE READ(可重复读)
这个是 MySQL 默认的隔离级别,在同一个事务里,select 的结果是事务开始时间点的状态,因此,同样的 select 操作读到的结果会是一致的,但是会有幻读现象。MySQL 的InnoDB 引擎采用的是 next-key locks 机制来避免幻读。
- 准备两个终端,在此命名为 mysql 终端 1 和 mysql 终端 2,准备一张测试表 test 并调整隔离级别为 REPEATABLE READ ,任意一个终端执行即可。
SET @@session.transaction_isolation = 'REPEATABLE-READ'; create database test; use test; create table test(id int primary key,name varchar(20));
- 登录 mysql 终端 1,开启一个事务。
begin; select * from test; -- 无记录
- 登录 mysql 终端 2,开启一个事务。
begin; select * from test; -- 无记录
- 切换到 mysql 终端 1,增加一条记录并提交。
insert into test(id,name) values(1,'a'); commit;
- 切换到 msyql 终端 2。
select * from test; --此时查询还是无记录
通过这一步可以证明,在该隔离级别下已经读取不到别的已提交的事务,如果想看到 mysql 终端 1 提交的事务,在 mysql 终端 2 将当前事务提交后再次查询就可以读取到 mysql 终端 1 提交的事务。我们接着实验,看看在该隔离级别下是否会存在别的问题。
- 此时接着在 mysql 终端 2 插入一条数据。
insert into test(id,name) values(1,'b'); -- 此时报主键冲突的错误
在第 5 步没有数据,为什么在这里会报错呢?其实这就是该隔离级别下可能产生的问题,MySQL 称之为 幻读 。注意我在这里强调的是 MySQL 数据库,Oracle 数据库对于幻读的定义可能有所不同。
- SERIALIZABLE (序列化)
在该隔离级别下事务都是串行顺序执行的,MySQL 数据库的 InnoDB 引擎会给读操作隐式加一把读共享锁,从而避免了脏读、不可重读复读和幻读问题。
- 准备两个终端,在此命名为 mysql 终端 1 和 mysql 终端 2,分别登入 mysql,准备一张测试表 test 并调整隔离级别为 SERIALIZABLE ,任意一个终端执行即可。
SET @@session.transaction_isolation = 'SERIALIZABLE'; create database test; use test; create table test(id int primary key);
- 登录 mysql 终端 1,开启一个事务,并写入一条数据。
begin; insert into test(id) values(1);
- 登录 mysql 终端 2,开启一个事务。
begin; select * from test; -- 此时会一直卡住
- 立马切换到 mysql 终端 1,提交事务。
commit;
一旦事务提交,msyql 终端 2 会立马返回 ID 为 1 的记录,否则会一直卡住,直到超时,其中超时参数是由 innodb_lock_wait_timeout 控制。由于每条 select 语句都会加锁,所以该隔离级别的数据库并发能力最弱。
事务隔离级别
隔离级别 | 脏读 | 不可重复读 | 幻读 |
读未提交 | 可以出现 | 可以出现 | 可以出现 |
读提交 | 不允许出现 | 可以出现 | 可以出现 |
可重复读 | 不允许出现 | 不允许出现 | 可以出现 |
序列化 | 不允许出现 | 不允许出现 | 不允许出现 |
快照 在 MVCC 里是怎么工作的?
InnoDB 里面每个事务都有一个唯一的事务 ID,叫做 transaction ID ,事务开启时,InnoDB 获取一个事务ID。
数据表中的一行记录其实有多个版本(row) ,每个版本有自己的 row trx_id。
图中的三个虚线箭头,就是 Undo log;V1 V2 V3 并不是真实物理存在的,而是每次需要的时候通过当前版本+undo log 计算出来的,比如 V2 的时候,通过V4 和 U3 U2 计算出来的。
Read View
UndoLog 是保存了历史快照,Read View 是帮助判断当前版本的数据是否可见。
InnoDB里面每个事务有一个唯一的事务ID, 叫作transaction id。它是在事务开始的时候向 InnoDB的事务系统申请的,是按申请顺序严格递增的
每行数据有多个版本,每次事务更新数据时,都会生产一个新的数据版本,并且把 transaction id 赋值给这个数据版本的事务ID, 记录为 row trx_id。
InnoDB为每个事务构造了一个数组, 用来保存这个事务启动瞬间, 当前正在“活 跃”的所有事务ID。“活跃”指的就是,启动了但还没提交。
数组里面事务ID的最小值记为低水位,当前系统里面已经创建过的事务ID的最大值加1记为高水位。
对于当前事务的启动瞬间来说, 一个数据版本的row trx_id, 有以下几种可能:
- 如果落在绿色部分, 表示这个版本是已提交的事务或者是当前事务自己生成的, 这个数据是可见的;
- 如果落在红色部分, 表示这个版本是由将来启动的事务生成的, 是肯定不可见的;
- 如果落在黄色部分, 那就包括两种情况
- 若 row trx_id在数组中,表示这个版本是由还没提交的事务生成的,不可见;
- 若 row trx_id不在数组中,表示这个版本是已经提交了的事务生成的,可见。