什么是MVCC
MVCC是Multi-Version Concurrency Control
的缩写,也就是多版本并发控制。在Mysql InnoDB中用来处理读写冲突,实现非阻塞并发读,以达到更好的数据库并发性能。
当前读和快照读
说到MVCC,就不得不提当前读和快照读。
- 当前读
当前读,顾名思义就是读取当前的最新数据。比如select for update
、select lock in share mode
、update
、insert
、delete
等都属于当前读,因为这些操作都会对数据进行加锁,避免其他并发事务不能修改当前记录,以保证读取到的是最新数据。 - 快照读
快照读就是读取某一时刻的记录,读取这样的数据是不需要加锁的。比如select
操作就是快照读,这样处理可以有效提升数据库的并发读写能力。快照读的实现就是基于MVCC。
也就是说,当前读和快照读的区别就在于:当前读是加锁的,是悲观锁的实现;快照读是不加锁的,基于MVCC实现;
MVCC解决了什么问题
- 数据库读写并发能力
在并发读写数据时,可以做到在读写操作不用相互阻塞,提升数据库并发读写性能;因为select
操作是快照读,update
、insert
、delete
操作是当前读,两者不会相互阻塞; - 解决脏读、不可重复读、幻读等问题
MVCC与Read View结合可以解决脏读、不可重复读、幻读事务隔离问题;
MVCC是怎么实现的
MVCC设计出来的目的就是为了解决读写冲突,它的实现主要依赖于4个隐式字段、undolog、Read View;
- 隐式字段
数据库在每一行数据记录外额外增加了3个隐式字段:
DB_ROW_ID | DB_TRX_ID | DB_ROLL_PTR | DELETED_BIT |
隐藏主键 | 事务ID | 回滚指针 | 记录被更新或者被删除标记 |
1.隐藏主键:隐含的自增ID,如果数据表没有设置主键,InnoDB会自动以DB_ROW_ID生成一个聚簇索引;
2.事务ID:记录创建这条记录/或者最后一次修改这条记录的事务ID;
3.回滚指针:记录这条记录的上一个版本;
4.记录被更新或者被删除标记:修改操作是给当前记录打上
DELETED_BIT=true
的标记,另外再创建一条新记录;删除操作是给当前记录打上DELETED_BIT=true
的标记;都不是真正地把数据删掉;
- undo日志
除了查询操作不会记录undo log外,其他的update
、insert
、delete
操作都会记录对应的undo log;
1.比如有一个user
表已经插入一条新记录,name=zouwei,age=28
,隐藏主键为1:
2.现在再来一个事务1针对该记录的name做出修改,改名为Z
;
- 在事务1修改该记录时,数据库先给该记录加上排他锁;
- 然后再把当前记录拷贝一份到undo log中,
DELETED_BIT
设置为true; - 拷贝完毕后,修改改记录
name=Z
,并把DB_TRX_ID
设置为1,DB_ROLL_PTR
指向undlog中的副本,也就是当前记录的上一个版本; - 事务提交,释放排他锁;
- 3.再来一个事务2修改该记录的
age=30
:
- 在事务2修改该记录时,同样先给该记录加上排他锁;
- 然后再把当前记录拷贝一份到undo log中,
DELETED_BIT
设置为true; - 拷贝完毕后,修改改记录
age=30
,并把DB_TRX_ID
设置为2,DB_ROLL_PTR
指向undlog中的副本,也就是当前记录的上一个版本; - 事务提交,释放排他锁;
- 也就是说,不同事务针对同一记录做修改,undo log会产生该记录的版本链条,链首是该记录的最新旧数据,链尾是该记录的最早旧数据;
- Read ViewRead View就是在事务中,执行快照读操作时,生成的读视图;在该事务执行快照读的那一刻,会生成数据库当前的一个快照,记录并维护了当前活跃的事务ID(事务ID被分配时是递增的);Read View的作用就是用来判断在执行快照读时,当前事务在undo log链中,哪些旧数据是可以被看见的;Read View可见性算法大致如下:
Read View中包含大概三个全局属性:
1.trx_list:未提交事务ID列表;
2.up_limit_id:trx_list中的最小事务ID;
3.low_limit_id:创建视图那一刻,下一个系统尚未分配的事务ID;
- 在undo log中,DB_TRX_ID小于up_limit_id的记录都是可见的;
- 如果DB_TRX_ID大于low_limit_id,那么说明该记录时在创建Read View后写进来的,那肯定是不可见的;
- 那么还要检测DB_TRX_ID是否在trx_list中,如果不在,那么说明事务已经提交,那么该记录可见,否则说明该事务还未提交,不可见;
Read View在RR隔离级别和RC隔离级别的区别
- 在RR隔离级别下,事务对某条记录的第一次快照读会创建一个Read View,此后再调用快照读的时候,使用的还是同一个Read View;所以当前事务只要在其他事务提交之前使用过快照读,那么即使其他事务已经提交了,因为使用的是同一个Read View,所以依然还是看不见提交的数据;
- 在RC隔离级别下,每一次快照读都会重新生成一个新的Read View,所以我们就可以在RC隔离级别下看到其他事务提交的数据;