一 前言
死锁,其实是一个很有意思也很有挑战的技术问题,大概每个DBA和部分开发同学都会在工作过程中遇见 。关于死锁我会持续写一个系列的案例分析,希望能够对想了解死锁的朋友有所帮助。
二 案例分析
2.1 环境说明
MySQL 5.6.24 事务隔离级别为RR
create table tx (
id int not null primary key auto_increment ,
c1 int not null default 0,
c2 int not null default 0,
key idx_c1(c1)
) engine=innodb ;
insert into tx values(24,3,4),(25,3,4),
(26,3,4),(30,5,8);
2.2 测试用例
sess1 |
sess2 |
|
begin; |
begin |
|
T1 |
select * from tx where id=30 for update; |
|
T2 |
update tx set c2=8 where c1=5; ERROR 1213 (40001): Deadlock found when trying to get lock; try restarting transaction |
|
T3 |
delete from tx where id=30; |
2.3 死锁日志
----------------------------------
LATEST DETECTED DEADLOCK
------------------------
*** (1) TRANSACTION:
TRANSACTION 1850, ACTIVE 20 sec starting index read
mysql tables in use 1, locked 1
LOCK WAIT 3 lock struct(s), heap size 1136, 2 row lock(s)
MySQL thread id 379040, OS thread handle 140143994337024, query id 1521958 localhost root updating
update tx set c2=8 where c1=5
*** (1) WAITING FOR THIS LOCK TO BE GRANTED:
RECORD LOCKS space id 27 page no 3 n bits 72 index PRIMARY of table `test`.`tx` trx id 1850 lock_mode X locks rec but not gap waiting
*** (2) TRANSACTION:
TRANSACTION 1849, ACTIVE 32 sec updating or deleting, thread declared inside InnoDB 4999
mysql tables in use 1, locked 1
3 lock struct(s), heap size 1136, 2 row lock(s), undo log entries 1
MySQL thread id 379016, OS thread handle 140143893473024, query id 1521976 localhost root updating
delete from tx where id=30
*** (2) HOLDS THE LOCK(S):
RECORD LOCKS space id 27 page no 3 n bits 72 index PRIMARY of table `test`.`tx` trx id 1849 lock_mode X locks rec but not gap
*** (2) WAITING FOR THIS LOCK TO BE GRANTED:
RECORD LOCKS space id 27 page no 5 n bits 72 index idx_c1 of table `test`.`tx` trx id 1849 lock_mode X locks rec but not gap waiting
*** WE ROLL BACK TRANSACTION (1)
2.4 分析死锁日志
首先要理解的是 对同一个字段申请加锁是需要排队的。
其次表ty中索引idx_c1为非唯一普通索引,我们根据事务执行的时间顺序来解释,这样比较好理解。
T1: sess2 执行select for update 操作持有记录id=30的主键行锁:PRIMARY of table test.tx lock_mode X locks rec but not gap
T2: sess1 语句update通过普通索引idx_c1更新c2,先获取idx_c1 c1=5的X锁lock_mode X locks rec but not gap,然后去申请对应主键id=30的行锁,但是sess2 已经持有主键的行锁,于是sess1 等待。
T3: sess2 执行根据主键id=30删除记录,需要申请id=30的行锁以及c1=5的索引行锁。但是sess1 以及持有该锁,故会出现index idx_c1 of table test.tx trx id 1849 lock_mode X locks rec but not gap waiting
sess2(delete)等待sess1(update),sess1(update)等待sess2(select for update) 循环等待,造成死锁。
对于RDBMS系统出现死锁的根本原因都可以概括为:不同的事务加锁的顺序不一样导致循环等待,进而导致死锁。
2.5 解决方法
修改sess1 的update 为根据主键来更新 也即 update tx set c2=x where id=30,把加锁方式改为顺序加锁,申请主键id的锁,避免通过交叉加锁,相互申请对方持有的锁。
三 小结
上面的案例中出现死锁是由于不同会话对普通索引idx_c1和主键相互竞争导致循环等待而出现死锁的。生产过程中遇到高并发更新同一行的时候,可以考虑避免通过不同的索引进行更新,进而避免死锁。