中秋遇到mysql死锁怎么办

本文涉及的产品
云数据库 RDS MySQL,集群系列 2核4GB
推荐场景:
搭建个人博客
RDS MySQL Serverless 基础系列,0.5-2RCU 50GB
云数据库 RDS MySQL,高可用系列 2核4GB
简介: 中秋遇到mysql死锁怎么办

前言


中秋放假期间,线上mysql数据库突然提示出现死锁异常怎么办?是不是内心突然慌的一批,假期再也不能愉快的玩耍了。

莫慌莫慌,今天老万教你遇到了mysql死锁应该怎么办。


一、什么是死锁


所谓死锁:是指多个事务在并发执行过程中由于相互持有对方需要的锁,都在等待资源变的可用而不会主动释放自身持有的锁,从而导致循环等待的情况。


通常表级锁不会产生死锁,所以解决死锁主要还是针对于最常用的InnoDB。


官方文档:

Innodb死锁:https://dev.mysql.com/doc/refman/8.0/en/innodb-deadlocks.html


二、死锁的产生条件


发生死锁的必要条件有4个, 分别为互斥条件、不可剥夺条件、请求与保持条件和循环等待条件。

78.png

从这几点来看,mysql中的死锁产生条件和java程序中死锁产生条件是一致的。


但是java程序中的死锁往往会产生更严重的后果,而mysql中的死锁由于数据库内部的死锁处理机制,一般不会产生很严重的影响。


三、死锁示例


表和数据准备:

DROP TABLE if EXISTS user;
CREATE TABLE `user` (
  `id` bigint(20) NOT NULL AUTO_INCREMENT COMMENT '主键ID',
  `account` varchar(30) DEFAULT NULL COMMENT '账号',
  `name` varchar(30) DEFAULT NULL COMMENT '姓名',
  `age` int(11) DEFAULT NULL COMMENT '年龄',
  `email` varchar(50) DEFAULT NULL COMMENT '邮箱',
  PRIMARY KEY (`id`),
  UNIQUE KEY `uk_account` (`account`),
  KEY `ik_name` (`name`)
) ENGINE=InnoDB  DEFAULT CHARSET=utf8mb4;
-- 英文名,主要是更容易验证间隙锁
INSERT INTO `user` (`id`,`account`,`name`, `age`, `email`) VALUES (3, '000003','Andi', 12, '10003@qq.com');
INSERT INTO `user` (`id`, `account`,`name`, `age`, `email`) VALUES (10,'000010', 'Jack', 20, '100010@qq.com');
INSERT INTO `user` (`id`, `account`,`name`, `age`, `email`) VALUES (20, '000020','Tom', 30, '100020@qq.com');
INSERT INTO `user` (`id`, `account`,`name`, `age`, `email`) VALUES (30, '000030','Tom', 60, '100030@qq.com');


事务A:

mysql> START TRANSACTION;
Query OK, 0 rows affected (0.00 sec)
mysql> SELECT * FROM `user` WHERE id = 3 FOR UPDATE;
+----+---------+------+-----+--------------+
| id | account | name | age | email        |
+----+---------+------+-----+--------------+
|  3 | 000003  | Andi |  12 | 10003@qq.com |
+----+---------+------+-----+--------------+
1 row in set (0.01 sec)
mysql> SELECT * FROM `user` WHERE id = 10 FOR UPDATE;
+----+---------+------+-----+---------------+
| id | account | name | age | email         |
+----+---------+------+-----+---------------+
| 10 | 000010  | Jack |  20 | 100010@qq.com |
+----+---------+------+-----+---------------+
1 row in set (2.57 sec)

事务B:

mysql> START TRANSACTION;
Query OK, 0 rows affected (0.00 sec)
mysql> SELECT * FROM `user` WHERE id = 10 FOR UPDATE;
+----+---------+------+-----+---------------+
| id | account | name | age | email         |
+----+---------+------+-----+---------------+
| 10 | 000010  | Jack |  20 | 100010@qq.com |
+----+---------+------+-----+---------------+
1 row in set (0.00 sec)
mysql> SELECT * FROM `user` WHERE id = 3 FOR UPDATE;
1213 - Deadlock found when trying to get lock; try restarting transaction


循环等待示意图:

77.png


四、死锁的分析和查看


1.查看最近1个死锁信息

show engine innodb status;


其中和死锁相关的信息:

76.png


2.查看正在运行中的事务信息

select * from information_schema.innodb_trx;

75.png


说明:


trx_state中的LOCK WAIT表示出现锁等待

trx_query中可以查看导致锁等待的sql语句


3.查看加锁信息

-- 查看加锁信息(MySQL5.X)
select * from information_schema.innodb_locks;
-- 查看锁等待(MySQL5.X)
select * from information_schema.innodb_lock_waits;
--查看加锁信息(MySQL8.0)
SELECT * FROM performance_schema.data_locks;
--查看锁等待(MySQL8.0)
SELECT * FROM performance_schema.data_lock_waits;


五、死锁的内部处理方案


mysql内部采用2种机制解决死锁问题:


死锁探测机制 innodb_deadlock_detect 默认开启

锁等待超时机制 innodb_lock_wait_timeout


1.死锁探测机制

当启用死锁检测(默认情况下)时,InnoDB 会自动检测事务死锁并回滚一个或多个事务以打破死锁。InnoDB 尝试选择要回滚的小事务,其中事务的大小由插入、更新或删除的行数决定。如果使用 innodb_deadlock_detect 变量禁用死锁检测,则 InnoDB 依赖于 innodb_lock_wait_timeout 设置,在发生死锁的情况下回滚事务。


当检测到死锁后,就会出现下面这个提示:

74.png


mysql中的死锁探测机制有3种判定方式:


1.等待图(wait-for graph)回路检测

2.等待的事务列表超过200个认为是死锁

3.等待的事务持有锁的总数超过1,000,000


官网说明:If the LATEST DETECTED DEADLOCK section of InnoDB Monitor output includes a message stating TOO DEEP OR LONG SEARCH IN THE LOCK TABLE WAITS-FOR GRAPH, WE WILL ROLL BACK FOLLOWING TRANSACTION, this indicates that the number of transactions on the wait-for list has reached a limit of 200. A wait-for list that exceeds 200 transactions is treated as a deadlock and the transaction attempting to check the wait-for list is rolled back. The same error may also occur if the locking thread must look at more than 1,000,000 locks owned by transactions on the wait-for list.


除了超时机制,当前数据库都普遍采用等待图(wait-for graph)的方式来进行死锁检测。


wait-for graph要求数据库保存以下两种信息:


锁的信息链表

事务等待链表

通过上述链表可以构造出一张图,而在这个图中若存在回路,就代表存在死锁,因此资源间相互发生等待。在 wait-for graph中,事务为图中的节点。而在图中,事务T1指向T2边的定义为:


事务T1等待事务T2所占用的资源

事务T1最终等待T2所占用的资源,也就是事务之间在等待相同的资源,而事务T1发生在事务T2的后面

来看一个例子:

73.png

通过 Transaction Wait Lists中可以看到共有4个事务t1、t2、t3、t4。

通过Lock List列表,可以看到加锁的等待顺序。

在row1上,t1:s等待t2:x释放独占锁,才能添加共享锁。

在row2上,t1:s和t4:s持有相同的共享锁。

t2:x需要等待t1:s和t4:s释放共享锁后,才能添加独占锁。

t3:x需要等待t1:s和t4:s释放共享锁,并且t2:x释放独占锁后,才能添加独占锁。


故在wait-for graph中应有4个节点。根据等待关系画出等待图:

72.png

通过上图可以发现存在回路(t1,t2),因此存在死锁。可以发现wait-for graph是一种较为主动的死锁检测机制,在每个事务请求锁并发生等待时都会判断是否存在回路,若存在则有死锁,通常来说InnoDB存储引擎选择回滚undo量最小的事务。


关闭死锁探测:

对于高并发的系统,当大量线程等待同一个锁时,死锁检测可能会导致性能的下降。此时,如果禁用死锁检测,而改为依靠参数 innodb_lock_wait_timeout 执行发生死锁时的事务回滚可能会更加高效。


在 MySQL 8.0 中,增加了一个新的动态变量:innodb_deadlock_detect,可以用于控制 InnoDB 是否执行死锁检测。该参数的默认值为 ON,即打开死锁检测。

71.png

注意⚠️:innodb_deadlock_detect是一个全局变量,在进行变量设置的时候需要加上global。


查看是否开启死锁探测:


mysql> show global variables like 'innodb_deadlock_detect';
+------------------------+-------+
| Variable_name          | Value |
+------------------------+-------+
| innodb_deadlock_detect | ON    |
+------------------------+-------+
1 row in set (0.02 sec)


关闭死锁检测:

mysql> set global innodb_deadlock_detect=off;
Query OK, 0 rows affected (0.01 sec)


检测是否成功关闭:

mysql> show global variables like 'innodb_deadlock_detect';
+------------------------+-------+
| Variable_name          | Value |
+------------------------+-------+
| innodb_deadlock_detect | OFF   |
+------------------------+-------+
1 row in set (0.01 sec)


2.锁等待超时机制

通常来说,应该启用死锁检测,并且在应用程序中尽量避免产生死锁,同时对死锁进行相应的处理,例如重新开始事务。

只有在确认死锁检测影响了系统的性能,并且禁用死锁检测不会带来负面影响时,可以尝试关闭 innodb_deadlock_detect 选项。另外,如果禁用了 InnoDB 死锁检测,需要调整参数 innodb_lock_wait_timeout 的值,以满足实际的需求。

69.png

默认的锁等待超时时间是50s,当发生超时后,就出现下面这个提示:

70.png


查看变量 innodb_lock_wait_timeout :

//查看全局变量
mysql> show global variables like 'innodb_lock_wait_timeout';
+--------------------------+-------+
| Variable_name            | Value |
+--------------------------+-------+
| innodb_lock_wait_timeout | 50    |
+--------------------------+-------+
1 row in set (0.02 sec)
//查看session级别变量
mysql> show  variables like 'innodb_lock_wait_timeout';
+--------------------------+-------+
| Variable_name            | Value |
+--------------------------+-------+
| innodb_lock_wait_timeout | 50    |
+--------------------------+-------+
1 row in set (0.02 sec)


修改锁超时等待时长:

//修改全局变量
mysql> set global innodb_lock_wait_timeout=30;
Query OK, 0 rows affected (0.00 sec)
//修改session级别变量
mysql> set  innodb_lock_wait_timeout=30;
Query OK, 0 rows affected (0.00 sec)


再次查看变量,发现超时时间都变为30s。


注意⚠️:

innodb_lock_wait_timeout 参数分为session级别和global级别,如果发现锁等待超时时间一直没有设置成功,检测参数级别是否正确。


六、手动释放锁


手动解除正在死锁的状态有两种方法:


1.表级锁手动释放

1.查询是否锁表


show OPEN TABLES where In_use > 0;


2.查询进程(如果您有SUPER权限,您可以看到所有线程。否则,您只能看到您自己的线程)


show processlist


3.杀死进程id(就是上面命令的id列)


kill id


2.行级锁手动释放

1.查看下正在等待锁的事务


SELECT * FROM INFORMATION_SCHEMA.INNODB_TRX;


其中trx_state中的LOCK WAIT表示出现锁等待。


2.杀死进程id(就是上面命令的trx_mysql_thread_id列)


kill 线程ID


七、死锁的优化策略


Mysql中的死锁并不可怕,因为Mysql会通过内部的死锁探测机制和锁等待超时机制自动回滚事务释放锁。除非它们非常频繁,以至于您根本无法运行某些事务。


最简单的死锁异常处理方式:重试,可以通过捕捉死锁异常,进行指定次数的重试操作。


死锁的优化:空间维度和时间维度


空间维度:减少锁的范围,保持加锁顺序


采用乐观锁,避免加锁,类似java中的cas机制

尽量通过索引来检索,缩小锁的范围

统一事务中数据操作的顺序,避免出现循环等待

不要对不存在的记录执行update、delete操作,避免出现无意义的间隙锁

时间维度:减少加锁时间


控制事务的大小,避免大事务长时间持有锁

涉及事务加锁操作,尽量放在事务的最后执行

尽可能使用低级别的事务隔离机制


总结


本文主要是对mysql的死锁相关问题进行了介绍。

1、死锁产生的原因

2、为什么mysql中的死锁一般不会产生非常严重的影响

3、mysql内部对死锁的两种处理机制:死锁探测机制innodb_deadlock_detect和锁等待超时机制innodb_lock_wait_timeout

4、怎么查看锁的相关信息,怎么分析死锁

5、怎么手动释放锁

6、通过哪些手段可以减少死锁的产生

相关实践学习
如何在云端创建MySQL数据库
开始实验后,系统会自动创建一台自建MySQL的 源数据库 ECS 实例和一台 目标数据库 RDS。
全面了解阿里云能为你做什么
阿里云在全球各地部署高效节能的绿色数据中心,利用清洁计算为万物互联的新世界提供源源不断的能源动力,目前开服的区域包括中国(华北、华东、华南、香港)、新加坡、美国(美东、美西)、欧洲、中东、澳大利亚、日本。目前阿里云的产品涵盖弹性计算、数据库、存储与CDN、分析与搜索、云通信、网络、管理与监控、应用服务、互联网中间件、移动服务、视频服务等。通过本课程,来了解阿里云能够为你的业务带来哪些帮助     相关的阿里云产品:云服务器ECS 云服务器 ECS(Elastic Compute Service)是一种弹性可伸缩的计算服务,助您降低 IT 成本,提升运维效率,使您更专注于核心业务创新。产品详情: https://www.aliyun.com/product/ecs
目录
相关文章
|
2月前
|
SQL 关系型数据库 MySQL
MySQL死锁及源码分析!
MySQL死锁及源码分析!
MySQL死锁及源码分析!
|
2月前
|
SQL 关系型数据库 MySQL
案例剖析:MySQL唯一索引并发插入导致死锁!
案例剖析:MySQL唯一索引并发插入导致死锁!
150 0
案例剖析:MySQL唯一索引并发插入导致死锁!
|
2月前
|
SQL 关系型数据库 MySQL
案例剖析,MySQL共享锁引发的死锁问题!
案例剖析,MySQL共享锁引发的死锁问题!
|
4月前
|
SQL 关系型数据库 MySQL
遇到mysql数据库死锁,你会怎么排查?
遇到mysql数据库死锁,你会怎么排查?
306 0
|
1月前
|
SQL 算法 关系型数据库
面试:什么是死锁,如何避免或解决死锁;MySQL中的死锁现象,MySQL死锁如何解决
面试:什么是死锁,死锁产生的四个必要条件,如何避免或解决死锁;数据库锁,锁分类,控制事务;MySQL中的死锁现象,MySQL死锁如何解决
|
2月前
|
关系型数据库 MySQL 数据库
一个 MySQL 数据库死锁的案例和解决方案
本文介绍了一个 MySQL 数据库死锁的案例和解决方案。
115 3
|
3月前
|
监控 关系型数据库 MySQL
MySQL锁机制与解决死锁问题
MySQL锁机制与解决死锁问题
326 5
|
2月前
|
监控 关系型数据库 MySQL
一次彻底讲清如何处理mysql 的死锁问题
【10月更文挑战第16天】本文详细介绍了如何处理 MySQL 中的死锁问题,涵盖死锁的概念、原因、检测方法及解决策略,强调通过优化事务设计、调整数据库参数、手动处理和预防措施等手段,有效减少死锁,提升数据库性能与稳定性。
406 0
|
4月前
|
存储 SQL 关系型数据库
深入MySQL锁机制:原理、死锁解决及Java防范技巧
深入MySQL锁机制:原理、死锁解决及Java防范技巧
|
4月前
|
SQL JavaScript 关系型数据库
Mysql索引不当引发死锁问题
本文通过真实案例解析了MySQL在高并发环境下出现死锁的问题。数据库表`t_award`包含多个索引,但在执行特定SQL语句时遭遇索引失效,导致更新操作变慢并引发死锁。分析发现,联合索引`(pool_id, identifier, status, is_redeemed)`因`identifier`允许为空值而导致索引部分失效。此外,`pool_id`上的普通索引产生的间隙锁在高并发下加剧了死锁风险。为解决此问题,文中提出了调整索引顺序至`(pool_id, status, is_redeemed, identifier)`等方案来优化索引使用,进而减轻死锁现象。