SQLServer的一次堵塞分析

本文涉及的产品
云数据库 RDS SQL Server,基础系列 2核4GB
RDS SQL Server Serverless,2-4RCU 50GB 3个月
推荐场景:
简介:

SQLServer的一次堵塞分析(2010-08-27)
今天工作人员突然报告说某个界面无法正常打开了,第一个想到的便是SQLServer又发生堵塞了。
在SQLServer中,做了一个5分钟运行一次的定时任务,定期扫描堵塞情况;不过五分钟有些太久了。
就运行了一下查询堵塞的脚本,看看目前系统里正在发生的堵塞情况。
SELECT
  blocked_query.session_id AS blocked_session_id,
  blocking_query.session_id AS blocking_session_id,
  blocking_sql_text.text AS blocking_sql_text,
  blocked_sql_text.text AS blocked_sql_text,
  waits.wait_type AS blocking_resource,
  blocked_query.command AS blocked_command,
  blocking_query.command AS blocking_command,  
  blocked_query.wait_type AS blocked_wait_type,
  blocked_query.wait_time AS blocked_wait_time,  
  blocking_query.total_elapsed_time AS blocking_elapsed_time,
  GETDATE()
  FROM sys.dm_exec_requests blocked_query
  JOIN sys.dm_exec_requests blocking_query ON
blocked_query.blocking_session_id = blocking_query.session_id
CROSS APPLY
(
SELECT *
FROM sys.dm_exec_sql_text(blocking_query.sql_handle)
) blocking_sql_text
CROSS APPLY
(
SELECT *
FROM sys.dm_exec_sql_text(blocked_query.sql_handle)
) blocked_sql_text
JOIN sys.dm_os_waiting_tasks waits ON
waits.session_id = blocking_query.session_id

查询结果很简单,
被堵塞的是一个select语句,堵塞的是一个触发器;两者操作的是同一个表,blocking_resource为LCK_M_S,很明显是一个读写的相互堵塞。
分析步骤理应优先从堵塞进程开始分析,然后再分析select语句
触发器的业务逻辑比较复杂,大概有600多行,其中有一二十个select、update语句
只能按顺序一个个来分析相关的select和update语句了,看看哪条sql可能出了问题
主要是看SQL的where条件是否满足索引和高选择性要求,很快便定位到一条sql语句
SELECT TOP 1 @var1=field1 FROM tablename WHERE field2=@var2 AND field1 IS NOT NULL AND primarykey<>@primarykey 
该表将近10万条记录,而执行该查询,等待了1分钟却看不到执行结果。理论上是不应该的,先标记下来吧,继续往下跟踪。
很快又发现一条带数据库链接的查询
SELECT TOP 1 primarykey FROM DBLINK.DBNAME.USERNAME.tablename WHERE COND1
先试着运行一下吧,该SQL也是半天没有响应。
问题应该出现在这两个地方,需要再了解一下相应的业务逻辑再进行SQL优化,当务之急是先把该session杀掉
运行kill sessionid后,却还是无法打开程序界面,继续运行查询堵塞脚本,发现blocking_command变成了KILLED/ROLLBACK,也 就是说一直处于rollback状态,没有杀成功,很奇怪。而且整个数据库似乎已经全部瘫痪了,所有应用程序均无法执行。
于是系统工程师就把数据库重启了一下,又重新打开该程序界面进行数据处理,结果很快又出现之前的症状。
后来想是不是DBLINK出现了问题,继续运行基于该DBLINK的查询试一下,发现基本上全部无法执行;还是先检查一下网络吧
系统工程师登陆到服务器上查看windows的日志,果然发现了很多网络故障,紧急处理一下网络。
再次运行查询堵塞脚本,发现堵塞已经自动消除,而那条看似很慢的SQL也很快运行出结果了。

至此堵塞问题已解决。

鉴于SQLServer的锁的隔离机制被设置为READ_COMMITTED_SNAPSHOT,读和写会导致冲突,问题的根源也就不难理解了,但造成问题的最终原因却可能是多方面的。







本文转自baoqiangwang51CTO博客,原文链接:http://blog.51cto.com/baoqiangwang/384018,如需转载请自行联系原作者

相关实践学习
使用SQL语句管理索引
本次实验主要介绍如何在RDS-SQLServer数据库中,使用SQL语句管理索引。
SQL Server on Linux入门教程
SQL Server数据库一直只提供Windows下的版本。2016年微软宣布推出可运行在Linux系统下的SQL Server数据库,该版本目前还是早期预览版本。本课程主要介绍SQLServer On Linux的基本知识。 相关的阿里云产品:云数据库RDS&nbsp;SQL Server版 RDS SQL Server不仅拥有高可用架构和任意时间点的数据恢复功能,强力支撑各种企业应用,同时也包含了微软的License费用,减少额外支出。 了解产品详情:&nbsp;https://www.aliyun.com/product/rds/sqlserver
相关文章
|
5月前
|
SQL IDE Java
Java连接SQL Server数据库的详细操作流程
Java连接SQL Server数据库的详细操作流程
|
2月前
|
关系型数据库 MySQL 网络安全
5-10Can't connect to MySQL server on 'sh-cynosl-grp-fcs50xoa.sql.tencentcdb.com' (110)")
5-10Can't connect to MySQL server on 'sh-cynosl-grp-fcs50xoa.sql.tencentcdb.com' (110)")
|
4月前
|
SQL 存储 监控
SQL Server的并行实施如何优化?
【7月更文挑战第23天】SQL Server的并行实施如何优化?
111 13
|
4月前
|
SQL
解锁 SQL Server 2022的时间序列数据功能
【7月更文挑战第14天】要解锁SQL Server 2022的时间序列数据功能,可使用`generate_series`函数生成整数序列,例如:`SELECT value FROM generate_series(1, 10)。此外,`date_bucket`函数能按指定间隔(如周)对日期时间值分组,这些工具结合窗口函数和其他时间日期函数,能高效处理和分析时间序列数据。更多信息请参考官方文档和技术资料。
|
4月前
|
SQL 存储 网络安全
关系数据库SQLserver 安装 SQL Server
【7月更文挑战第26天】
60 6
|
4月前
|
存储 SQL C++
对比 SQL Server中的VARCHAR(max) 与VARCHAR(n) 数据类型
【7月更文挑战7天】SQL Server 中的 VARCHAR(max) vs VARCHAR(n): - VARCHAR(n) 存储最多 n 个字符(1-8000),适合短文本。 - VARCHAR(max) 可存储约 21 亿个字符,适合大量文本。 - VARCHAR(n) 在处理小数据时性能更好,空间固定。 - VARCHAR(max) 对于大文本更合适,但可能影响性能。 - 选择取决于数据长度预期和业务需求。
371 1
|
3月前
|
SQL 安全 Java
驱动程序无法通过使用安全套接字层(SSL)加密与 SQL Server 建立安全连接。错误:“The server selected protocol version TLS10 is not accepted by client
驱动程序无法通过使用安全套接字层(SSL)加密与 SQL Server 建立安全连接。错误:“The server selected protocol version TLS10 is not accepted by client
470 0
|
4月前
|
SQL Oracle 关系型数据库
MySQL、SQL Server和Oracle数据库安装部署教程
数据库的安装部署教程因不同的数据库管理系统(DBMS)而异,以下将以MySQL、SQL Server和Oracle为例,分别概述其安装部署的基本步骤。请注意,由于软件版本和操作系统的不同,具体步骤可能会有所变化。
305 3
|
4月前
|
SQL 存储 安全
数据库数据恢复—SQL Server数据库出现逻辑错误的数据恢复案例
SQL Server数据库数据恢复环境: 某品牌服务器存储中有两组raid5磁盘阵列。操作系统层面跑着SQL Server数据库,SQL Server数据库存放在D盘分区中。 SQL Server数据库故障: 存放SQL Server数据库的D盘分区容量不足,管理员在E盘中生成了一个.ndf的文件并且将数据库路径指向E盘继续使用。数据库继续运行一段时间后出现故障并报错,连接失效,SqlServer数据库无法附加查询。管理员多次尝试恢复数据库数据但是没有成功。
|
4月前
|
SQL 存储 关系型数据库
关系型数据库SQL Server学习
【7月更文挑战第4天】
77 2