开发者社区> 优惠码领取> 正文
阿里云
为了无法计算的价值
打开APP
阿里云APP内打开

SQLSERVER排查CPU占用高的情况

简介: SQLSERVER排查CPU占用高的情况 原文地址为:SQLSERVER排查CPU占用高的情况 今天中午,有朋友叫我帮他看一下数据库,操作系统是Windows2008R2 ,数据库是SQL2008R2 64位 64G内存,16核CPU 硬件配置还是比较高的,他说服务器运行的是金蝶K3软件,数据.
+关注继续查看

SQLSERVER排查CPU占用高的情况

今天中午,有朋友叫我帮他看一下数据库,操作系统是Windows2008R2 ,数据库是SQL2008R2 64位

64G内存,16核CPU

硬件配置还是比较高的,他说服务器运行的是金蝶K3软件,数据库实例里有多个数据库

 

现象

他说是这几天才出现的,而且在每天的某一个时间段才会出现CPU占用高的情况

内存占用不太高,只占用了30个G

CPU占用100%


排查方向

 

一般排查都是用下面的脚本,一般会用到三个视图sys.sysprocesses ,dm_exec_sessions ,dm_exec_requests

1 USE master
2 GO
3 --如果要指定数据库就把注释去掉
4 SELECT * FROM sys.[sysprocesses] WHERE [spid]>50 --AND DB_NAME([dbid])='gposdb'
5 SELECT COUNT(*) FROM [sys].[dm_exec_sessions] WHERE [session_id]>50

看一下当前的数据库用户连接有多少

然后使用下面语句看一下各项指标是否正常,是否有阻塞,这个语句选取了前10个最耗CPU时间的会话

 1 SELECT TOP 10
2 [session_id],
3 [request_id],
4 [start_time] AS '开始时间',
5 [status] AS '状态',
6 [command] AS '命令',
7 dest.[text] AS 'sql语句',
8 DB_NAME([database_id]) AS '数据库名',
9 [blocking_session_id] AS '正在阻塞其他会话的会话ID',
10 [wait_type] AS '等待资源类型',
11 [wait_time] AS '等待时间',
12 [wait_resource] AS '等待的资源',
13 [reads] AS '物理读次数',
14 [writes] AS '写次数',
15 [logical_reads] AS '逻辑读次数',
16 [row_count] AS '返回结果行数'
17 FROM sys.[dm_exec_requests] AS der
18 CROSS APPLY
19 sys.[dm_exec_sql_text](der.[sql_handle]) AS dest
20 WHERE [session_id]>50 AND DB_NAME(der.[database_id])='gposdb'
21 ORDER BY [cpu_time] DESC


如果想看具体的SQL语句可以执行下面的SQL语句,记得在SSMS里选择以文本格式显示结果

1 --在SSMS里选择以文本格式显示结果
2 SELECT TOP 10
3 dest.[text] AS 'sql语句'
4 FROM sys.[dm_exec_requests] AS der
5 CROSS APPLY
6 sys.[dm_exec_sql_text](der.[sql_handle]) AS dest
7 WHERE [session_id]>50
8 ORDER BY [cpu_time] DESC

模拟了一些耗CPU时间的动作

 

还有查看CPU数和user scheduler数和最大工作线程数,检查worker是否用完也可以排查CPU占用情况

1 --查看CPU数和user scheduler数目
2 SELECT cpu_count,scheduler_count FROM sys.dm_os_sys_info
3 --查看最大工作线程数
4 SELECT max_workers_count FROM sys.dm_os_sys_info

查看机器上的所有schedulers包括user 和system
通过下面语句可以看到worker是否用完,当达到最大线程数的时候就要检查blocking了


对照下面这个表
各种CPU和SQLSERVER版本组合自动配置的最大工作线程数
CPU数                 32位计算机                        64位计算机
<=4                     256                                   512
  8                        288                                   576
 16                       352                                   704
 32                       480                                   960

1 SELECT
2 scheduler_address,
3 scheduler_id,
4 cpu_id,
5 status,
6 current_tasks_count,
7 current_workers_count,active_workers_count
8 FROM sys.dm_os_schedulers

 

如果SQLSERVER存在要等待的资源,那么执行下面语句就会显示出会话中有多少个worker在等待

结合[sys].[dm_os_wait_stats]视图,如果当前SQLSERVER里面没有任何等待资源,那么下面的SQL语句不会显示任何结果

 1 SELECT TOP 10
2 [session_id],
3 [request_id],
4 [start_time] AS '开始时间',
5 [status] AS '状态',
6 [command] AS '命令',
7 dest.[text] AS 'sql语句',
8 DB_NAME([database_id]) AS '数据库名',
9 [blocking_session_id] AS '正在阻塞其他会话的会话ID',
10 der.[wait_type] AS '等待资源类型',
11 [wait_time] AS '等待时间',
12 [wait_resource] AS '等待的资源',
13 [dows].[waiting_tasks_count] AS '当前正在进行等待的任务数',
14 [reads] AS '物理读次数',
15 [writes] AS '写次数',
16 [logical_reads] AS '逻辑读次数',
17 [row_count] AS '返回结果行数'
18 FROM sys.[dm_exec_requests] AS der
19 INNER JOIN [sys].[dm_os_wait_stats] AS dows
20 ON der.[wait_type]=[dows].[wait_type]
21 CROSS APPLY
22 sys.[dm_exec_sql_text](der.[sql_handle]) AS dest
23 WHERE [session_id]>50
24 ORDER BY [cpu_time] DESC

比如我当前执行了查询SalesOrderDetail_test表100次,由于表数据非常多,所以SSMS需要把SQLSERVER执行的结果慢慢的取走,

造成了ASYNC_NETWORK_IO等待

1 USE [AdventureWorks]
2 GO
3 SELECT * FROM dbo.[SalesOrderDetail_test]
4 GO 100

 


问题源头

经过排查和这几天的观察情况,确定是某些表缺失索引导致,现在在这些表上增加了索引,问题解决

1 select * from t_AccessControl        --权限控制表权限控制
2 select * from t_GroupAccess --用户组权限表用户组权限
3 select * from t_GroupAccessType --用户组权限类表用户组权限类
4 select * from t_ObjectAccess --对象权限表对象权限
5 select * from t_ObjectAccessType --对象权限类型表对象权限类型
6 select * from t_ObjectType --对象类型表对象类型

查询CPU占用高的语句

 1 SELECT TOP 10
2 total_worker_time/execution_count AS avg_cpu_cost, plan_handle,
3 execution_count,
4 (SELECT SUBSTRING(text, statement_start_offset/2 + 1,
5 (CASE WHEN statement_end_offset = -1
6 THEN LEN(CONVERT(nvarchar(max), text)) * 2
7 ELSE statement_end_offset
8 END - statement_start_offset)/2)
9 FROM sys.dm_exec_sql_text(sql_handle)) AS query_text
10 FROM sys.dm_exec_query_stats
11 ORDER BY [avg_cpu_cost] DESC

查询缺失索引

1 SELECT 
2 DatabaseName = DB_NAME(database_id)
3 ,[Number Indexes Missing] = count(*)
4 FROM sys.dm_db_missing_index_details
5 GROUP BY DB_NAME(database_id)
6 ORDER BY 2 DESC;
 1 SELECT  TOP 10 
2 [Total Cost] = ROUND(avg_total_user_cost * avg_user_impact * (user_seeks + user_scans),0)
3 , avg_user_impact
4 , TableName = statement
5 , [EqualityUsage] = equality_columns
6 , [InequalityUsage] = inequality_columns
7 , [Include Cloumns] = included_columns
8 FROM sys.dm_db_missing_index_groups g
9 INNER JOIN sys.dm_db_missing_index_group_stats s
10 ON s.group_handle = g.index_group_handle
11 INNER JOIN sys.dm_db_missing_index_details d
12 ON d.index_handle = g.index_handle
13 ORDER BY [Total Cost] DESC;

定位问题后,新建非聚集索引

1 CREATE NONCLUSTERED INDEX IX_t_AccessControl_F4 ON dbo.t_AccessControl
2 (
3 FObjectType
4 )include([FUserID], [FAccessType], [FAccessMask]) WITH( STATISTICS_NORECOMPUTE = OFF, IGNORE_DUP_KEY = OFF, ALLOW_ROW_LOCKS = ON, ALLOW_PAGE_LOCKS = ON) ON [PRIMARY]
5 GO
6
7 drop index IX_t_AccessControl_F4 on t_AccessControl

 CPU占用恢复正常

跟踪模板和跟踪文件下载,请使用SQL2008R2 版本:files.cnblogs.com/lyhabc/跟踪模板和trace.rar


总结

从多次历史经验来看,如果CPU负载持续很高,但内存和IO都还好的话,这种情况下,首先想到的一定是索引问题,十有八九错不了。

注意文章开头贴出的客户机器负载情况图

 

版权声明:本文内容由阿里云实名注册用户自发贡献,版权归原作者所有,阿里云开发者社区不拥有其著作权,亦不承担相应法律责任。具体规则请查看《阿里云开发者社区用户服务协议》和《阿里云开发者社区知识产权保护指引》。如果您发现本社区中有涉嫌抄袭的内容,填写侵权投诉表单进行举报,一经查实,本社区将立刻删除涉嫌侵权内容。

相关文章
JVM 调优之 CPU 高占用问题
jstack(Stack Trace for Java) 命令用于生成当前时刻的线程快照(一般称为 threaddump 文件)。
48 0
直播平台源码,还在担心CPU/GPU占用率高?
现在手机发烫现象很常见,玩游戏时间过长、看直播时间过长,都是导致手机发烫的原因,引起发烫的原因主要是CPU/GPU占用率过高,在直播平台源码可以通过系统优化解决此类问题,降低系统功耗,在优化前要先了解功耗高的原因。
375 0
SQL Server性能优化之CPU
SQL Server CPU性能优化
1085 0
排查Java高CPU占用原因
开篇  在简书看到一篇公众号讲如何排查CPU问题,想了想在日常工作中也偶尔遇到这样的问题,所以在网上搜了搜该方面的文章,特意拷贝了一篇文章作日后排查参考。
1651 0
阿里云SQL Server最佳实践:高CPU使用率问题排查
在阿里云SQL Server最佳实践系列在线直播中,阿里云数据库专家汪建明总结了7大问题并结合案例为大家分享了阿里云SQL Server高CPU使用率问题排查的实践经验。
10882 0
RDS SQL Server - 最佳实践 - 高CPU使用率系列之二索引碎片
# 摘要 上一篇文章分析了高CPU使用率的原因之一是索引缺失,接下来本系列文章之二的“索引碎片”是CPU高使用率的又一常见的原因。解决索引碎片问题是解决SQL Server服务响应缓慢,查询超时的又一利器。 # 问题引入 “鸟哥,我上一篇文章分享了因为索引缺失导致CPU高使用率的话题,反响不错。接下来,我打算分享索引碎片导致CPU高使用率的话题。”,菜鸟主动找到老鸟汇报工作。 上一篇文章详
3882 0
RDS SQL Server - 最佳实践 - 高CPU使用率系列之数据类型转换
# 摘要 前两篇文章讨论了导致CPU高使用率的两个重要原因是索引缺失和索引碎片,本系列文章之三讨论数据类型隐式转换话题。 # 场景分析 在SQL Server中,比较运算符(大于、小于、等于或者连接)两端的数据类型需要保持一直才能进行。否则,SQL Server会按照数据类型优先级由低到高进行隐式转化,然后再进行比较。这个行为可以通过执行计划中的CONVERT_IMPLICIT关键字看出来,
4936 0
排查Java高CPU占用原因
top命令发现某个进程占用了100%的CPU 通过ps命令,进一步确定哪个进程出了问题 再查看线程占用CPU的列表 # ps -mp PID -o THREAD,tid,time ...
892 0
Sql Server CPU 性能排查及优化的相关 Sql
Sql Server CPU 性能排查及优化的相关 Sql 语句,非常好的SQL语句,记录于此: --Begin Cpu 分析优化的相关 Sql --使用DMV来分析SQL Server启动以来累计使用CPU资源最多的语句。
774 0
+关注
优惠码领取
阿里云优惠码阿里云推荐券bieryun.com
193
文章
0
问答
文章排行榜
最热
最新
相关电子书
更多
低代码开发师(初级)实战教程
立即下载
阿里巴巴DevOps 最佳实践手册
立即下载
冬季实战营第三期:MySQL数据库进阶实战
立即下载