RDS SQL Server - 最佳实践 - 高CPU使用率系列之数据类型转换

本文涉及的产品
RDS MySQL Serverless 基础系列,0.5-2RCU 50GB
云数据库 RDS MySQL,集群系列 2核4GB
推荐场景:
搭建个人博客
RDS SQL Server Serverless,2-4RCU 50GB 3个月
推荐场景:
简介: # 摘要 前两篇文章讨论了导致CPU高使用率的两个重要原因是索引缺失和索引碎片,本系列文章之三讨论数据类型隐式转换话题。 # 场景分析 在SQL Server中,比较运算符(大于、小于、等于或者连接)两端的数据类型需要保持一直才能进行。否则,SQL Server会按照数据类型优先级由低到高进行隐式转化,然后再进行比较。这个行为可以通过执行计划中的CONVERT_IMPLICIT关键字看出来,

摘要

前两篇文章讨论了导致CPU高使用率的两个重要原因是索引缺失和索引碎片,本系列文章之三讨论数据类型隐式转换话题。

场景分析

在SQL Server中,比较运算符(大于、小于、等于或者连接)两端的数据类型需要保持一直才能进行。否则,SQL Server会按照数据类型优先级由低到高进行隐式转化,然后再进行比较。这个行为可以通过执行计划中的CONVERT_IMPLICIT关键字看出来,后面的测试例子中,我们可以清楚的看到这一点。如果很不幸,导致SQL Server正式表字段数据类型隐式转换会带来几个方面的问题:
 数据经过了转换,所以执行计划无法走更优的Index Seek,进而选择Index Scan
 由于Index Scan,所以I/O消耗很高
 数据类型转换计算和I/O飙高,导致CPU使用率很高
SQL Server数据类型转化参照表如下图(图片来自微软官网):
01.png

解决问题

在这里,我们将这个例子详细分解为五个小步骤:
 测试环境:搭建简单的测试环境。
 执行查询:SQL Server会隐式转换正式表字段中的数据为INT类型
 数据类型隐式转换:数据类型隐式转换的表现形式
 解决问题:修改查询语句比较运算符右边的数据类型为字符串格式
 效率对比:查询修改前后的性能对比

测试环境

我们在本系列文章之一RDS SQL Server - 最佳实践 - 高CPU使用率系列之索引缺失创建的测试表上稍作修改:删除索引 => 修改字段ItemID为VARCHAR数据类型 => 创建索引。代码如下:

USE TestDb
GO

--===Drop index included
DROP INDEX IX_UserID_OrderDate_@ItemID_@OrderQty_@Price
ON dbo.SalesOrder;
GO

--===Change Data type for Testing Data convertion
ALTER TABLE dbo.SalesOrder
ALTER COLUMN ItemID VARCHAR(8) NOT NULL
GO

--=== Create Indexes
CREATE INDEX IX_ItemID_UserID_OrderDate_@OrderQty_@Price
ON dbo.SalesOrder([ItemID],[UserID],[OrderDate])
INCLUDE ([OrderQty], [Price])
WITH (FILLFACTOR = 85);
GO

EXEC sys.sp_help 'dbo.SalesOrder'
GO

从结果展示来看,ItemID已经变成了VARCAHR数据类型,展示如下:
02.png

执行查询

现在我们执行下面的查询语句,打开实际执行计划,注意WHERE ItemID = 250子句,等号右边的数据类型为INT,相比左边的数据类型VARCHAR优先级要高。所以,SQL Server必须先隐式转换正式表中该字段存储的所有数据为INT以后,再与250比较。这个转换操作会导致I/O飙高,无法使用索引和CPU使用率走高。

USE TestDb
GO
SET STATISTICS TIME ON
SET STATISTICS IO ON

SELECT 
    ItemID, OrderQty, Price
FROM dbo.SalesOrder
WHERE ItemID = 250
    AND OrderDate >= DATEADD(MONTH, -1, GETDATE())
    AND OrderDate <= GETDATE();

SET STATISTICS TIME OFF
SET STATISTICS IO OFF

从性能指标页面来看,I/O为14950,CPU消耗327毫秒,时间消耗362毫秒,截图如下:
03.png

数据类型隐式转化

我们可以从执行计划中的CONVERT_IMPLICIT关键字看出,SQL Server做了数据类型的隐式转换,并且转换的是正式表中的数据。执行计划截图如下:
04.png

解决问题

问题分析清楚了,解决问题的方便变得非常简单。我们只需要保证比较运算符两端的数据类型一致,不让SQL Server隐式转换正式表字段中的数据,这样就可以大大减少I/O和CPU开销了。所以,我们把WHERE ItemID = 250子句修改为WHERE ItemID = '250'即可,修改后的查询如下:

USE TestDb
GO
SET STATISTICS TIME ON
SET STATISTICS IO ON

SELECT 
    ItemID, OrderQty, Price
FROM dbo.SalesOrder
WHERE ItemID = '250'        --correct here to ItemID = '250'
    AND OrderDate >= DATEADD(MONTH, -1, GETDATE())
    AND OrderDate <= GETDATE();

SET STATISTICS TIME OFF
SET STATISTICS IO OFF

性能指标页面显示I/O消耗为61,CPU消耗为16毫秒,执行时间消耗为190毫秒,截图如下所示:
05.png

修改查询后的执行计划,走到了Index Seek,没有了CONVERT_IMPLICIT关键字的存在。执行计划截图如下:
06.png

性能对比

我们将修改查询语句前后的性能指标数据对比一下,执行时间提高了47.51%,CPU消耗提高了95.1%,I/O消耗提高了99.6%,平均性能提高了80.74%。对比数据做图如下:
07.png

总结

SQL Server做正式表字段数据类型隐式转换是导致高CPU使用率的另一重大原因,这篇文章详细分析了导致的原因、表象和解决问题的办法,指导我们平时在写查询语句的时候,需要时刻牢记比较运算符两端的数据类型保持一致。

引用文章

Data Type Conversion

相关实践学习
如何在云端创建MySQL数据库
开始实验后,系统会自动创建一台自建MySQL的 源数据库 ECS 实例和一台 目标数据库 RDS。
全面了解阿里云能为你做什么
阿里云在全球各地部署高效节能的绿色数据中心,利用清洁计算为万物互联的新世界提供源源不断的能源动力,目前开服的区域包括中国(华北、华东、华南、香港)、新加坡、美国(美东、美西)、欧洲、中东、澳大利亚、日本。目前阿里云的产品涵盖弹性计算、数据库、存储与CDN、分析与搜索、云通信、网络、管理与监控、应用服务、互联网中间件、移动服务、视频服务等。通过本课程,来了解阿里云能够为你的业务带来哪些帮助 &nbsp; &nbsp; 相关的阿里云产品:云服务器ECS 云服务器 ECS(Elastic Compute Service)是一种弹性可伸缩的计算服务,助您降低 IT 成本,提升运维效率,使您更专注于核心业务创新。产品详情: https://www.aliyun.com/product/ecs
目录
相关文章
|
NoSQL 关系型数据库 MySQL
阿里云RDS关系型数据库大全_MySQL版、PolarDB、PostgreSQL、SQL Server和MariaDB等
阿里云RDS关系型数据库如MySQL版、PolarDB、PostgreSQL、SQL Server和MariaDB等,NoSQL数据库如Redis、Tair、Lindorm和MongoDB
321 0
|
2月前
|
SQL 监控 关系型数据库
MySQL优化: CPU高 处理脚本 pt-kill脚本
MySQL优化: CPU高 处理脚本 pt-kill脚本
|
2月前
|
SQL 关系型数据库 数据库
数据库空间之谜:彻底解决RDS for SQL Server的空间难题
【8月更文挑战第16天】在管理阿里云RDS for SQL Server时,合理排查与解决空间问题是确保数据库性能稳定的关键。常见问题包括数据文件增长、日志文件膨胀及索引碎片累积。利用SQL Server的动态管理视图(DMV)可有效监测文件使用情况、日志空间及索引碎片化程度。例如,使用`sp_spaceused`检查文件使用量,`sys.dm_db_log_space_usage`监控日志空间,`sys.dm_db_index_physical_stats`识别索引碎片。同时,合理的备份策略和文件组设置也有助于优化空间使用,确保数据库高效运行。
59 2
|
2月前
|
存储 C# 关系型数据库
“云端融合:WPF应用无缝对接Azure与AWS——从Blob存储到RDS数据库,全面解析跨平台云服务集成的最佳实践”
【8月更文挑战第31天】本文探讨了如何将Windows Presentation Foundation(WPF)应用与Microsoft Azure和Amazon Web Services(AWS)两大主流云平台无缝集成。通过具体示例代码展示了如何利用Azure Blob Storage存储非结构化数据、Azure Cosmos DB进行分布式数据库操作;同时介绍了如何借助Amazon S3实现大规模数据存储及通过Amazon RDS简化数据库管理。这不仅提升了WPF应用的可扩展性和可用性,还降低了基础设施成本。
63 0
|
5月前
|
存储 缓存 关系型数据库
【如何选择Mysql服务器的CPU核数及内存大小】
【如何选择Mysql服务器的CPU核数及内存大小】
407 0
|
SQL 安全 关系型数据库
云数据库 RDS SQL Server 快速入门(二)
云数据库 RDS SQL Server 快速入门(二)
140 0
|
5月前
|
SQL 关系型数据库 数据库
阿里云数据库 RDS SQL Server版实战【性能优化实践、优点探析】
本文探讨了Amazon RDS SQL Server版在云数据库中的优势,包括高可用性、可扩展性、管理便捷、安全性和成本效益。通过多可用区部署和自动备份,RDS确保数据安全和持久性,并支持自动扩展以适应流量波动。可视化管理界面简化了监控和操作,而数据加密和访问控制等功能保障了安全性。此外,弹性计费模式降低了运维成本。实战应用显示,RDS SQL Server版能有效助力企业在促销高峰期稳定系统并保障数据安全。阿里云的RDS SQL Server版还提供了弹性伸缩、自动备份恢复、安全性和高可用性功能,进一步优化性能和成本控制,并与AWS生态系统无缝集成,支持多种开发语言和框架。
337 2
|
5月前
|
SQL 关系型数据库 分布式数据库
在PolarDB中,如果慢SQL导致了CPU升高,进而又产生了更多的慢SQL
【2月更文挑战第22天】在PolarDB中,如果慢SQL导致了CPU升高,进而又产生了更多的慢SQL
45 1
|
SQL 关系型数据库 MySQL
慢sql导致mysql服务器的cpu飙升到100%
慢sql导致mysql服务器的cpu飙升到100%
592 0
|
11月前
|
SQL 关系型数据库 MySQL
关于mysql的cpu占用高的问题
关于mysql的cpu占用高的问题