SQL Server 性能优化之——系统化方法提高性能

本文涉及的产品
云数据库 RDS SQL Server,基础系列 2核4GB
RDS SQL Server Serverless,2-4RCU 50GB 3个月
推荐场景:
简介: 原文 http://www.cnblogs.com/BoyceYang/archive/2013/06/15/3138142.html 阅读导航 1. 概述 2. 规范逻辑数据库设计 3. 使用高效索引设计 4. 使用高效的查询设计 5. 使用技术分析低性能 6. 总结   1. 概述 在比较大的范围内找出能够大幅提高性能的区域,并且专注于分析这个区域,这是最有效的优化SQL Server性能的方式。

原文 http://www.cnblogs.com/BoyceYang/archive/2013/06/15/3138142.html

阅读导航

1. 概述

2. 范逻辑数据库设计

3. 使用高效索引设计

4. 使用高效的查询设计

5. 使用技术分析低性能

6. 总结

 

1. 概述

在比较大的范围内找出能够大幅提高性能的区域,并且专注于分析这个区域,这是最有效的优化SQL Server性能的方式。否则,大量的时间和精力可能被浪费在不能提高很大性能的区域。在这里并没有讨论关于多用户并发所带来的性能问题。

能获得最大性能提高的区域一般是:逻辑数据库设计,索引设计,查询设计。然而,最大的性能问题经常由于缺乏这些方面研究的原因造成。如果性能是被列为一个需要关注的问题,聪明的做法是首先专注于这些方面, 因为性能的大幅提高经常是用相对较小的时间精力完成。

下面开始进入正题。

2. 规范逻辑数据库设计

合理规范性的逻辑数据库设计可以产生最佳性能。大量的窄表是标准数据库的特性。少量的宽表是非标准数据的特性。高度标准数据库通常关联着复杂的表的 联合查询,这个可能损害数据库的性能。不管怎么样,SQL Server优化在快速查询、高效联接、可用有效索引方面是非常有效的,下面是规范化的好处:

  • 如果是窄表,应该加快排序和创建索引
  • 如果是宽表,最好使用聚集索引
  • 索引往往是越窄的表,越应该精确
  • 更好的利用段去控制表的物理空间
  • 每个表的索引越少,对提高UPDATE操作的性能越有帮助
  • 越少的NULLs列,越少的冗余数据,越能增加数据库的紧凑性

对于SQL Server,标准化将有助于提升而不是损害性能。随着标准化的提高,因此需要一定数量并且复杂的表连接来检索数据。只要标准化不会导致很多查询出现超过四个表的连接,就应进行标准化进程。

如果逻辑数据库设计已经固定,并且不可能进行整体重新设计,而且通过研究表明一个大表存在性能瓶颈,在这样的情况下,可以有选择性的对这个大表进行 标准化。如果过存储过程进行访问数据,那么架构的改变不会影响应用程序。如果不是这样,可以通过创建视图来隐藏这种改变,因为视图可以产生单个表的错觉。

3. 使用高效索引设计

不像很多非关系系统,不把关系索引考虑作为逻辑数据库设计的一部分。索引能被删除、添加和更新,除了影响性能以外,不会影响数据库架构或者应用程序 设计。实现良好的SQL Server性能,高效索引设计是非常重要的。由于这些原因,不要犹豫展示不同索引带来的性能改变吧。

大多数情况下,优化器将可靠地选择最高效的索引。所有的策略应该提供良好的索引优化的选择,相信这是正确的决定。这可以在多种情况下,减少分析时间并且能提供良好的性能。

接下来介绍索引。检查SQL查询的WHERE子句,因为这个是优化的主要焦点。在WHERE子句中列出的列都有可能成为索引的备选。假如有太多的语句需要检查,挑选有代表性的一组,或者仅仅是速度缓慢的那组。

最好使用窄索引。窄索引比混合索引和复合索引更加高效。窄索引每页行越多,索引级别应该越低,这样才能提高性能。SQL Server优化只是维护统计数据在复合索引最重要的列上。因此,如果复合索引的第一列可选择性很差,那么就不优化这个索引。

优化器可以快速、高效的分析成百上千的索引和表连接的可能性。有更多的窄索引提供给优化器,优化器就会有更多可能的选择,这对性能很有帮助。有较少的宽索引、复合索引提供给优化程器,优化器只有很少选择的可能性,这对性能会有影响。

索引数目太多性能可能会降低,因为涉及到更新这些索引的开销。然而,大量的面向更新操作需要更多的读操作,而不是写操作。假如,尝试新索引时提高了性能,那就不要犹豫,使用这个所以吧。

使用聚集索引。适当的使用聚集索引可以极大的提升性能。甚至聚集索引可以使UPDATE和DELETE操作提速,因为这些操作需要很多读操作。可能 每个表只有单一的聚集索引,因此,要灵活地利用这个索引。返回行数的查询或者涉及一个范围值的查询都是一个可能被聚集索引提高性能的候选。

例子:

   1:  SELECT * FROM PHONEBOOK
   2:   
   3:  WHERE NAME = ‘李雷’
   4:   
   5:  SELECT * FROM MEMERTABLE
   6:   
   7:  WHERE MEMBER_NO > 5000 AND MEMBER_NO < 6000

通过约束,上面提到的NAME和MEMBER_NO列,对于非聚集索引可能不是一个适合的候选。尽量在返回很少行数据的列上使用非聚集索引。

检查列数据的唯一性。这样将帮助决定,什么样的列作为聚集索引、非聚集索引、无需索引的备选。

查询语句检查数据的唯一性,例子:

   1:  SELECT COUNT (DISTINCT COLNAME) FROM TABLENAME

这个语句将返回一个列中不重复值的数量。在表中比较这个数量和总的行数。在一个一万行的表中,5000个不重复值的列对于非聚集索引可能是一个很好 的备选,20个不重复值的列可能最适合聚集索引,3个不重复值的列根本就不需要使用索引。这些仅仅是个例子,不是一成不变的规则。记住把索引建立在WHERE查询子句列出的每一个列上。

在索引选择时,查询语句返回行数也是一个重要的因素。优化器会考虑非聚集索引花费在每个返回行至少一页I/O的成本。以这样的速度,并不需要很长的时间就可以变得更高效的扫描整个表。理性对待结果集,要么限制结果集的大小,要么使用聚集索引定位巨大结果集。

4. 使用高效的查询设计

某些查询语句本身是资源密集型。这关系到基本数据和索引在大多数RDBMSs关系型数据库管理系统)的常见问题,而不是在特定SQL Server中。它 们并不低效,优化器将会尽可能实现高效的查询语句。然而,它们是资源密集型,SQL面向结果集的本性可能使它们出现低效。优化器的智能程度不可能消除这些 结构的固有资源成本。和更加简单的语句相比,他们内在的消耗更大。尽管SQL Server使用最优的访问计划,但还是会有限制的。

例如:

  • 大型结果集
  • IN和OR语句
  • 高度非唯一WHERE子句
  • !=(不等于)
  • 某些列函数,比如SUM
  • WHERE子句中的表达式或数据转换
  • WHERE子句的局部变量

有些因素可能需要使用这些查询语句结构。如果优化器可以限制结果集,然后再应用资源密集型的查询,那么他们的影响将会减少。

例如:

   1:  低效: SELECT SUM(SALARY) FROM TABLE
   2:   
   3:  高效: SELECT SUM(SALARY) FROM TABLE WHERE ZIP='98052'
   4:   
   5:  低效: SELECT * FROM TABLE WHERE LNAME=@VAR
   6:   
   7:  高效: SELECT * FROM TABLE WHERE LNAME=@VAR AND ZIP='98052'

在第一个例子中,SUM操作使用索引并不能使其加速。每行都需要被读和求和。设想在ZIP列有一个索引,优化器将可能使用这个来初始限制结果集,然后再应用SUM函数。这可能会更快。

在第二个例子中,局部变量直到运行时才被赋值。然而优化器无法拖延到运行时才选择访问计划,必须在编译时进行选择。然而,在编译期间,当生成访问计 划时,@VAR的值还不能确定,因此不能使用输入的@VAR作为索引选择。可以使用AND子句对结果集进行限制。使用存储过程是一个可选技术,这样可以传 递参数,将参数赋值给存储过程中@VAR值。

大多数RDBMSs的大型结果集是很耗费性能。可以尝试不返回大型结果集到客户端作为最终数据选择。允许数据库后台执行预定函数,并限定结果集的大小,这种做法效率很高。

5. 使用技术分析低性能

首先分离查询,或者分离比较慢的查询。当有少数SQL查询速度慢,经常表现为整个应用程序速度慢。对能够显示生成SQL的工具,使用这个工具的诊断或调试模式记录生成的SQL。使用嵌入式SQL工具会更加简单。分离速度慢的查询之前,先做一下下面的步骤:

  • 单独运行疑似速度慢的语句,使用工具(例如ISQL、SAF)验证实际上是不是很慢。
  • 使用SET STATISTICS IO ON,检查语句的I/O消耗和已选择的访问计划。优化器的目的是最小的I/O。记录逻辑I/O。以这个为基准测量改进成果
  • 如果查询涉及视图或者存储过程,从中提取这些语句并单独运行。当尝试使用不同索引时,访问计划是可以改变。
  • 有些表可以生成I/O作为触发器运行,这时要注意可能和这些表有关系的触发器和视图。
  • 检查速度慢的语句表的索引。利用之前列出的技术检查是否有更好的索引,如果有必要就修改。
  • 改变索引后重新运行查询,并观察I/O和访问计划的改变。
  • 改进工作完成,运行主程序看看所有的性能是不是有所提升。

检查程序的I/O或CPU限制的行为。通常这个对确定查询语句是否在I/O或CPU临界状态很有用。我们要花费精力在提高真正的性能瓶颈上,例如, 如果一个查询是CPU临界状态,就算增加更多的内存给SQL Server也太可能有性能的提高,当然更多的内存还是能提高缓存命中率。下面的步骤是检查SQL Server的I/O和CPU临界状态:

  • 使用OS/2 CPU监控程序。
  • 当运行查询时,如果CPU使用率保持很高(>70%),这表明是CPU临界状态。
  • 当运行查询时,如果CPU使用率保持很低(<50%),这表明也是CPU临界状态。
  • 使用STATISTICS IO比较CPU利用率信息

6. 总结

SQL Server能够提高大型数据库的性能。要挖掘这个性能的潜力,需要有高效的数据库设计、索引和查询语句。这些区域是最可能成为捕获到重大性能提升的备选区域。尝试使用索引是一个很特别建议。通常,系统化的方法在分析性能问题上,不仅投入时间少,而且能产生巨大性能提升。

 

在此特别感谢@守望dreamstar对本篇文章的支持。

相关实践学习
使用SQL语句管理索引
本次实验主要介绍如何在RDS-SQLServer数据库中,使用SQL语句管理索引。
SQL Server on Linux入门教程
SQL Server数据库一直只提供Windows下的版本。2016年微软宣布推出可运行在Linux系统下的SQL Server数据库,该版本目前还是早期预览版本。本课程主要介绍SQLServer On Linux的基本知识。 相关的阿里云产品:云数据库RDS&nbsp;SQL Server版 RDS SQL Server不仅拥有高可用架构和任意时间点的数据恢复功能,强力支撑各种企业应用,同时也包含了微软的License费用,减少额外支出。 了解产品详情:&nbsp;https://www.aliyun.com/product/rds/sqlserver
目录
相关文章
|
22天前
|
存储 SQL 关系型数据库
【MySQL调优】如何进行MySQL调优?从参数、数据建模、索引、SQL语句等方向,三万字详细解读MySQL的性能优化方案(2024版)
MySQL调优主要分为三个步骤:监控报警、排查慢SQL、MySQL调优。 排查慢SQL:开启慢查询日志 、找出最慢的几条SQL、分析查询计划 。 MySQL调优: 基础优化:缓存优化、硬件优化、参数优化、定期清理垃圾、使用合适的存储引擎、读写分离、分库分表; 表设计优化:数据类型优化、冷热数据分表等。 索引优化:考虑索引失效的11个场景、遵循索引设计原则、连接查询优化、排序优化、深分页查询优化、覆盖索引、索引下推、用普通索引等。 SQL优化。
171 15
【MySQL调优】如何进行MySQL调优?从参数、数据建模、索引、SQL语句等方向,三万字详细解读MySQL的性能优化方案(2024版)
|
11天前
|
SQL 关系型数据库 MySQL
创建包含MySQL和SQLServer数据库所有字段类型的表的方法
创建一个既包含MySQL又包含SQL Server所有字段类型的表是一个复杂的任务,需要仔细地比较和转换数据类型。通过上述方法,可以在两个数据库系统之间建立起相互兼容的数据结构,为数据迁移和同步提供便利。这一过程不仅要考虑数据类型的直接对应,还要注意特定数据类型在不同系统中的表现差异,确保数据的一致性和完整性。
22 4
|
9天前
|
SQL 存储 UED
系统里这个同时查冷热表的sql,动动手指,从8s降到3s
系统将交易数据按交易时间分为热表(最近3个月)和冷表(3个月前)。为保证用户体验,当企业门户端查询跨越冷热表时,尤其针对大客户,查询性能优化至关重要。以下是程序的SQL查询语句及其优化版本。
21 1
|
23天前
|
SQL 机器学习/深度学习 自然语言处理
Text-to-SQL技术演进 - 阿里云OpenSearch-SQL在BIRD榜单夺冠方法剖析
本文主要介绍了阿里云OpenSearch在Text-to-SQL任务中的最新进展和技术细节。
|
2月前
|
SQL 数据处理 数据库
专坑同事的SQL写法:性能杀手揭秘
【8月更文挑战第29天】在日常的数据库开发与维护工作中,编写高效、清晰的SQL语句是每位数据工程师的必修课。然而,不当的SQL编写习惯不仅能降低查询效率,还可能给同事的工作带来不必要的困扰。今天,我们就来揭秘八种常见的“专坑同事”SQL写法,助你避免成为那个无意间拖慢整个团队步伐的人。
30 1
|
2月前
|
前端开发 C# 设计模式
“深度剖析WPF开发中的设计模式应用:以MVVM为核心,手把手教你重构代码结构,实现软件工程的最佳实践与高效协作”
【8月更文挑战第31天】设计模式是在软件工程中解决常见问题的成熟方案。在WPF开发中,合理应用如MVC、MVVM及工厂模式等能显著提升代码质量和可维护性。本文通过具体案例,详细解析了这些模式的实际应用,特别是MVVM模式如何通过分离UI逻辑与业务逻辑,实现视图与模型的松耦合,从而优化代码结构并提高开发效率。通过示例代码展示了从模型定义、视图模型管理到视图展示的全过程,帮助读者更好地理解并应用这些模式。
58 0
|
2月前
|
Java XML Maven
跨越时代的飞跃:Struts 2 升级秘籍——从旧版本无缝迁移到最新版,焕发应用新生!
【8月更文挑战第31天】随着软件技术的发展,Struts 2 框架也在不断更新。本文通过具体案例指导开发者如何从旧版平滑升级到 Struts 2.6.x。首先更新 `pom.xml` 中的依赖版本,并执行 `mvn clean install`。接着检查 `struts.xml` 配置,确保符合新版本要求,调整包扫描器等设置。审查 Action 类及其注解,检查配置文件中的弃用项及插件。更新自定义拦截器实现,并验证日志配置。最后,通过一系列测试确保升级后的系统正常运行。通过这些步骤,可以顺利完成 Struts 2 的版本升级,提升应用的安全性和性能。
94 0
|
2月前
|
SQL 存储 数据库
|
2月前
|
SQL 数据处理 数据库
SQL正则表达式应用:文本数据处理的强大工具——深入探讨数据验证、模式搜索、字符替换等核心功能及性能优化和兼容性问题
【8月更文挑战第31天】SQL正则表达式是数据库管理和应用开发中处理文本数据的强大工具,支持数据验证、模式搜索和字符替换等功能。本文通过问答形式介绍了其基本概念、使用方法及注意事项,帮助读者掌握这一重要技能,提升文本数据处理效率。尽管功能强大,但在不同数据库系统中可能存在兼容性问题,需谨慎使用以优化性能。
35 0
|
2月前
|
SQL 数据管理 关系型数据库
SQL与云计算:利用云数据库服务实现高效数据管理——探索云端SQL应用、性能优化、安全性与成本效益,为企业数字化转型提供全方位支持
【8月更文挑战第31天】在数字化转型中,企业对高效数据管理的需求日益增长。传统本地数据库存在局限,而云数据库服务凭借自动扩展、高可用性和按需付费等优势,成为现代数据管理的新选择。本文探讨如何利用SQL和云数据库服务(如Amazon RDS、Google Cloud SQL和Azure SQL Database)实现高效的数据管理。通过示例和最佳实践,展示SQL在云端的应用、性能优化、安全性及成本效益,助力企业提升竞争力。
45 0
下一篇
无影云桌面