理解SQL Server统计信息

本文涉及的产品
RDS SQL Server Serverless,2-4RCU 50GB 3个月
推荐场景:
云数据库 RDS SQL Server,基础系列 2核4GB
简介:

英文原文:

http://blog.idera.com/sql-server/understanding-sql-server-statistics/

 

“统计信息提供了对你听到或看到的信息作出智能反应的工具”-- David Lane,2003

 

使用Idera的免费工具识别过期的SQL Server统计信息 – SQL Update Statistics!

 

如果有一个即将到来的选举,你正在竞选并准备带着传单走遍乡村和城市,你想知道大概要带多少传单。

 

如果你是一个运动队的教练,在决定谁、什么时候参加比赛、对谁之前,你想了解选手的状态。你常玩一个配对游戏,即使你有20个选手,你可能允许同时玩5次,你想知道你的哪位选手最匹配其他队伍的球员清单。你不想在比赛时一个个看(表扫描),你想基于他们的统计信息知道,谁最适合。

 

就像选举候选人和运动队教练,SQL Server尝试使用统计信息在它的查询优化中“智能感知”。了解到行数、页密度、直方图,或可用索引帮助SQL Server优化器更精准判断它如何最好的获取数据。有一个通常的误解是,如果你有索引,SQL Server会在查询中使用索引获取记录。不一定。如果你在小于90%的值为“Vancouver”的City列上创建索引,SQL Server如果知道这些统计信息,最可能表扫描而不是使用索引。

 

大多数时候,我们最起码要保持统计信息更新(基于你的配置),但是更好的理解统计信息是为了帮助我们更好的理解SQL Server优化。

 

如果创建统计信息?

 

统计信息可以以不同的方式创建:

n 统计信息在创建每个索引的时候自动创建。

clip_image002c

n 如果数据库将自动创建统计信息设置为启用,那么SQL Server会对查询中使用的非索引列自动创建统计信息。

clip_image004

n CREATE STATISTICS语句。

clip_image006

 

统计信息是什么样的?

 

如果你好奇,有很多方法你可以看到统计信息是怎样的。

方法1 – 你可以在SSMS中“Statistics”节点,右击属性,然后选择“Details”。下面是一个从我的数据库的一个表收集的统计和直方图的示例。

clip_image008

方法2 – 你可以使用DBCC SHOW_STATISTICS WITH HISTOGRAM

clip_image010

直方图是可视化表中数据分布的很棒方式。

 

统计信息如何更新?

 

在SQL Server中的默认设置是自动创建和自动更新统计信息。

clip_image012

 

注意Auto Update statistics有两个选项。

Auto Update Statistics意思是,如果你有一个查询而统计信息陈旧,SQL Server会在生成执行计划前先更新统计信息。

Auto Update Statistics Asynchronously意思是,如果有一个查询而统计信息陈旧,SQL Server使用陈旧的统计信息去生成执行计划,然后再更新统计信息。

 

然而,Idera提供了很酷的免费工具,简化了查找和更新过期SQL Server表统计信息的过程,使用UI界面易于理解。在这里可以找到:

https://www.idera.com/productssolutions/freetools/sql-server-statistics

 

我们如何知道统计信息正在被使用?

 

当生成查询的执行计划时,你可以做好如下检查:

检查“Actual Number of Rows”和“Estimated Number of Rows”。

如果数量(持续的)相当接近,很有可能你的统计信息是更新的,并被优化器用于查询。如果不是,你应该重新检查统计信息创建或更新的频率。

 

我们应该如何设置该配置?

 

可能的情况是当你正在对一个表做大量更新时,你想临时禁用统计信息更新,你不想被自动更新减慢执行速度。

然而,对大多数情况,你会去保持设置:

Auto create statistics

Auto update statistics

 

参考:

Rob Carrol. http://blogs.technet.com/b/rob/archive/2008/05/16/sql-server-statistics.aspx

Elisabeth Redei有关于SQL Server统计信息的3篇出色系列文章:

http://sqlblog.com/blogs/elisabeth_redei/archive/2009/03/01/lies-damned-lies-and-statistics-part-i.aspx

http://sqlblog.com/blogs/elisabeth_redei/archive/2009/08/10/lies-damned-lies-and-statistics-part-ii.aspx

http://sqlblog.com/blogs/elisabeth_redei/archive/2009/12/17/lies-damned-lies-and-statistics-part-iii-sql-server-2008.aspx

 

关于统计信息的出色的书籍:

n Apress. Grant Fritchey & Sajal Dam. 《SQL Server 2008查询性能调优精华》

n RedGate. Holger Schmeling. 《SQL Server 统计信息》

 

更多资源:

白皮书 – Waiting on Wait Stats

Webcast – What Are You Waiting For?

Idera免费性能监控工具 – SQL check

Idera性能调优产品试用版 – SQL doctor

 

译者推荐:

在SQL Server 2008中被查询优化器使用的统计信息

https://msdn.microsoft.com/en-us/library/dd535534%28SQL.100%29.aspx


















本文转自UltraSQL51CTO博客,原文链接: http://blog.51cto.com/ultrasql/1736231,如需转载请自行联系原作者


相关实践学习
使用SQL语句管理索引
本次实验主要介绍如何在RDS-SQLServer数据库中,使用SQL语句管理索引。
SQL Server on Linux入门教程
SQL Server数据库一直只提供Windows下的版本。2016年微软宣布推出可运行在Linux系统下的SQL Server数据库,该版本目前还是早期预览版本。本课程主要介绍SQLServer On Linux的基本知识。 相关的阿里云产品:云数据库RDS SQL Server版 RDS SQL Server不仅拥有高可用架构和任意时间点的数据恢复功能,强力支撑各种企业应用,同时也包含了微软的License费用,减少额外支出。 了解产品详情: https://www.aliyun.com/product/rds/sqlserver
相关文章
|
4月前
|
XML SQL 数据格式
XML动态sql查询当前时间之前的信息报错
XML动态sql查询当前时间之前的信息报错
57 2
|
23天前
|
SQL Java
使用java在未知表字段情况下通过sql查询信息
使用java在未知表字段情况下通过sql查询信息
34 8
|
1月前
|
SQL 监控 关系型数据库
SQL语句当前及历史信息查询-performance schema的使用
本文介绍了如何使用MySQL的Performance Schema来获取SQL语句的当前和历史执行信息。Performance Schema默认在MySQL 8.0中启用,可以通过查询相关表来获取详细的SQL执行信息,包括当前执行的SQL、历史执行记录和统计汇总信息,从而快速定位和解决性能瓶颈。
|
1月前
|
SQL
开启慢SQL设置long_query_time=0.1为啥会统计的sql却存在小于100毫秒的sql
开启慢SQL设置long_query_time=0.1为啥会统计的sql却存在小于100毫秒的sql
33 1
|
3月前
|
SQL Java
使用java在未知表字段情况下通过sql查询信息
使用java在未知表字段情况下通过sql查询信息
37 1
|
2月前
|
SQL 存储 关系型数据库
mysql 数据库空间统计sql
mysql 数据库空间统计sql
50 0
|
3月前
|
关系型数据库 MySQL 网络安全
5-10Can't connect to MySQL server on 'sh-cynosl-grp-fcs50xoa.sql.tencentcdb.com' (110)")
5-10Can't connect to MySQL server on 'sh-cynosl-grp-fcs50xoa.sql.tencentcdb.com' (110)")
|
4月前
|
SQL 流计算
Flink SQL 在快手实践问题之由于meta信息变化导致的state向前兼容问题如何解决
Flink SQL 在快手实践问题之由于meta信息变化导致的state向前兼容问题如何解决
51 1
|
5月前
|
SQL 存储 监控
SQL Server的并行实施如何优化?
【7月更文挑战第23天】SQL Server的并行实施如何优化?
133 13
|
4月前
|
SQL JSON Go
Go - 基于 GORM 获取当前请求所执行的 SQL 信息
Go - 基于 GORM 获取当前请求所执行的 SQL 信息
72 3