复合非聚集索引——列顺序重要么?

简介:

单例查找(Singleton Lookups)

当在你的表上有进行单例查找的查询时,在复合非聚集索引里列的顺序真的不重要。假设下列查询:

-- Without a supporting Non-Clustered Index we have to scan the complete Clustered Index
SELECT AddressID FROM Person.Address
WHERE StateProvinceID = 79 AND City = 'Bothell'
GO

现在你可以在StateProvinceIDCity,或CityStateProvinceID创建非聚集索引:

复制代码
-- Create a supporting Non-Clustered Index
CREATE NONCLUSTERED INDEX idx_Test ON Person.Address(StateProvinceID, City)
GO

-- SQL Server performs a Non-Clustered Index Seek operation in combination with a Seek Predicate
SELECT AddressID FROM Person.Address
WHERE StateProvinceID = 79 AND City = 'Bothell'
GO

-- Change the column ordering
CREATE NONCLUSTERED INDEX idx_Test ON Person.Address(City, StateProvinceID)
WITH (DROP_EXISTING = ON)
GO

-- The column ordering doesn't matter in the Non-Clustered Index
SELECT AddressID FROM Person.Address
WHERE StateProvinceID = 79 AND City = 'Bothell'
GO
复制代码

这里非聚集索引里的列的顺序真的不重要,因为SQL Server在执行计划里直接进行非聚集索引查找操作(在与查找谓语集合里):

范围扫描(Range Scans)

当我们讨论在表上的范围扫描时,这里你检索一组数据,就是另一回事了。假设你执行下列查询:

SELECT AddressID FROM Person.Address
WHERE StateProvinceID BETWEEN 10 AND 12 AND City = 'Bothell'
GO

这次,支持的非聚集索引,你有2个方法:

  • StateProvinceID和City列上的非聚集索引
  • City和StateProvinceID列上的非聚集索引

我们先用第一个方法:

-- Create a supporting Non-Clustered Index
CREATE NONCLUSTERED INDEX idx_Test ON Person.Address(StateProvinceID, City)
GO

这个情况下,如你在执行计划里所见,SQL在StateProvinceID列上对查询进行非聚集索引查找操作,对于City列要计算剩余谓语的值:

这真的不是个完美的执行计划,因为你读取了比你请求更多的数据。但有基于StateProvinceID列上的排序作为引导列, City作为随后列,这是唯一可能的行为,如你从下图所见:

现在我们尝试交换下列来创建非聚集索引:City作为引导列,StateProvinceID作为第二列:

复制代码
-- Change the column ordering in the Non-Clustered Index
CREATE NONCLUSTERED INDEX idx_Test ON Person.Address(City, StateProvinceID)
WITH (DROP_EXISTING = ON)
GO

-- Non-Clustered Index Seek on StateProvinceID *without* a Residual Predicate on column City
SELECT AddressID FROM Person.Address
WHERE StateProvinceID BETWEEN 10 AND 12 AND City = 'Bothell'
GO
复制代码

当你再次执行你的查询,你会看到SQL Server再次执行了非聚集索引查找操作。但这次对于你的查询,“没有”剩余谓语(Residual Predicate)。

因为你物理上读取的刚好是你逻辑上请求的数据。但这个现在这么可能呢?那就看看下面的图:在非聚集索引里数据是如何排序的:

如你所见,现在的数据按City预先排,在每个City组里,你会有在StateProvinceID列的排序。因此你可以直接获得逻辑请求的数据——不用进一步剩余谓语(Residual Predicate)的值计算就可以返回值。

小结

当你要进行范围扫描时——在复合非聚集索引里列的顺序重要的!在多次交流会上我经常提到:SQL Server里的一切几户都与索引有关,索引本身就会预排序数据!没别的!理解SQL Server是否可以直接查找逻辑请求的数据,你也需要在你的心中想象下如何使如何预排序的,你如何通过有效预排序数据来访问它。



本文转自Woodytu博客园博客,原文链接:http://www.cnblogs.com/woodytu/p/5622870.html,如需转载请自行联系原作者

相关文章
|
安全 Java 数据安全/隐私保护
SpringSecurity6从入门到实战之引言和基本概念
《SpringSecurity6从入门到实战》介绍了Spring Security这一强大的Java安全框架,主要用于保护Spring应用程序的安全。它提供认证和授权功能,支持多种认证方式,并具备高度可定制性。文章阐述了权限管理的重要性,包括用户认证(验证用户身份)和用户授权(控制用户访问权限)。相较于其他如Shiro和Sa-Token的安全框架,Spring Security因与Spring生态的深度整合及对OAuth2的支持,常成为微服务项目的选择。
|
SQL 测试技术 OLAP
现代化实时数仓 SelectDB 再次登顶 ClickBench 全球数据库分析性能排行榜!
现代化实时数仓 SelectDB 在时隔两年后再次完成登顶,在全部近百款数据库和数十种机型中,性能位居总榜第一!
736 1
现代化实时数仓 SelectDB 再次登顶 ClickBench 全球数据库分析性能排行榜!
|
安全 Linux 网络安全
Kali渗透测试:远程控制程序基础
Kali渗透测试:远程控制程序基础
271 0
Kali渗透测试:远程控制程序基础
|
监控 Linux 测试技术
在Linux中, 如何进行内存泄漏的诊断?
在Linux中, 如何进行内存泄漏的诊断?
|
JavaScript
vue 农历日期转公历日期(含插件 js-calendar-converter 使用教程)
vue 农历日期转公历日期(含插件 js-calendar-converter 使用教程)
583 0
|
XML JSON API
LangChain之各个输出解析器的使用
输出解析器负责获取 LLM 的输出并将其转换为更合适的格式。借助LangChain的输出解析器重构程序,使模型能够生成结构化回应,并可以直接解析这些回应。
494 1
|
关系型数据库 MySQL 数据挖掘
Mysql与StarRocks语法上的不同
Mysql与StarRocks语法上的不同
|
数据可视化 计算机视觉
用回归和主成分分析PCA 回归交叉验证分析预测城市犯罪率数据
用回归和主成分分析PCA 回归交叉验证分析预测城市犯罪率数据
|
数据采集 存储 SQL
【开源项目推荐】OpenMetadata——基于开放元数据的一体化数据治理平台
【开源项目推荐】OpenMetadata——基于开放元数据的一体化数据治理平台
1998 3