Join的表顺序

本文涉及的产品
RDS SQL Server Serverless,2-4RCU 50GB 3个月
推荐场景:
云数据库 RDS SQL Server,基础系列 2核4GB
简介:

在今天的文章里,我想谈下SQL Server里一个非常有趣的话题:在表联接里,把表指定顺序的话是否有意义?每次我进行查询和性能调优的展示时,大家都会问我他们是否应该把联接中的表指定下顺序,是否会帮助查询优化器得出一个更好性能的执行计划。我们来看下这个重要又有趣的问题。

合并联接(Inner Joins)

假设在AdventureWorks数据库里,你要在Sales.SalesOrderHeader表和Sales.SalesOrderDetail表之间做一个内联接:

复制代码
 1 USE AdventureWorks
 2 GO
 3 
 4 -- Returns for each SalesOrderHeader record all associated SalesOrderDetail records
 5 -- SQL Server performs a Merge Join, because both tables are phyiscally sorted
 6 -- by the column "SalesOrderID".
 7 SELECT
 8     h.SalesOrderID,
 9     h.CustomerID,
10     d.SalesOrderDetailID,
11     d.ProductID,
12     d.LineTotal
13 FROM Sales.SalesOrderHeader h
14 JOIN Sales.SalesOrderDetail d
15 ON h.SalesOrderID = d.SalesOrderID
16 ORDER BY SalesOrderID
17 GO
复制代码

当我们查看结果的执行计划时,我们可以看到查询优化器选择了合并联接(Inner Join)作为物理联接运算符,Sales.SalesOrderHeader表作为合并联接的外联接。在执行计划里表的顺序和我们在逻辑T-SQL查询里的顺序是一样的。

现在的问题是,当我们在逻辑T-SQL查询里交换下2个表的顺序,执行计划会发生什么?我们来试下:

复制代码
 1 -- The logical ordering of the tables during an Inner Join
 2 -- doesn't matter. It's up to the Query Optimnizer to arrange
 3 -- the tables in the best order.
 4 -- This query produces the same execution plan as the previous one.
 5 SELECT
 6     h.SalesOrderID,
 7     h.CustomerID,
 8     d.SalesOrderDetailID,
 9     d.ProductID,
10     d.LineTotal
11 FROM Sales.SalesOrderDetail d
12 JOIN Sales.SalesOrderHeader h
13 ON d.SalesOrderID = h.SalesOrderID
14 ORDER BY SalesOrderID
15 GO
复制代码

但我们现在看结果的执行计划,我们发现很有意思:

在执行计划里没有任何改变!查询优化器选择了和刚才查询一样的物理执行计划。但为什么?答案非常简单:查询优化器总引用最小的表(基于我们的统计信息!)作为每个物理连接运算符(嵌套循环联接,合并联接,哈希匹配联接)的外联接表。因此在T-SQL查询里的表的逻辑顺序不会对查询优化器造成任何影响。按正确的顺序访问我们的表是查询优化器的职责。

在表A和表B之间的合并联接与表B和表A之间的合并联接是一样的。

外联接(Outer Join)

在外联接(left join,right join)里,表顺序会有啥影响?我们来看下面的查询,在Sales.Customer表和 Sales.SalesOrderHeader表之间进行左联接。

复制代码
 1 -- Execute the query with an Outer Join.
 2 -- Now we are also getting back customers that haven't placed orders.
 3 -- The left table is the preserving one, and missing rows from the right table are added with NULL values.
 4 -- SQL Server performs a "Merge Join (Left Outer Join)" in the execution plan.
 5 SELECT
 6     c.CustomerID,
 7     h.SalesOrderID
 8 FROM Sales.Customer c
 9 LEFT JOIN Sales.SalesOrderHeader h
10 ON c.CustomerID = h.CustomerID
11 GO
复制代码

当我们查看结果执行计划时,我们会看到查询优化器已经隐藏了我们的表顺序。

当然这次我们不能修改T-SQL语句里的表顺序,不然查询会返回错误的结果。但当我们在查询里切换下表会发生什么,不是左联接,我们用右联接。我们来试下:

复制代码
1 -- You can rewrite the query from above with a Right Outer Join when you swap the order
2 -- of the tables. This time you get back the same result (32166 rows).
3 SELECT
4     c.CustomerID,
5     h.SalesOrderID
6 FROM Sales.SalesOrderHeader h
7 RIGHT JOIN Sales.Customer c
8 ON c.CustomerID = h.CustomerID
9 GO
复制代码

当我们看执行计划时,我们再次看到没有任何改变:查询优化器转化右联接为左联接,重排了下表还是返回正确的结果。查询优化器的目标是使用最小表作为物理联接运算符的外表。因此在外联接里表的顺序也不会影响查询优化器。只要我们的统计信息是正确的,查询优化器总会选择正确的顺序。

在表A和表B之间的左联接与表B和表A之间的右联接是一样的。

小结:

在这篇文章里我们讨论对于联接,表的顺序是否会影响执行计划。如我们所见,这完全由查询优化器来决定选择优化的表顺序——基于统计信息。在合并联接里表顺序完全不影响,使用外联接的话,SQL Server可以通过切换左联接/右联接来重排表,还是获得正确的结果。



本文转自Woodytu博客园博客,原文链接:http://www.cnblogs.com/woodytu/p/5050366.html,如需转载请自行联系原作者

相关实践学习
使用SQL语句管理索引
本次实验主要介绍如何在RDS-SQLServer数据库中,使用SQL语句管理索引。
SQL Server on Linux入门教程
SQL Server数据库一直只提供Windows下的版本。2016年微软宣布推出可运行在Linux系统下的SQL Server数据库,该版本目前还是早期预览版本。本课程主要介绍SQLServer On Linux的基本知识。 相关的阿里云产品:云数据库RDS SQL Server版 RDS SQL Server不仅拥有高可用架构和任意时间点的数据恢复功能,强力支撑各种企业应用,同时也包含了微软的License费用,减少额外支出。 了解产品详情: https://www.aliyun.com/product/rds/sqlserver
相关文章
|
5月前
|
SQL Oracle 关系型数据库
各种JOIN的区别
各种JOIN的区别
175 2
|
8月前
|
SQL 数据库
SQL JOIN 子句:合并多个表中相关行的完整指南
SQL LEFT JOIN关键字返回左表(table1)中的所有记录以及右表(table2)中的匹配记录。如果没有匹配,则右侧的结果为0条记录。
357 0
|
8月前
|
SQL 数据库
SQL FULL OUTER JOIN 关键字:左右表中所有记录的全连接解析
SQL RIGHT JOIN关键字返回右表(table2)中的所有记录以及左表(table1)中的匹配记录。如果没有匹配,则左侧的结果为0条记录。
231 0
|
SQL Oracle 关系型数据库
SQL学习之使用order by 按照指定顺序排序或自定义顺序排序
我们通常需要根据客户需求对于查询出来的结果给客户提供自定义的排序方式,那么我们通常sql需要实现方式都有哪些,参考更多资料总结如下(不完善的和错误望大家指出): 一、如果我们只是对于在某个程序中的应用是需要按照如下的方式排序,我们只需在SQL语句级别设置排序方式:
753 0
|
SQL 算法 关系型数据库
Mysql使用left join连表查询时,因连接条件未加索引导致查询很慢
Mysql使用left join连表查询时,因连接条件未加索引导致查询很慢
186 0
|
SQL C++ Python
SQL高级查询技巧(两次JOIN同一个表,自包含JOIN,不等JOIN)
掌握了这些,就比较高级啦 Using the Same Table Twice 如下面查询中的branch字段 SELECT a.account_id, e.emp_id, b_a.name open_branch, b_e.
4667 0
|
索引
按顺序遍历表
按顺序遍历表
137 0
|
SQL 关系型数据库 MySQL
mysql使用 from两表查询与join两表查询区别
在mysql中,多表连接查询是很常见的需求,在使用多表查询时,可以from多个表,也可以使用join连接连个表这两种查询有什么区别?哪种查询的效率更高呢? 带着这些疑问,决定动手试试1.先在本地的mysql上先建两个表one和twoone表 CREATE TABLE `one` ( `id`.
5644 0
|
存储 索引 Go
对聚集表查询的时候,未显式指定排序列的时候,默认查询结果的顺序一定是按照聚集索引顺序排序的吗
原文:对聚集表查询的时候,未显式指定排序列的时候,默认查询结果的顺序一定是按照聚集索引顺序排序的吗 本文之外可参考另外一篇文章作为补充:http://www.cnblogs.com/wy123/p/6189100.
907 0