T-SQL基础(二)之关联查询

简介:

在上篇博文中介绍了T-SQL查询的基础知识,本篇主要介绍稍微复杂的查询形式。

表运算符

表运算符的作用是把为其提供的表作为输入,经过逻辑查询处理,返回一个表结果。SQL Server支持四个表运算符:JOIN、APPLY、PIVOT、UNPIVOT,其中JOIN是标准SQL中的运算符,APPLY、PIVOT和UNPIVOT是T-SQL的扩展。

JOIN:联接查询时使用

APPLY:用于FROM子句中,分为CROSS APPLYOUTER APPLY两种形式

PIVOT:用于行转列

UNPIVOT:用于列传行

联接查询

联接查询分为外联接、内联接、交叉联接,三者的区别在于如何应用逻辑查询处理阶段:

  • 交叉联接仅应用一个阶段——笛卡尔乘积;
  • 内联接应用两个阶段——笛卡尔乘积和基于谓词ON的筛选;
  • 外联结应用三个极端——笛卡尔乘积,基于谓词ON的筛选,添加外部行;

内部行 & 外部行

内部行指的是基于谓词ON与另一侧匹配的行,外部行则是未匹配的行,外部行用NULL进行填充。内联接结果集仅保留内部行,外联接结果集返回内部行和外部行。

笛卡尔乘积

将一个输入表的每一行与另一个表的所有行匹配,即,如果一张表有m行a列,另一张表n行b列,笛卡尔乘积后得到的表有m*n行,a+b列。由此可以看出,对于数据量较大的表进行关联的话,会得到一张数据量更大的表,会有可能造成内存溢出的。

以下是网络上关于笛卡尔乘积的解释:

在数学中,两个集合X和Y的笛卡儿积(Cartesian product),又称直积,表示为X × Y,第一个对象是X的成员而第二个对象是Y的所有可能有序对的其中一个成员。假设集合A=a, b,集合B=0, 1, 2,则两个集合的笛卡尔积为(a, 0), (a, 1), (a, 2), (b, 0), (b, 1), (b, 2)。类似的例子有,如果A表示某学校学生的集合,B表示该学校所有课程的集合,则A与B的笛卡尔积表示所有可能的选课情况。A表示所有声母的集合,B表示所有韵母的集合,那么A和B的笛卡尔积就为所有可能的汉字全拼。

举例如下:

USE WJChi;

SELECT * FROM dbo.UserInfo;
SELECT * FROM dbo.UAddress;

SELECT * 
FROM dbo.UserInfo 
CROSS JOIN dbo.UAddress;

得到结果集如下:

交叉联接

SQL中使用CROSS JOIN语句进行交叉联接查询,在逻辑处理上,交叉联接是最为简单的联接类型,它只获取表的笛卡尔乘积。

交叉联接两种写法:

USE WJChi;

-- 使用CROSS JOIN,推荐使用这种方式
SELECT * 
FROM dbo.UserInfo 
CROSS JOIN dbo.UAddress;

-- 不使用CROSS JOIN
SELECT * 
FROM dbo.UserInfo,dbo.UAddress;

内联接

SQL中使用INNER JOIN...ON...语句进行内联接查询,INNER关键字可选。内联接的逻辑处理分为两步:

  • 生成笛卡尔乘积
  • 根据谓词ON对笛卡尔乘积进行筛选

与交叉联接一样,内联接有两种写法:

USE WJChi;

-- 使用JOIN,推荐使用这种方式
SELECT * 
FROM dbo.UAddress
JOIN dbo.UserInfo 
ON UserInfo.UAddressId = UAddress.Id;

-- 不使用JOIN,与交叉联接类似,但比交叉联接多了WHERE条件
SELECT * 
FROM dbo.UAddress,dbo.UserInfo 
WHERE UserInfo.UAddressId = UAddress.Id;

外联接

外联接分为左外联接:LEFT OUT JOIN、右外联接:RIGHT OUT JOIN和全联接:FULL OUT JOIN,其中,OUT关键字是可选的。相比于交叉联接和内联接,外联接则最为复杂。外联接逻辑处理分为三步:

  1. 获取表的笛卡尔乘积
  2. 根据谓词ON对笛卡尔乘积进行筛选
  3. 添加外部行数据到结果集中
LEFT JOIN & RIGHT JOIN

LEFT JOIN获取的结果集中保留了左表(LEFT JOIN左侧的表)中的所有数据,及右表中满足筛选条件的数据。右表中不满足筛选条件的空行(外部行)则用NULL值填充。

RIGHT JOINLEFT JOIN作用相反。

示例代码如下,表UserInfo中有4条数据,表UAddress中有三条数据:

USE WJChi;

SELECT * 
FROM dbo.UAddress
LEFT JOIN dbo.UserInfo 
ON UserInfo.UAddressId = UAddress.Id;

SELECT * 
FROM dbo.UAddress
RIGHT JOIN dbo.UserInfo 
ON UserInfo.UAddressId = UAddress.Id;

查询结果如下:

FULL JOIN

FULL JOIN的结果是取LEFT JOINRIGHT JOIN查询结果集的并集

USE WJChi;

SELECT * 
FROM dbo.UAddress
FULL JOIN dbo.UserInfo 
ON UserInfo.UAddressId = UAddress.Id;

查询结果如下:

ON & WHERE

前面说到:内联接结果集仅保留内部行,外联接结果集返回内部行和外部行。换句话说,外联接中ON子句的作用是进行表之间关联,如果外联接需要对结果集做进一步的筛选的话不能使用ON...AND...语句,而要使用WHERE条件。示例如下:

USE WJChi;

-- 内联接使用ON...AND...筛选数据
SELECT * 
FROM dbo.UserInfo AS UI
JOIN dbo.UAddress AS UA
ON UA.Id = UI.UAddressId 
-- 获取Name为xfh的数据
AND UI.Name='xfh';

-- 外联接使用ON...AND...筛选数据
SELECT * 
FROM dbo.UserInfo AS UI
LEFT JOIN dbo.UAddress AS UA
ON UA.Id = UI.UAddressId 
-- 获取Name为xfh的数据,无效
AND UI.Name='xfh';

-- 外联接使用WHERE对结果集进行筛选
SELECT * 
FROM dbo.UserInfo AS UI
LEFT JOIN dbo.UAddress AS UA
ON UA.Id = UI.UAddressId 
WHERE UI.Name='xfh';

输出结果如下:

复合联接

复合联接是指谓词涉及表中多个字段的联接,即,关联条件使用ON...AND...的形式。

自联接

同一张表的多个实例之间相互联接,称为自联接。所有基本联接类型(内联接、外联接、交叉联接)支持。

USE WJChi;

SELECT * 
FROM dbo.UserInfo AS U1 
CROSS JOIN dbo.UserInfo AS U2;

自联接中要为表名指定别名,否则结果集中的列名都将不明确。

相等联接 & 不等联接

当联接条件使用相等运算符时称为相等联接,否则称为不等联接:

USE WJChi;

-- 相等联接
SELECT * 
FROM dbo.UAddress
FULL JOIN dbo.UserInfo 
ON UserInfo.UAddressId = UAddress.Id;

-- 不等联接
SELECT * 
FROM dbo.UAddress
FULL JOIN dbo.UserInfo 
ON UserInfo.UAddressId <> UAddress.Id;

多联接查询

超过两张表进行关联查询即为多联接查询。通常,当SQL中出现多个表运算符时,从左到右进行逻辑处理,前一个联接的结果会作为下一个联接的左侧输入。SQL Server也常常出于优化查询的目的,在实际处理查询过程中对联接进行重新排序,但这不会影响到处理结果集的正确性。

:warning:不建议超过三张表进行关联,过多的表关联会使SQL变得复杂,难以维护且影响性能

小结

过多的表联接会让SQL逻辑变得复杂,对查询性能产生负面影响,且难以维护。

SQL(任何代码)的书写应将语义清晰作为第一追求,而不是为了“炫技”写一些别人难以理解的代码。

StackOverflow中扣出的一张图片,可以概述外联接和内联接查询:

推荐阅读

T-SQL基础(一)之简单查询

What is the difference between “INNER JOIN” and “OUTER JOIN”?

目录
相关文章
|
4月前
|
SQL 数据挖掘 数据库
第三篇:高级 SQL 查询与多表操作
本文深入讲解高级SQL查询技巧,涵盖多表JOIN操作、聚合函数、分组查询、子查询及视图索引等内容。适合已掌握基础SQL的学习者,通过实例解析INNER/LEFT/RIGHT/FULL JOIN用法,以及COUNT/SUM/AVG等聚合函数的应用。同时探讨复杂WHERE条件、子查询嵌套,并介绍视图简化查询与索引优化性能的方法。最后提供实践建议与学习资源,助你提升SQL技能以应对实际数据处理需求。
301 1
|
6月前
|
SQL 运维 监控
SQL查询太慢?实战讲解YashanDB SQL调优思路
本文是Meetup第十期“调优实战专场”的第二篇技术文章,上一篇《高效查询秘诀,解码YashanDB优化器分组查询优化手段》中,我们揭秘了YashanDB分组查询优化秘诀,本文将通过一个案例,助你快速上手YashanDB慢日志功能,精准定位“慢SQL”后进行优化。
|
1月前
|
SQL 人工智能 数据库
【三桥君】如何正确使用SQL查询语句:避免常见错误?
三桥君解析了SQL查询中的常见错误和正确用法。AI产品专家三桥君通过三个典型案例:1)属性重复比较错误,应使用IN而非AND;2)WHERE子句中非法使用聚合函数的错误,应改用HAVING;3)正确的分组查询示例。三桥君还介绍了学生、课程和选课三个关系模式,并分析了SQL查询中的属性比较、聚合函数使用和分组查询等关键概念。最后通过实战练习帮助读者巩固知识,强调掌握这些技巧对提升数据库查询效率的重要性。
87 0
|
6月前
|
SQL 索引
【YashanDB知识库】字段加上索引后,SQL查询不到结果
【YashanDB知识库】字段加上索引后,SQL查询不到结果
|
2月前
|
SQL
SQL中如何删除指定查询出来的数据
SQL中如何删除指定查询出来的数据
|
4月前
|
SQL 关系型数据库 MySQL
凌晨2点报警群炸了:一条sql 执行200秒!搞定之后,我总结了一个慢SQL查询、定位分析解决的完整套路
凌晨2点报警群炸了:一条sql 执行200秒!搞定之后,我总结了一个慢SQL查询、定位分析解决的完整套路
凌晨2点报警群炸了:一条sql 执行200秒!搞定之后,我总结了一个慢SQL查询、定位分析解决的完整套路
|
3月前
|
SQL 存储 弹性计算
OSS Select 加速查询:10GB CSV 文件秒级过滤的 SQL 语法优化技巧
OSS Select 可直接在对象存储上执行 SQL 过滤,跳过文件下载,仅返回所需数据,性能比传统 ECS 方案提升 10~100 倍。通过减少返回列、使用等值查询、避免复杂函数、分区剪枝及压缩优化等技巧,可大幅降低扫描与传输量,显著提升查询效率并降低成本。
|
6月前
|
SQL 大数据 数据挖掘
玩转大数据:从零开始掌握SQL查询基础
玩转大数据:从零开始掌握SQL查询基础
259 35
|
8月前
|
SQL 安全 数据库
如何在Django中正确使用参数化查询或ORM来避免SQL注入漏洞?
如何在Django中正确使用参数化查询或ORM来避免SQL注入漏洞?
493 77
|
6月前
|
SQL 关系型数据库 MySQL
如何优化SQL查询以提高数据库性能?
这篇文章以生动的比喻介绍了优化SQL查询的重要性及方法。它首先将未优化的SQL查询比作在自助餐厅贪多嚼不烂的行为,强调了只获取必要数据的必要性。接着,文章详细讲解了四种优化策略:**精简选择**(避免使用`SELECT *`)、**专业筛选**(利用`WHERE`缩小范围)、**高效联接**(索引和限制数据量)以及**使用索引**(加速搜索)。此外,还探讨了如何避免N+1查询问题、使用分页限制结果、理解执行计划以及定期维护数据库健康。通过这些技巧,可以显著提升数据库性能,让查询更高效流畅。