【T-SQL基础】02.联接查询

简介: 【T-SQL基础】02.联接查询


阅读目录

概述:

本系列【T-SQL基础】主要是针对T-SQL基础的总结。

【T-SQL基础】01.单表查询-几道sql查询题

【T-SQL基础】02.联接查询

【T-SQL基础】03.子查询

【T-SQL基础】04.表表达式-上篇

【T-SQL基础】04.表表达式-下篇

【T-SQL基础】05.集合运算

【T-SQL基础】06.透视、逆透视、分组集

【T-SQL基础】07.数据修改

【T-SQL基础】08.事务和并发

【T-SQL基础】09.可编程对象

----------------------------------------------------------

【T-SQL进阶】01.好用的SQL TVP~~独家赠送[增-删-改-查]的例子

----------------------------------------------------------

【T-SQL性能调优】01.TempDB的使用和性能问题

【T-SQL性能调优】02.Transaction Log的使用和性能问题

【T-SQL性能调优】03.执行计划

【T-SQL性能调优】04.死锁分析

持续更新......欢迎关注我!

 

本篇主要是对多表查询基础的总结。

查询语句的FROM字句在逻辑上是第一条要处理的字句,在FROM字句内可以用表运算符对输入的表进行操作。

SQL Server 2008支持四中表运算符:JOIN/APPLY/PIVOT/UNPIVOT

 

图片.png

 

 

回到顶部

一、交叉联接

1.什么是交叉联接

1)对输入的两个表进行操作,把它们联接起来,生成二者的笛卡儿积。

2)将一个输入表的每行与另一个表的所有行进行匹配。

3)如果一个表有m行,而另一个表有n行,将得到m*n的结果集。

2.语法

先创建两张表A,C,如下图所示

图片.png

1ANSI SQL-92语法

下面的查询是对A表和C表进行交叉联接查询

SELECT A.a,C.c FROM A

CROSS JOIN C

因为A表有4行,C表有5行,所以这个查询会生成一个包含4*5=20行的数据的结果集。

图片.png

使用ANSI SQL-92语法,需要在参与联接的两个表之间使用“Cross JOIN”关键字

2ANSI SQL-89语法

FROM的表名之间加个逗号

SELECT A.a,C.c FROM A,C

这两种语法在逻辑上和性能上都没有区别。

 

3.自交叉联接

对同一个表进行联接,就是自联接。交叉联接、内联接、外联接都支持自联接。

SELECT A1.a,A2.a FROM A AS A1
CROSS JOIN A AS A2

A表有4行,查询会生成一个包含4*4=16行的数据的结果集

图片.png

在自联接中,必须为表起别名。如果不为表指定别名,联接结果中的列名就会有歧义。

比如在本例中,别名为A1,A2

 

二、内联接

1.什么是内联接

对两个输入表进行笛卡尔积,然后根据指定的谓词对结果行进行过滤。

2.语法

1ANSI SQL-92语法

  a.在两个表名之间指定INNER JOIN关键字

  b.INNER关键字可选,因为内联接是默认的联接方式

  c.对行进行过滤的谓词是在一个称为ON字句中指定的,该谓词也称为联接条件

 

例如查询A表和C表执行内联接运算,根据谓词条件A.id=C.id对表A和表B进行匹配:

SELECT  A.id ,
        A.a ,
        C.id ,
        C.c
FROM    dbo.A
        INNER JOIN C ON C.id = A.id

图片.png

怎么理解内联接:

  理解内联接最容易的方法是认为A表中每一行同C表中的所有行进行比较,如果A表中的idC表中的id相等,则匹配成功。

  另外一种更正式的方法是在关系代数的基础上来考虑内联接,联接运算首先对两个表求笛卡尔积(4A记录*5C记录=20行记录),然后根据条件C.id=A.id对行进行过滤,最终返回16行。

注意:

  ON字句与WHEREHAVING字句类似,ON字句也只返回令谓词结果为TRUE的行,而不会返回令为此计算结果为FALSEUNKNOW的行。

2ANSI SQL-89语法

和交叉联接类似,内联接可以在表名之间用“,”来表示联接,然后用WHERE字句中定义联接条件。

SELECT  A.id ,
        A.a ,
        C.id ,
        C.c
FROM    dbo.A ,
        dbo.C
WHERE   A.id = C.id

内联接的这两种语法执行结果和性能是一样的,但是推荐是用ANSI SQL-92语法。因为ANSI SQL-92语法更安全。

原因有两点:

  a.因为如果用内联接查询,但是忘了写ON条件,则语法分析器会报错,执行无效;

  b.使用ANSI SQL-89标准,有可能忘了WHERE字句中的联接,但是语法分析器不会报错,且执行成功。

 

对于交叉联接来说,也是推荐使用ANSI SQL-92语法。

原因有两点:

  a.保持一致,统一使用ANSI SQL-92语法

  b.如果开发人员本来是想用ANSI SQL-89语法来写一个内联接查询,却又忘了写WHERE字句中的联接条件,则这段SQL的联接类型和交叉联接是一样的。另外的开发人员再来看的时候并不能判断前面的开发人员到底是想内联接查询还是交叉联接。

3.特殊的联接实例

1)组合联接

组合联接就是联接条件涉及联接两边的多个列的查询。当需要根据主键-外键关系来联接两个表而且主外键关系是组合的(即关系基于多个列)时,通常使用组合联接。

B表定义了一个外键(id1,id2),引用了D表的id1,id2列,现在要写一个主外键关系来联接两个表的查询。

SELECT  *
FROM    B
INNER JOIN D
ON D.id1 = B.id1
AND D.id2 = B.id2

图片.png

2)不等联接

联接条件只包含等号运算符,叫做等值联接,联接条件包含除等号以外的其他运算符,叫做不等联接。

SELECT    *
FROM      A
INNER JOIN C
ON dbo.A.id < dbo.C.id

如果使用交叉联接,得到的结果中将包含自偶对(例如,11),以及镜像对(例如,1221.使用内联接,并在联接条件中指定左边的键值要小于右边的键值,就可以消除这两种没有用的情况。

图片.png

3)多表联接

FROM子句中包含多个表运算符时,表运算符在逻辑上是按从左到右的顺序处理的。

A和表B进行JOIN关联,得到结果集ABAB将作为第二个表运算符JOIN的输入,与表C进行JOIN关联,得到结果ABC,以此类推。

所以如果FROM字句包含多个连接,逻辑上只有第一个联接对两个基础表进行操作,而其他联接则将前一个联接的结果作为其左边的输入。

图片.png

 

回到顶部

三、外联接

1.什么是外联接

对两张表进行笛卡尔积,ON过滤,添加外部行

2.语法

只有ANSI SQL-92语法

表名之间用

LEFT OUTER JOIN

RIGHT OUTER JOIN

FULL OUTER JOIN

ON字句中进行过滤

 

3.外联接基础

1LEFT关键字标识左边表的行驶保留的,RIGHT关键字表示右边的行是保留的,FULL关键字则表示左右两边表的行都是保留的。

2)外联接的第三个逻辑查询处理步骤就是要识别保留表中按照ON条件在另一个表找不到与之匹配的那些行,再把这些行添加到联接的前两个步骤生成的结果表中。

3)对于来自联接的非保留表的那些列,追加的外部行中的这些列则用NULL作为占位符。

 

集合A包含两个集合,集合A1和集合A2,集合B包含两个集合,集合B1和集合B2AB的交集是A2B2

AB进行LEFT OUTER JOIN后,A1A2都保留,因A1B中找不到对应的数据,则A1对应的行需要保留,添加到联接的前两个步骤生成的结果表中,而对于非保留表的列,在外部行中则用NULL作为占位符。

图片.png

 

例子:

客户的ID和订单的客户IDCustomer表和Orders表进行关联,并返回客户和他们的订单信息。

Customer包含两部分:有订单的客户,没有订单的客户,用左外联接,查询结果返回有订单的客户和没有订单的客户:

SELECT  Cus.custid ,
        o.orderid
FROM    Sales.Customers AS Cus
        LEFT OUTER JOIN Sales.Orders AS O
        ON Cus.custid = O.custid

图片.png

 

我们可以通过下面的查询,查询出没有订单的客户

SELECT  Cus.custid ,
        O.orderid ,
        O.custid ,
        O.orderdate ,
        O.requireddate ,
        O.shippeddate
FROM    Sales.Customers AS Cus
        LEFT OUTER JOIN Sales.Orders AS O ON Cus.custid = O.custid
WHERE   o.custid IS NULL

图片.png

 

1.他们的ID分别为2257。查询结果中这两个客户在Order表中的列都为NULL

2.从逻辑上说,这两个客户相关的数据行在联接的第二步(基于ON谓词条件的过滤)就被过滤了,而在第三部又把这些行作为外部行添加了进来。

3.如果使用内联接,结果将不会返回这两行。添加这两行后,就可以在结果中保留左边表的所有行。

4.外联接结果可以看作两种,内不行和外部行,内部行是ON字句的条件能在另一边找到匹配的那些行;外部行则是找不到那些行。内联接只返回内不行,而外联接返回内部行和外部行。

5.ON字句中的条件不能最终决定保留表中部分行是否会在结果中出现,当决定哪些行可以匹配非保留表,就在ON字句中指定联接条件。当在生成外部行以后,要应用外部行以后,要应用过滤器,而且希望过滤条件是最终的。就应该在WHERE字句中指定条件。

 

4.在多表联接中使用外联接

 

1.对外联接的处理顺序进行调整,可能会得到不同的输出结果,所以不能随意调整它们的顺序。

2.对于任何外联接(左外联接欸、右外联接、和全外联接),如果后面紧跟着一个内联接或右外联接,都会抵消外联接的外部行。前提是,联接条件对来自联接左边的NULL值和联接右边的某些值进行了比较。

 

回到顶部

四、多表查询-几道SQL查询题

表间关系图

图片.png

 

 

在做下面的题目之前,我们可以先把环境准备好,以下的SQL脚本可以帮助大家创建数据库,创建表,插入数据。

下载脚本文件:TSQLFundamentals2008.zip

 

1.返回来自美国的客户,并为每个客户返回订单总数和商品交易总数量。

图片.png

本题是一道外联接查询,需要查询出所有客户(有订单的客户和没有订单的客户)对应的订单总数,然后再与订单详情关联,查询出每个客户对应的所有订单上的所有的商品的交易总数量。

然后筛选出country = 'USA'。为了得到每个客户的订单总数,需要用COUNT(DISTINCT O.orderid)进行统计。

SELECT  C.custid ,
        COUNT(DISTINCT O.orderid) AS numorders ,
        SUM(CASE WHEN qty IS NULL THEN 0 ELSE qty END) AS totalqty
FROM    Sales.Customers AS C
        LEFT OUTER JOIN Sales.Orders AS O ON O.custid = C.custid
        LEFT OUTER JOIN Sales.OrderDetails D ON D.orderid = O.orderid
WHERE   country = 'USA'
GROUP BY C.custid

2.返回客户及其订单信息,包括没有下过任何订单的客户。

图片.png

SELECT  C.custid ,
        C.companyname ,
        O.orderid ,
        O.orderdate
FROM    Sales.Customers AS C
        LEFT OUTER JOIN Sales.Orders AS O
        ON O.custid = C.custid

3.返回在2007212日下过订单的客户,以及他们的订单。同时也返回在2007212日没有下过订单的客户。

图片.png

这题主要考察在联接查询中,ONWHERE的用法。

1)订单日期的过滤过滤条件必须出现在ON字句,而不是WHERE字句中。WHERE过滤条件是在外部行被添加以后才被应用的,而且是最终的。

2)订单的日期的过滤条件只是用于决定是否匹配,但不是决定客户行的最终条件。

SELECT  C.custid ,
        C.companyname ,
        O.orderid ,
        O.orderdate
FROM    Sales.Customers AS C
        LEFT OUTER JOIN Sales.Orders AS O
        ON O.custid = C.custid
        AND O.orderdate = '20070212'

 

参考资料:

《SQL2008技术内幕:T-SQL语言基础》




相关文章
|
14天前
|
SQL 存储 人工智能
Vanna:开源 AI 检索生成框架,自动生成精确的 SQL 查询
Vanna 是一个开源的 Python RAG(Retrieval-Augmented Generation)框架,能够基于大型语言模型(LLMs)为数据库生成精确的 SQL 查询。Vanna 支持多种 LLMs、向量数据库和 SQL 数据库,提供高准确性查询,同时确保数据库内容安全私密,不外泄。
78 7
Vanna:开源 AI 检索生成框架,自动生成精确的 SQL 查询
|
21天前
|
SQL Java
使用java在未知表字段情况下通过sql查询信息
使用java在未知表字段情况下通过sql查询信息
34 8
|
27天前
|
SQL 安全 PHP
PHP开发中防止SQL注入的方法,包括使用参数化查询、对用户输入进行过滤和验证、使用安全的框架和库等,旨在帮助开发者有效应对SQL注入这一常见安全威胁,保障应用安全
本文深入探讨了PHP开发中防止SQL注入的方法,包括使用参数化查询、对用户输入进行过滤和验证、使用安全的框架和库等,旨在帮助开发者有效应对SQL注入这一常见安全威胁,保障应用安全。
47 4
|
1月前
|
SQL 监控 关系型数据库
SQL语句当前及历史信息查询-performance schema的使用
本文介绍了如何使用MySQL的Performance Schema来获取SQL语句的当前和历史执行信息。Performance Schema默认在MySQL 8.0中启用,可以通过查询相关表来获取详细的SQL执行信息,包括当前执行的SQL、历史执行记录和统计汇总信息,从而快速定位和解决性能瓶颈。
|
1月前
|
SQL 存储 缓存
如何优化SQL查询性能?
【10月更文挑战第28天】如何优化SQL查询性能?
109 10
|
1月前
|
SQL 关系型数据库 MySQL
|
2月前
|
SQL 数据库 开发者
功能发布-自定义SQL查询
本期主要为大家介绍ClkLog九月上线的新功能-自定义SQL查询。
|
2月前
|
SQL 移动开发 Oracle
SQL语句实现查询连续六天数据的方法与技巧
在数据库查询中,有时需要筛选出符合特定时间连续性条件的数据记录
|
2月前
|
SQL Java 数据库连接
如何使用`DriverManager.getConnection()`连接数据库,并利用`PreparedStatement`执行参数化查询,有效防止SQL注入。
【10月更文挑战第6天】在代码与逻辑交织的世界中,我从一名数据库新手出发,通过不断探索与实践,最终成为熟练掌握JDBC的开发者。这段旅程充满挑战与惊喜,从建立数据库连接到执行SQL语句,再到理解事务管理和批处理等高级功能,每一步都让我对JDBC有了更深的认识。示例代码展示了如何使用`DriverManager.getConnection()`连接数据库,并利用`PreparedStatement`执行参数化查询,有效防止SQL注入。
114 5
|
2月前
|
SQL 数据挖掘 数据库
SQL查询每秒的数据:技巧、方法与性能优化
id="">SQL查询功能详解 SQL(Structured Query Language,结构化查询语言)是一种专门用于与数据库进行沟通和操作的语言