阅读目录
概述:
本系列【T-SQL基础】主要是针对T-SQL基础的总结。
【T-SQL基础】06.透视、逆透视、分组集
【T-SQL基础】07.数据修改
【T-SQL基础】09.可编程对象
----------------------------------------------------------
【T-SQL进阶】01.好用的SQL TVP~~独家赠送[增-删-改-查]的例子
----------------------------------------------------------
【T-SQL性能调优】02.Transaction Log的使用和性能问题
【T-SQL性能调优】03.执行计划
【T-SQL性能调优】04.死锁分析
持续更新......欢迎关注我!
本篇主要是对多表查询基础的总结。
查询语句的FROM字句在逻辑上是第一条要处理的字句,在FROM字句内可以用表运算符对输入的表进行操作。
SQL Server 2008支持四中表运算符:JOIN/APPLY/PIVOT/UNPIVOT
一、交叉联接
1.什么是交叉联接
(1)对输入的两个表进行操作,把它们联接起来,生成二者的笛卡儿积。
(2)将一个输入表的每行与另一个表的所有行进行匹配。
(3)如果一个表有m行,而另一个表有n行,将得到m*n的结果集。
2.语法
先创建两张表A,C,如下图所示
(1)ANSI SQL-92语法
下面的查询是对A表和C表进行交叉联接查询
SELECT A.a,C.c FROM A
CROSS JOIN C
因为A表有4行,C表有5行,所以这个查询会生成一个包含4*5=20行的数据的结果集。
使用ANSI SQL-92语法,需要在参与联接的两个表之间使用“Cross JOIN”关键字
(2)ANSI SQL-89语法
在FROM的表名之间加个逗号
SELECT A.a,C.c FROM A,C
这两种语法在逻辑上和性能上都没有区别。
3.自交叉联接
对同一个表进行联接,就是自联接。交叉联接、内联接、外联接都支持自联接。
SELECT A1.a,A2.a FROM A AS A1 CROSS JOIN A AS A2
A表有4行,查询会生成一个包含4*4=16行的数据的结果集
在自联接中,必须为表起别名。如果不为表指定别名,联接结果中的列名就会有歧义。
比如在本例中,别名为A1,A2。
二、内联接
1.什么是内联接
对两个输入表进行笛卡尔积,然后根据指定的谓词对结果行进行过滤。
2.语法
(1)ANSI SQL-92语法
a.在两个表名之间指定INNER JOIN关键字
b.INNER关键字可选,因为内联接是默认的联接方式
c.对行进行过滤的谓词是在一个称为ON字句中指定的,该谓词也称为联接条件
例如查询A表和C表执行内联接运算,根据谓词条件A.id=C.id对表A和表B进行匹配:
SELECT A.id , A.a , C.id , C.c FROM dbo.A INNER JOIN C ON C.id = A.id
怎么理解内联接:
理解内联接最容易的方法是认为A表中每一行同C表中的所有行进行比较,如果A表中的id和C表中的id相等,则匹配成功。
另外一种更正式的方法是在关系代数的基础上来考虑内联接,联接运算首先对两个表求笛卡尔积(4行A记录*5行C记录=20行记录),然后根据条件C.id=A.id对行进行过滤,最终返回16行。
注意:
ON字句与WHERE和HAVING字句类似,ON字句也只返回令谓词结果为TRUE的行,而不会返回令为此计算结果为FALSE或UNKNOW的行。
(2)ANSI SQL-89语法
和交叉联接类似,内联接可以在表名之间用“,”来表示联接,然后用WHERE字句中定义联接条件。
SELECT A.id , A.a , C.id , C.c FROM dbo.A , dbo.C WHERE A.id = C.id
内联接的这两种语法执行结果和性能是一样的,但是推荐是用ANSI SQL-92语法。因为ANSI SQL-92语法更安全。
原因有两点:
a.因为如果用内联接查询,但是忘了写ON条件,则语法分析器会报错,执行无效;
b.使用ANSI SQL-89标准,有可能忘了WHERE字句中的联接,但是语法分析器不会报错,且执行成功。
对于交叉联接来说,也是推荐使用ANSI SQL-92语法。
原因有两点:
a.保持一致,统一使用ANSI SQL-92语法
b.如果开发人员本来是想用ANSI SQL-89语法来写一个内联接查询,却又忘了写WHERE字句中的联接条件,则这段SQL的联接类型和交叉联接是一样的。另外的开发人员再来看的时候并不能判断前面的开发人员到底是想内联接查询还是交叉联接。
3.特殊的联接实例
(1)组合联接
组合联接就是联接条件涉及联接两边的多个列的查询。当需要根据主键-外键关系来联接两个表而且主外键关系是组合的(即关系基于多个列)时,通常使用组合联接。
如B表定义了一个外键(id1,id2),引用了D表的id1,id2列,现在要写一个主外键关系来联接两个表的查询。
SELECT * FROM B INNER JOIN D ON D.id1 = B.id1 AND D.id2 = B.id2
(2)不等联接
联接条件只包含等号运算符,叫做等值联接,联接条件包含除等号以外的其他运算符,叫做不等联接。
SELECT * FROM A INNER JOIN C ON dbo.A.id < dbo.C.id
如果使用交叉联接,得到的结果中将包含自偶对(例如,1和1),以及镜像对(例如,1和2、2和1).使用内联接,并在联接条件中指定左边的键值要小于右边的键值,就可以消除这两种没有用的情况。
(3)多表联接
当FROM子句中包含多个表运算符时,表运算符在逻辑上是按从左到右的顺序处理的。
表A和表B进行JOIN关联,得到结果集AB,AB将作为第二个表运算符JOIN的输入,与表C进行JOIN关联,得到结果ABC,以此类推。
所以如果FROM字句包含多个连接,逻辑上只有第一个联接对两个基础表进行操作,而其他联接则将前一个联接的结果作为其左边的输入。
三、外联接
1.什么是外联接
对两张表进行笛卡尔积,ON过滤,添加外部行
2.语法
只有ANSI SQL-92语法
表名之间用
LEFT OUTER JOIN 或
RIGHT OUTER JOIN 或
FULL OUTER JOIN 或
在ON字句中进行过滤
3.外联接基础
(1)LEFT关键字标识左边表的行驶保留的,RIGHT关键字表示右边的行是保留的,FULL关键字则表示左右两边表的行都是保留的。
(2)外联接的第三个逻辑查询处理步骤就是要识别保留表中按照ON条件在另一个表找不到与之匹配的那些行,再把这些行添加到联接的前两个步骤生成的结果表中。
(3)对于来自联接的非保留表的那些列,追加的外部行中的这些列则用NULL作为占位符。
集合A包含两个集合,集合A1和集合A2,集合B包含两个集合,集合B1和集合B2。A和B的交集是A2和B2
A和B进行LEFT OUTER JOIN后,A1和A2都保留,因A1在B中找不到对应的数据,则A1对应的行需要保留,添加到联接的前两个步骤生成的结果表中,而对于非保留表的列,在外部行中则用NULL作为占位符。
例子:
客户的ID和订单的客户ID对Customer表和Orders表进行关联,并返回客户和他们的订单信息。
Customer包含两部分:有订单的客户,没有订单的客户,用左外联接,查询结果返回有订单的客户和没有订单的客户:
SELECT Cus.custid , o.orderid FROM Sales.Customers AS Cus LEFT OUTER JOIN Sales.Orders AS O ON Cus.custid = O.custid
我们可以通过下面的查询,查询出没有订单的客户
SELECT Cus.custid , O.orderid , O.custid , O.orderdate , O.requireddate , O.shippeddate FROM Sales.Customers AS Cus LEFT OUTER JOIN Sales.Orders AS O ON Cus.custid = O.custid WHERE o.custid IS NULL
1.他们的ID分别为22和57。查询结果中这两个客户在Order表中的列都为NULL。
2.从逻辑上说,这两个客户相关的数据行在联接的第二步(基于ON谓词条件的过滤)就被过滤了,而在第三部又把这些行作为外部行添加了进来。
3.如果使用内联接,结果将不会返回这两行。添加这两行后,就可以在结果中保留左边表的所有行。
4.外联接结果可以看作两种,内不行和外部行,内部行是ON字句的条件能在另一边找到匹配的那些行;外部行则是找不到那些行。内联接只返回内不行,而外联接返回内部行和外部行。
5.ON字句中的条件不能最终决定保留表中部分行是否会在结果中出现,当决定哪些行可以匹配非保留表,就在ON字句中指定联接条件。当在生成外部行以后,要应用外部行以后,要应用过滤器,而且希望过滤条件是最终的。就应该在WHERE字句中指定条件。
4.在多表联接中使用外联接
1.对外联接的处理顺序进行调整,可能会得到不同的输出结果,所以不能随意调整它们的顺序。
2.对于任何外联接(左外联接欸、右外联接、和全外联接),如果后面紧跟着一个内联接或右外联接,都会抵消外联接的外部行。前提是,联接条件对来自联接左边的NULL值和联接右边的某些值进行了比较。
四、多表查询-几道SQL查询题
表间关系图
在做下面的题目之前,我们可以先把环境准备好,以下的SQL脚本可以帮助大家创建数据库,创建表,插入数据。
下载脚本文件:TSQLFundamentals2008.zip
1.返回来自美国的客户,并为每个客户返回订单总数和商品交易总数量。
本题是一道外联接查询,需要查询出所有客户(有订单的客户和没有订单的客户)对应的订单总数,然后再与订单详情关联,查询出每个客户对应的所有订单上的所有的商品的交易总数量。
然后筛选出country = 'USA'。为了得到每个客户的订单总数,需要用COUNT(DISTINCT O.orderid)进行统计。
SELECT C.custid , COUNT(DISTINCT O.orderid) AS numorders , SUM(CASE WHEN qty IS NULL THEN 0 ELSE qty END) AS totalqty FROM Sales.Customers AS C LEFT OUTER JOIN Sales.Orders AS O ON O.custid = C.custid LEFT OUTER JOIN Sales.OrderDetails D ON D.orderid = O.orderid WHERE country = 'USA' GROUP BY C.custid
2.返回客户及其订单信息,包括没有下过任何订单的客户。
SELECT C.custid , C.companyname , O.orderid , O.orderdate FROM Sales.Customers AS C LEFT OUTER JOIN Sales.Orders AS O ON O.custid = C.custid
3.返回在2007年2月12日下过订单的客户,以及他们的订单。同时也返回在2007年2月12日没有下过订单的客户。
这题主要考察在联接查询中,ON和WHERE的用法。
(1)订单日期的过滤过滤条件必须出现在ON字句,而不是WHERE字句中。WHERE过滤条件是在外部行被添加以后才被应用的,而且是最终的。
(2)订单的日期的过滤条件只是用于决定是否匹配,但不是决定客户行的最终条件。
SELECT C.custid , C.companyname , O.orderid , O.orderdate FROM Sales.Customers AS C LEFT OUTER JOIN Sales.Orders AS O ON O.custid = C.custid AND O.orderdate = '20070212'
参考资料:
《SQL2008技术内幕:T-SQL语言基础》