今天突然想到之前在书上看到的一个例子,竟然想不起来了.
于是翻书找出来,测试一下.
-- drop table father,son
createtable father(fid int,namevarchar(10),oidint)
createtable son(sidint,namevarchar(10),fid int)
insertinto father(fid,name,oid)
values(1,'father',5),(2,'father',9),(3,'father',null),(4,'father',0)
insertinto son(sid,name,fid)
values(1,'son',2),(2,'son',2),(3,'son',3),(4,'son',null),(5,'son',null)
select * from father
select * from son
in和exists差异开始测试吧,现在测试使用in、not in 可能带来的“错误”。之所以错误,是因为我们总是以自然语言去理解SQL,却忽略了数学中的逻辑语法。不废话了,测试看看吧!
【测试一:in子查询】
--返回在son中存在的所有father的数据
--正确的写法:
select * from father where fid in(select fid from son)
--错误的写法:
select * from father where fid in(selectoidfrom son)
说明:
两个查询都执行没有出错,但是第二个tsql的子查询写错了。子查询(select oid from son)实际单独执行会出错,因为表son不存在字段oid,但是在这里系统不会提示错误。而且father表有4行数据,所有子查询扫描了4次son表,但是第二个查询中,实际也只扫描了1次son表,也就是son表没有用到。
即使这样写也 不会出错:select*fromfatherwherefidin(selectoid)
这个查询的意思是,表father中每行的fid与oid比较,相同则返回值。
实际查询是这样的:select * from father where fid = oid
测试一中,fid in(select fid from son)子查询中包含null值,所以 fid in(null)返回的是一个未知值。但是在刷选器中,false和unknown的处理方式类似。因此第一个子查询返回了正确的结果集。
【测试二:not in子查询】
--返回在son中不存在的所有father的数据
--错误的写法:
select * from father where fid notin(select fid from son)
--错误的写法:
select * from father where fid notin(selectoidfrom son)
--正确的写法:
select * from father where fid notin(select fid from son where fid isnotnull)
说明:
查看select fid from son,子查询中有空值null,子查询中的值为(2,3,null),谓词fid in(2,3,null)永远不会返回false,只反会true或unknown,所以谓词fidnot in(2,3,null)只返回not true 或not unknown,结果都不会是true。所以当子查询存在null时,not in和not exists 在逻辑上是不等价的。
总结
In 或 not in在SQL语句中经常用到,尤其当子查询中有空值的时候,要谨慎考虑。因为即使写了“正确”的脚本,但是返回结果却不正确,也不出错。
在不是很理解的情况下,最好使用 exists和 not exists来替换。而且exists查询更快一些,因为只要在子查询找到第一个符合的值就不继续往下找了,所以能用exists就用吧。