SQL点滴10—使用with语句来写一个稍微复杂sql语句,附加和子查询的性能对比

简介: 原文:SQL点滴10—使用with语句来写一个稍微复杂sql语句,附加和子查询的性能对比 今天偶尔看到sql中也有with关键字,好歹也写了几年的sql语句,居然第一次接触,无知啊。看了一位博主的文章,自己添加了一些内容,做了简单的总结,这个语句还是第一次见到,学习了。
原文: SQL点滴10—使用with语句来写一个稍微复杂sql语句,附加和子查询的性能对比

 今天偶尔看到sql中也有with关键字,好歹也写了几年的sql语句,居然第一次接触,无知啊。看了一位博主的文章,自己添加了一些内容,做了简单的总结,这个语句还是第一次见到,学习了。我从简单到复杂地写,希望高手们不要见笑。下面的sql语句设计到三个表,表的内容我用txt文件复制进去,这里不妨使用上一个随笔介绍的建立端到端的package的方法将这些表导入到数据库中,具体的就不说了。

从这里下载文件employees.txt,customers.txt,orders.txt

参考文章:http://www.cnblogs.com/wwan/archive/2011/02/24/1964279.html

使用package导入数据:http://www.cnblogs.com/tylerdonet/archive/2011/04/17/2017471.html

简单的聚合

从orders表中选择各个年份共有共有多少客户订购了商品

  •  第一种写法,我们可以写成这样
     
       
    1 select YEAR (o.orderdate) orderyear, COUNT ( distinct (custid)) numCusts
    2 from Sales.Orders o
    3 group by YEAR (o.orderdate)
    4 go
    要注意的是如果把group by YEAR(o.orderdata)换成group by orderyear就会出错,这里涉及到sql语句的执行顺序问题,有时间再了解一下          
  • 第二种写法,
     
       
    1 select orderyear, COUNT ( distinct (custid))numCusts
    2 from ( select YEAR (orderdate) as orderyear,custid from sales.orders) as D
    3 group by orderyear
    4 go
    在from语句中先得到orderyear,然后再select语句中就不会出现没有这个字段的错误了
  • 第三种写法,
     
       
    1 select orderyear, COUNT ( distinct (custid)) numCusts
    2 from ( select YEAR (orderdate),custid from sales.orders) as D(orderyear,custid)
    3 group by orderyear
    4 go
    在as D后面加上选择出的字段,是不是更加的清楚明了呢!
  • 第四种写法,with出场了
     
       
    1 with c as (
    2 select YEAR (orderdate) orderyear, custid from sales.orders)
    3 select orderyear, COUNT ( distinct (custid)) numCusts from c group by orderyear
    4 go
    with可以使语句更加的经凑,下面是权威解释。  
        
    指定临时命名的结果集,这些结果集称为公用表表达式 (CTE)。该表达式源自简单查询,并且在单条 SELECT、INSERT、UPDATE、MERGE 或 DELETE 语句的执行范围内定义。该子句也可用在 CREATE VIEW 语句中,作为该语句的 SELECT 定义语句的一部分。公用表表达式可以包括对自身的引用。这种表达式称为递归公用表达式。               

                                                ----MSDN

  • 第五种写法,也可以借鉴第三种写法,这样使语句更加清楚明了,便于维护
     
       
    1 with c(orderyear,custid) as (
    2   select YEAR (orderdate),custid from sales.orders)
    3   select orderyear, COUNT ( distinct (custid)) numCusts from c group by c.orderyear
    4   go
    上面5中写法都得到相同的结果,如下图1:img_a6a307475d1295893e75437cd1a61029.png图1

添加计算

  • 现在要求要求计算出订单表中每年比上一年增加的客户数目,这个稍微复杂
     
       
    1 with yearcount as (
    2   select YEAR (orderdate) orderyear, COUNT ( distinct (custid)) numCusts from sales.orders group by YEAR (orderdate))
    3   select cur.orderyear curyear,cur.numCusts curNumCusts,prv.orderyear prvyear,prv.numCusts prvNumCusts,cur.numCusts - prv.numCusts growth
    4   from yearcount cur left join yearcount prv on cur.orderyear = prv.orderyear + 1
    5 go
    这里两次使用到with结果集。查询得到的结果如下图2
    img_c35950dbbc3c1dc9bdced3ddfa2d4d94.png
    图2

复杂的计算

  • 查找客户id,这些客户和所有来自美国的雇员至少有一笔交易记录,查询语句如下
     
       
    1 with TheseEmployees as (
    2 select empid from hr.employees where country = ' USA ' ),
    3 CharacteristicFunctions as (
    4 select custid,
    5 case when custid in ( select custid from sales.orders as o where o.empid = e.empid) then 1 else 0 end as charfun
    6 from sales.customers as c cross join TheseEmployees as e)
    7 select custid, min (charfun) from CharacteristicFunctions group by custid having min (charfun) = 1
    8 go
    这里嵌套with语句,第with语句查找美国雇员的id,第二个语句使用这个结果和拥有客户的客户id和拥有关系标识做笛卡尔积运算。最后从这个笛卡尔积中通过标识找到最终的custid。
    结果如下图3
    img_ad130d0f4d1d4b866b3437cd2474ffed.png
    图3

这里只有简单地介绍,没有深入,高手们不要见笑啊。



---------------------------------------------------------分界线----------------------------------------------------------

with语句和子查询的性能比较

在博友SingleCat的提醒下,对with语句做一些性能测试,这里使用的测试工具是SQL Server Profile。我选择了最后一个语句,因为这个语句比较复杂一点。开始的时候单独执行一次发现他们的差别不大,就差几个毫秒,后来想让他们多执行几次,连续执行10

次看看执行的结果。下面贴出测试用的语句。

 
 
1 /* with查询 */
2 declare @withquery varchar ( 5000 )
3 declare @execcount int = 0
4 set @withquery = ' with TheseEmployees as(
5 select empid from hr.employees where country=N '' USA '' ),
6 CharacteristicFunctions as(
7 select custid,
8 case when custid in (select custid from sales.orders as o where o.empid=e.empid) then 1 else 0 end as charfun
9 from sales.customers as c cross join TheseEmployees as e)
10 select custid from CharacteristicFunctions group by custid having min(charfun)=1 order by custid
11 '
12 while @execcount < 10
13 begin
14 exec ( @withquery );
15 set @execcount = @execcount + 1
16 end
17
18 /* 子查询 */
19 declare @subquery varchar ( 5000 )
20 declare @execcount int = 0
21 set @subquery = ' select custid from Sales.Orders where empid in
22 (select empid from HR.Employees where country = N '' USA '' ) group by custid
23 having count(distinct empid)=(select count(*) from HR.Employees where country = N '' USA '' );
24 '
25 while @execcount < 10
26 begin
27 exec ( @subquery );
28 set @execcount = @execcount + 1
29 end

SQL Server Profile中截图如下

img_eec02b8ab3bc50c54a6926c0cf088806.png

从图中可以看到子查询语句的执行时间要少于with语句,我觉得主要是with查询中有一个cross join做了笛卡尔积的关系,于是又实验了上面的那个简单一点的,下面是测试语句。

 
 
1 /* with语句 */
2 declare @withquery varchar ( 5000 )
3 declare @execcount int = 0
4 set @withquery = ' with c(orderyear,custid) as(
5 select YEAR(orderdate),custid from sales.orders)
6 select orderyear,COUNT(distinct(custid)) numCusts from c group by c.orderyear '
7 while @execcount < 100
8 begin
9 exec ( @withquery );
10 set @execcount = @execcount + 1
11 end
12
13 /* 子查询 */
14 declare @subquery varchar ( 5000 )
15 declare @execcount int = 0
16 set @subquery = ' select orderyear,COUNT(distinct(custid)) numCusts
17 from (select YEAR(orderdate),custid from sales.orders) as D(orderyear,custid)
18 group by orderyear '
19 while @execcount < 100
20 begin
21 exec ( @subquery );
22 set @execcount = @execcount + 1
23 end

 

这次做10次查询还是没有多大的差距,with语句用10个duration,子查询用了11个,有时候还会翻过来。于是把执行次数改成100,这次还是子查询使用的时间要少,截图如下

img_6cbc76f08b80e1ab0b60f850475a1fa9.png

最终结论,子查询好比with语句效率高。

目录
相关文章
|
20天前
|
SQL 数据处理 数据库
专坑同事的SQL写法:性能杀手揭秘
【8月更文挑战第29天】在日常的数据库开发与维护工作中,编写高效、清晰的SQL语句是每位数据工程师的必修课。然而,不当的SQL编写习惯不仅能降低查询效率,还可能给同事的工作带来不必要的困扰。今天,我们就来揭秘八种常见的“专坑同事”SQL写法,助你避免成为那个无意间拖慢整个团队步伐的人。
28 1
|
25天前
|
SQL 运维 监控
SQL Server 运维常用sql语句(二)
SQL Server 运维常用sql语句(二)
20 3
|
25天前
|
SQL 关系型数据库 MySQL
【MySQL 慢查询秘籍】慢SQL无处遁形!实战指南:一步步教你揪出数据库性能杀手!
【8月更文挑战第24天】本文以教程形式深入探讨了MySQL慢SQL查询的分析与优化方法。首先介绍了如何配置MySQL以记录执行时间过长的SQL语句。接着,利用内置工具`mysqlslowlog`及第三方工具`pt-query-digest`对慢查询日志进行了详细分析。通过一个具体示例展示了可能导致性能瓶颈的查询,并提出了相应的优化策略,包括添加索引、缩小查询范围、使用`EXPLAIN`分析执行计划等。掌握这些技巧对于提升MySQL数据库性能具有重要意义。
52 1
|
25天前
|
SQL XML 运维
SQL Server 运维常用sql语句(三)
SQL Server 运维常用sql语句(三)
11 1
|
17天前
|
前端开发 C# 设计模式
“深度剖析WPF开发中的设计模式应用:以MVVM为核心,手把手教你重构代码结构,实现软件工程的最佳实践与高效协作”
【8月更文挑战第31天】设计模式是在软件工程中解决常见问题的成熟方案。在WPF开发中,合理应用如MVC、MVVM及工厂模式等能显著提升代码质量和可维护性。本文通过具体案例,详细解析了这些模式的实际应用,特别是MVVM模式如何通过分离UI逻辑与业务逻辑,实现视图与模型的松耦合,从而优化代码结构并提高开发效率。通过示例代码展示了从模型定义、视图模型管理到视图展示的全过程,帮助读者更好地理解并应用这些模式。
32 0
|
17天前
|
Java XML Maven
跨越时代的飞跃:Struts 2 升级秘籍——从旧版本无缝迁移到最新版,焕发应用新生!
【8月更文挑战第31天】随着软件技术的发展,Struts 2 框架也在不断更新。本文通过具体案例指导开发者如何从旧版平滑升级到 Struts 2.6.x。首先更新 `pom.xml` 中的依赖版本,并执行 `mvn clean install`。接着检查 `struts.xml` 配置,确保符合新版本要求,调整包扫描器等设置。审查 Action 类及其注解,检查配置文件中的弃用项及插件。更新自定义拦截器实现,并验证日志配置。最后,通过一系列测试确保升级后的系统正常运行。通过这些步骤,可以顺利完成 Struts 2 的版本升级,提升应用的安全性和性能。
47 0
|
17天前
|
SQL 数据库 开发者
SQL中的子查询:嵌套查询的深度解析
【8月更文挑战第31天】
74 0
|
18天前
|
SQL 数据挖掘 数据库
SQL 子查询深度剖析来袭!嵌套查询竟有如此无限可能,带你轻松玩转复杂数据检索与操作!
【8月更文挑战第31天】在 SQL 中,子查询是一种强大的工具,允许在一个查询内嵌套另一个查询,从而实现复杂的数据检索和操作。子查询分为标量子查询、列子查询和行子查询,可用于 SELECT、FROM、WHERE 和 HAVING 子句中。例如,查找年龄大于平均年龄的学生或每个课程中成绩最高的学生。子查询具有灵活性、可重用性和潜在的性能优化优势,但需注意性能问题、可读性和数据库支持。合理使用子查询能够显著提升查询效率和代码维护性。
29 0
|
18天前
|
SQL 数据处理 数据库
SQL进阶之路:深入解析数据更新与删除技巧——掌握批量操作、条件筛选、子查询和事务处理,提升数据库维护效率与准确性
【8月更文挑战第31天】在数据库管理和应用开发中,数据的更新和删除至关重要,直接影响数据准确性、一致性和性能。本文通过具体案例,深入解析SQL中的高级更新(UPDATE)和删除(DELETE)技巧,包括批量更新、基于条件的删除以及使用子查询和事务处理复杂场景等,帮助读者提升数据处理能力。掌握这些技巧能够有效提高数据库性能并确保数据一致性。
40 0
|
1月前
|
SQL 关系型数据库 MySQL
(十七)SQL优化篇:如何成为一位写优质SQL语句的绝顶高手!
(Structured Query Language)标准结构化查询语言简称SQL,编写SQL语句是每位后端开发日常职责中,接触最多的一项工作,SQL是关系型数据库诞生的产物,无论是什么数据库,MySQL、Oracle、SQL Server、DB2、PgSQL....,只要还处于关系型数据库这个范畴,都会遵循统一的SQL标准,这句话简单来说也就是:无论什么关系型数据库,本质上SQL的语法都是相同的,因为它们都实现了相同的SQL标准,不同数据库之间仅支持的特性不同而已。