你真的会玩SQL吗?你所不知道的 数据聚合

简介: 你真的会玩SQL吗?系列目录   你真的会玩SQL吗?之逻辑查询处理阶段   你真的会玩SQL吗?和平大使 内连接、外连接   你真的会玩SQL吗?三范式、数据完整性   你真的会玩SQL吗?查询指定节点及其所有父节点的方法   你真的会玩SQL吗?让人晕头转向的三值逻辑 ...

 

你真的会玩SQL吗?系列目录

 

你真的会玩SQL吗?之逻辑查询处理阶段

 

你真的会玩SQL吗?和平大使 内连接、外连接

 

你真的会玩SQL吗?三范式、数据完整性

 

你真的会玩SQL吗?查询指定节点及其所有父节点的方法

 

你真的会玩SQL吗?让人晕头转向的三值逻辑

 

你真的会玩SQL吗?EXISTS和IN之间的区别

 

你真的会玩SQL吗?无处不在的子查询

 

你真的会玩SQL吗?Case也疯狂

 

你真的会玩SQL吗?表表达式,排名函数

 

你真的会玩SQL吗?简单的 数据修改

 

你真的会玩SQL吗?你所不知道的 数据聚合

 

你真的会玩SQL吗?透视转换的艺术

 

你真的会玩SQL吗?冷落的Top和Apply

 

你真的会玩SQL吗?实用函数方法汇总

 

你真的会玩SQL吗?玩爆你的数据报表之存储过程编写(上)

 

你真的会玩SQL吗?玩爆你的数据报表之存储过程编写(下)

 

 

 

本章的内容与 你真的会玩SQL吗?透视转换内容 非常重要,非常重要,非常重要 ,不理解的可以慢慢看,回头看,过几天再看,以后很多思想需要以此为基础而演变。

此后用到的用例数据库是SQL2008里面的,若看过本系列之前的文章,创建过基础样例数据库就不用再创建。

若没有创建过的,用例数据库文件:链接:http://pan.baidu.com/s/1qW1QxA0 密码:dqxx

 

连续聚合

下面的例子将使用一个EmpOrdersr汇总表,每位雇员在每个月占一行,包含该雇员在一个月内处理过的订单数量,运行下代码创建数据:

CREATE TABLE EmpOrders
    (
      empid INT NOT NULL ,
      ordmonth DATE NOT NULL ,--只取到月份2015-07-07
      qty INT NOT NULL ,
      PRIMARY KEY ( empid, ordmonth )
    )
go 
INSERT  INTO EmpOrders
        ( empid ,
          ordmonth ,
          qty 
        )
        SELECT  o.empid ,
                DATEADD(MONTH, DATEDIFF(MONTH, 0, o.orderdate), 0) AS ordmonth ,
                SUM(qty) AS qty
        FROM    Sales.Orders AS o
                JOIN Sales.OrderDetails AS od ON o.orderid = od.orderid
        GROUP BY empid ,
                DATEADD(MONTH, DATEDIFF(MONTH, 0, o.orderdate), 0)

查询:

SELECT  empid ,
        ordmonth ,
        qty
FROM    EmpOrders
ORDER BY empid ,
        ordmonth

将输出以下内容

接下来讲讲各类聚合……

1.累积聚合

 为每个雇员和每个月,返回从其开始有订单操作以来到该月份处理过的订单总量和每月的平均量,结果如下,怎么做?

SELECT  o1.empid ,
        o1.ordmonth ,
        o1.qty AS qtythismonth ,
        SUM(o2.qty) AS totalqty ,
        CAST(AVG(1. * o2.qty) AS NUMERIC(12, 2)) AS avgqty
FROM    EmpOrders AS o1
        JOIN EmpOrders AS o2 ON o2.empid = o1.empid
                                AND o2.ordmonth <= o1.ordmonth
GROUP BY o1.empid ,
        o1.ordmonth ,
        o1.qty
ORDER BY o1.empid ,
        o1.ordmonth

 

若想得到雇员达到累积总量<1000之前的每月聚合值,怎么做?

 

SELECT  o1.empid ,
        o1.ordmonth ,
        o1.qty AS qtythismonth ,
        SUM(o2.qty) AS totalqty ,
        CAST(AVG(1. * o2.qty) AS NUMERIC(12, 2)) AS avgqty
FROM    EmpOrders AS o1
        JOIN EmpOrders AS o2 ON o2.empid = o1.empid
                                AND o2.ordmonth <= o1.ordmonth
GROUP BY o1.empid ,
        o1.ordmonth ,
        o1.qty
        HAVING SUM(o2.qty)<1000
ORDER BY o1.empid ,
        o1.ordmonth

 对总量做一次HAVING过滤 HAVING SUM(o2.qty)<1000,而不是用WHERE,因为过滤是的聚合,而不是属性。  

 

2.滑动聚合

 滑动聚合是对序列内的一个滑动窗口进行的聚合计算,而不是从序列的开始计算到当前位置。

 求雇员最近三个月(包括本月)的平均订单量(移动平均数),得到以下结果:

SELECT  o1.empid ,
        o1.ordmonth ,
        o1.qty AS qtythismonth ,
        SUM(o2.qty) AS totalqty ,
        CAST(AVG(1. * o2.qty) AS NUMERIC(12, 2)) AS avgqty
FROM    EmpOrders AS o1
        JOIN EmpOrders AS o2 ON o2.empid = o1.empid
                                AND (o2.ordmonth <= o1.ordmonth AND o2.ordmonth > DATEADD(MONTH,-3,o1.ordmonth))
GROUP BY o1.empid ,
        o1.ordmonth ,
        o1.qty
ORDER BY o1.empid ,
        o1.ordmonth
View Code

这里使用的是o2.ordmonth> 3个月之前的月份 and o2.ordmonth<=o1.当前月份

 

3.年初至今

聚合按年单位算,如求每个雇员每年内的每个月份的聚合,该怎样写?结果如下:

SELECT  o1.empid ,
       CONVERT( VARCHAR(7),o1.ordmonth ,121) AS  ordmonth,
        o1.qty AS qtythismonth ,
        SUM(o2.qty) AS totalqty ,
        CAST(AVG(1. * o2.qty) AS NUMERIC(12, 2)) AS avgqty
FROM    EmpOrders AS o1
        JOIN EmpOrders AS o2 ON o2.empid = o1.empid
                                AND ( o2.ordmonth <= o1.ordmonth
                                      AND o2.ordmonth >= CAST(CAST(YEAR(o1.ordmonth) AS CHAR(4))
                                      + '0101' AS DATETIME)
                                    )
GROUP BY o1.empid ,
        o1.ordmonth ,
        o1.qty
ORDER BY o1.empid ,
        o1.ordmonth
View Code

 

所有聚合函数都会忽略NULL值,只有一个例外:Count(*)

聚合中常见的函数为分组函数GROUP BY ,要注意的是 GROUP BY 原则 select后面所有列中 没有使用聚合函数的列必须出现在GROUP BY 后面

 

目录
相关文章
|
3月前
|
SQL 缓存 关系型数据库
SQL如何优化查询?
【8月更文挑战第1天】SQL如何优化查询?
47 1
|
4月前
|
SQL 数据库
【SQL】已解决:SQL分组去重并合并相同数据
【SQL】已解决:SQL分组去重并合并相同数据
80 1
|
SQL
Sql去重查询数据
Sql去重查询数据
119 0
|
6月前
|
SQL 数据采集 分布式计算
Spark SQL中的聚合与窗口函数
Spark SQL中的聚合与窗口函数
|
6月前
|
SQL 数据库
三、SQL的基础查询
三、SQL的基础查询
52 0
基础查询 SQL3查询结果去重&&SQL4查询结果限制返回行数&&SQL5将查询后的列重新命名
基础查询 SQL3查询结果去重&&SQL4查询结果限制返回行数&&SQL5将查询后的列重新命名
178 0
基础查询 SQL3查询结果去重&&SQL4查询结果限制返回行数&&SQL5将查询后的列重新命名
基础查询 SQL1查询所有列 && SQL2 查询多列
基础查询 SQL1查询所有列 && SQL2 查询多列
155 0
基础查询 SQL1查询所有列 && SQL2 查询多列
|
SQL 数据库管理
SQL 基础(四)单关系数据查询
SQL 基础(四)单关系数据查询
185 0
SQL 基础(四)单关系数据查询
|
SQL 存储 数据挖掘
|
SQL 分布式计算 自然语言处理
浅谈ODPS SQL聚合计算与联结
本文针对ODPS SQL以及相应数据表开发进行介绍,主要topic为统计表聚合计算,涉及的内容包括:统计聚合计算样本代码示例,group by筛选痛点介绍,rank与dense_rank函数区别解析,结果输出时联结的运用join, left outer join, right outer join和full outer join的解析。
842 0