可以发现,当指定了排序方式,窗口则会调整为每组的当前行。比如,第一行的SUM为第一个人的成绩,第二行的SUM则为第一个人与第二个人成绩的和,以此类推… …
如果希望对各分组中每行的前2行到后1行的数据进行计算,则可以使用下面的语句:
SELECT name, address, score, SUM(score) OVER (PARTITION BY address ORDER BY score rows BETWEEN 2 PRECEDING AND 1 FOLLOWING) AS SUM FROM student
下图结果中的373.5则为第三行的前两行、当前行与后一行的成绩之和:
6.4 分布函数
6.4.1 CUME_DIST()
🆔 介绍:
用途:分组内小于、等于当前 rank 值的行数/分组内的总行数;
应用场景:查询小于等于当前数据项的行数比例。
🐱 操作示例:
SELECT name, address, score, CUME_DIST() OVER (ORDER BY score) AS RESULT FROM student
在下图中,成绩小于等于85的行数一共有3行,总行数为7行,因此result的值为3/7=0.42857… …
6.4.2 PERCENT_RANK()
🆔 介绍:
用途:每行按照公式(rank-1)/(rows-1)进行计算。其中,rank为RANK() 函数产生的序号,rows为当前窗口记录的总行数;
该方法不常用,简单了解即可。
🐱 操作示例:
SELECT name, address, score, RANK() OVER (ORDER BY score DESC) AS _rank, PERCENT_RANK() OVER (ORDER BY score DESC) AS _percent FROM student
6.5 前后函数-LAG与LEAD
🆔 介绍:
用途:返回位于当前行的前 n 行(LAG(expr,n)) 或者后 n 行(LEAD(expr,n)) 的 expr 的值;
应用场景:查询前一位同学的成绩和当前同学成绩的差值
🐰 操作示例:
在示例中使用LAG查询结果每行显示上一名同学的成绩,命名为 _LAG,如果没有上一行,则默认显示0:
SELECT name, address, score, LAG(score, 1, 0) OVER (ORDER BY score DESC) AS _LAG FROM student
6.6 头尾函数
🆔 介绍:
用途:返回第一个(FIRST_VALUE(expr)) 或者最后一个 (LAST_VALUE(expr)) expr的值;
应用场景:截至当前,按照日期排序查询第一个生日的人的成绩和最后一个人的成绩;
🐰 操作示例:
分别使用FIRST_VALUE与LAST_VALUE查询到目前为止第一个和最后一个生日人的成绩。
SELECT name, address, score, birth, FIRST_VALUE(score) OVER (ORDER BY birth) AS FIRST, LAST_VALUE(score) OVER (ORDER BY birth) AS LAST FROM student
对于查询结果,我们关注FIRST与LAST两列。需要特别注意到目前为止的条件,即结果为到当前行第一个出生或者最后一个出生的成绩!