【SQL应知应会】分析函数的点点滴滴（二）-阿里云开发者社区

【SQL应知应会】分析函数的点点滴滴（二）

2023-07-01 123 发布于江西

版权

本文内容由阿里云实名注册用户自发贡献，版权归原作者所有，阿里云开发者社区不拥有其著作权，亦不承担相应法律责任。具体规则请查看《阿里云开发者社区用户服务协议》和《阿里云开发者社区知识产权保护指引》。如果您发现本社区中有涉嫌抄袭的内容，填写侵权投诉表单进行举报，一经查实，本社区将立刻删除涉嫌侵权内容。

简介： 【SQL应知应会】分析函数的点点滴滴（三）

1.什么是分析函数：

👉:传送门💖分析函数💖

1.1统计分析函数略解

👉:传送门💖统计分析函数💖

1.2.排序分析函数

👉:传送门💖排序分析函数💖

1.3 开窗函数 ROW 与 RANGE

row 物理行与行中的值是没有关系的

range 逻辑行与行中的值是有关系的

select e.*,

first_value(empno) over (partition by deptno order by sal) rn

from emp e;

select e.*,

first_value(empno) over (partition by deptno order by sal

range between unbounded preceding and current row -- 忽略的Windows子句,与上面没有加Windows子句的sql命令的作用是一样的

) rn

from emp e;

1

2

3

4

5

6

7

8

9

range between unbounded preceding and current row指定了要统计的窗口范围,这个窗口范围也是面向行的,只是比partiton更细,先partiton分组,再按组里面看窗口范围

1.3.1range的窗口范围是负无穷 ~ 当前值(range逻辑行,当前行与行中的值有关,所以到当前值),负无穷是每个组的最上面,正无穷在每个组的下面

所以用first_value的时候,不加range between unbounded preceding and current row这个子句是没有问题的,因为总能统计到第一行

微信图片_20230701101608.png

1.3.2rows看的是物理行,与行中的值是没有关系的

select e.*,

first_value(empno) over (partition by deptno order by sal

rows between unbounded preceding and current row

) rn

from emp e;

1

2

3

4

5

微信图片_20230701101659.png

1.3.3 将first_value换成 last_value，观察 range和 rows

select e.*,

last_value(empno) over (partition by deptno order by sal

range between unbounded preceding and current row) rn

from emp e;

1

2

3

4

微信图片_20230701101711.png

微信图片_20230701101723.png

select e.*,

last_value(empno) over (partition by deptno order by sal

rows between unbounded preceding and current row) rn

from emp e;

1

2

3

4

1.3.4 自定义rows between ... preceding and ...

select e.*,

last_value(empno) over (partition deptno order by sal

rows between 1 preceding and 1 following) rn

from emp e;

1

2

3

4

1 preceding代表的是当前行的前一行， 1 FOLLOWING 则代表的是当前行的后一行

微信图片_20230701101735.png

如果写成unbounded following

UNBOUNDED FOLLOWING 表示在窗口函数中不限制窗口范围的结束位置，也就是说窗口的结束位置一直延伸至最后一行

微信图片_20230701101749.png

1.3.5 自定义range between ... preceding and ...

因为range是逻辑行,与值有关,所以在...中填写的内容应该根据表格中的值来决定

select e.*,

last_value(empno) over (partition by deptno order by sal

range between 400 preceding and 400 following) rn

from emp e;

1

2

3

4

微信图片_20230701101759.png

1.4 统计分析函数详解

1.4.1 分析函数使用sum()进行累计

select t.*,sum(sal) over(partition by deptno order by sal) cum_sum from emp t; -- 分析函数可以写group by,但是不需要

1

在order by后面默认忽略了一个子句range between unbounded preceding and current row ，即默认忽略了一个逻辑行的(-∞~当前值)的子句

但是从下图中可以看出,当有两行的值一样的时候，其实并没有达到我们想要的累计效果

微信图片_20230701101812.png

使用rows进行改进，以达到想要的累计效果

select t.*,

sum(sal) over(partition by deptno order by sal

rows between unbounded preceding and current row

) cum_sum

from emp t;

1

2

3

4

5

微信图片_20230701101834.png

Oracle：

select t.*,

sum(sal) over(partition by deptno order by sal

rows between unbounded preceding and current row

) cum_sum

from emp t;

1

2

3

4

5

微信图片_20230701101845.png

select t.*,

sum(sal) over(partition by deptno order by sal,rowid) cum_sum -- 使用rowid,相当于实现了一个物理行的统计

from emp t;

# oracle 也可以使用rowid,因为rowid是指向内存的唯一的地址,是决定数据库如果找到记录的,这个行号是唯一的

1

2

3

4

微信图片_20230701101858.png

1.4.2 使用count()进行累计

select t.*,

count(sal) over(partition by deptno order by sal,rowid) cum_sum

from emp t;

# 效果与row_number() over()有点像

1

2

3

4

微信图片_20230701101910.png

1.4.3 使用max()进行求最大值

select t.*,

max(sal) over(partition by deptno order by sal) cum_sum -- 求得是最大值,所以就不能用物理行了

from emp t;

1

2

3

微信图片_20230701101926.png

1.5 不使用order by时

# 按照部门编号进行分区,然后使用sum()得到每个组的薪水和

select t.*,

sum(sal) over(partition by deptno) cum_sum

from emp t;

1

2

3

4

微信图片_20230701101946.png

# 统计每组有薪水的人数，因为count()动态忽略null

select t.*,

count(sal) over(partition by deptno) cum_sum

from emp t;

微信图片_20230701102019.png

# 求出了所有人的薪水和

# 分析函数不会减少行数,数据有几行,求完和的结果就有几行

select t.*,

sum(sal) over cum_sum

from emp t;

微信图片_20230701102033.png

求占比

select sal,sal/sum(sal) over() cum_sum,sal/(select sum(sal) from emp) from emp;

1

微信图片_20230701102043.png

【SQL应知应会】分析函数的点点滴滴（二）