🍁 一、分析函数语法
function_name(<argument>,<argument>...) over(<partition_Clause><order by_Clause><windowing_Clause>);
🍃 1.1 参数详解
function_name():函数名称
argument:参数
over( ):开窗函数
partition_Clause:分区子句,数据记录集分组,group by…
order by_Clause:排序子句,数据记录集排序,order by…
windowing_Clause:开窗子句,定义分析函数在操作行的集合,三种开窗方式:rows、range、Specifying
注:使用开窗子句时一定要有排序子句!!!
🍃 1.2 常用分析函数
row_number() over(partition by … order by …)
rank() over(partition by … order by …)
dense_rank() over(partition by … order by …)
count() over(partition by … order by …)
max() over(partition by … order by …)
min() over(partition by … order by …)
sum() over(partition by … order by …)
avg() over(partition by … order by …)
first_value() over(partition by … order by …)
last_value() over(partition by … order by …)
lag() over(partition by … order by …)
lead() over(partition by … order by …)
🍁 二、汇总
1、count() over() :统计分区中各组的行数,partition by 可选,order by 可选
2、sum() over() :统计分区中记录的总和,partition by 可选,order by 可选
3、avg() over() :统计分区中记录的平均值,partition by 可选,order by 可选
4、min() over() :统计分区中记录的最小值,partition by 可选,order by 可选
5、 max() over() :统计分区中记录的最大值,partition by 可选,order by 可选
🍃 2.1 总计数
–总计数,统计所有行的总数
select ename,deptno,count(*) over() from emp;
🍃 2.2 递加累计求和
–,先排序,再递加累计求和
select ename,deptno,sal,hiredate,sum(sal) over(order by hiredate) from emp;
🍃 2.3 分组求平均值
–先分组,再对组内求平均值
select ename,deptno,job,sal,avg(sal) over(partition by job) from emp;
🍃 2.4 分组递加求最大
–先分组排序,再对组内求最大值
select ename,deptno,job,hiredate,sal,
max(sal)over(partition by job order by hiredate ) from emp;
🍁 三、排序
🍃 3.1 无重复值排序
row_number() over() :排序,无重复值,partition by 可选,order by 必选
select row_number() over(order by a.sal desc) rak,a.* from emp a;
当SAL相同时,按顺序排序
–先分组,再对组内排序,无重复值
select row_number() over(partition by deptno order by a.sal desc) rak,a.* from emp a;
🍃 3.2 排序连续
dense_rank() :连续排序,partition by 可选,order by 必选
–当值相同时,排序是连续的
select dense_rank() over(partition by deptno order by a.sal desc) rak,a.* from emp a;
🍃 3.3 排序跳跃
rank() over() :跳跃排序,partition by 可选,order by 必选
当值相同时,排序是跳跃的
select rank() over(partition by deptno order by a.sal desc) rak,a.* from emp a;、
🍁 四、KEEP函数
max(#) keep(dense_rank first order by # desc)
min(#) keep(dense_rank last order by # desc)
从DENSE_RANK返回的集合中取出排在最后面或者最前面的一个值的行
可能多行,因为值可能相等,因此完整的语法需要在开始处加上一个集合函数以从中取出记录
select job, max(sal) keep(dense_rank first order by sal desc), max(sal) keep(dense_rank last order by sal desc) from emp group by job;
🍁 五、开窗函数
指定了分析函数工作的数据窗口大小,这个数据窗口大小可能会随着行的变化而变化 50 preceding:前50行 150 following:后150行 UNBOUNDED :不受控的,无限的 current row 当前行 // 从当前行到最后的数据 between current row and unbounded following //前面所有行与当前行的累加 rows between unbounded preceding and current row //前一行的值+当前行的值+后一行的值 rows between 1 preceding and 1 following //开始到结束的所有数据 ROWS BETWEEN UNBOUNDED PRECEDING AND UNBOUNDED FOLLOWING
🍃 5.1 ROW窗口
rows是物理窗口,在一组内基于任意变化或固定的窗口中,可以用该子句来让分析函数计算它的值
这将在一组内创建一个变化的窗口,请注意,要使用窗口,必须使用ORDER BY 子句
select deptno,ename,sal,deptno, sum(sal) over( partition by deptno order by ename rows 2 preceding )sliding_total from emp
🍃 5.2 Range窗口
range是逻辑窗口,是对范围进行统计
是指定当前行对应值的范围取值,列数不固定,只要行值在范围内,对应列都包含在内
有数字,记住precding,就是减,following是加, 统计在这个范围内的数据
rows表示行,就是前n行,后n行
而range表示的是具体的值,比这个值小n的行,比这个值大n的行
range between是以当前值为锚点进行计算
range between 4 preceding AND 7 following
表示:如果当前值为10的话就取前后的值在6到17之间的数据。
sum(close) range between 100 preceding and 200 following
表示:通过字段差值来进行选择。如当前行的 close 字段值是 200,
那么这个窗口大小的定义就会选择分区中 close 字段值落在 100 至 400 区间的记录(行)。
select ename,hiredate,sal,deptno, sum(sal) over(partition by deptno order by sal asc range 100 preceding) sum_sal from emp;