【SQL开发实战技巧】系列(十五):查找最值所在行数据信息及快速计算总和百之max/min() keep() over()、fisrt_value、last_value、ratio_to_report

简介: 本篇文章讲解的主要内容是:***计算部门中那个工资等级的员工最多、通过返回部门10最大工资所在行的员工名称小案例来讲解max/min() keep() over()、通过查询工资最高的人小案例来介绍fisrt_value、last_value、通过计算各个部门的工资合计以及各个部门合计工资占总工资的比例小案例来介绍如何计算百分比及ratio_to_report分析函数的使用***

前言

本篇文章讲解的主要内容是:计算部门中那个工资等级的员工最多、通过返回部门10最大工资所在行的员工名称小案例来讲解max/min() keep() over()、通过查询工资最高的人小案例来介绍fisrt_value、last_value、通过计算各个部门的工资合计以及各个部门合计工资占总工资的比例小案例来介绍如何计算百分比及ratio_to_report分析函数的使用
【SQL开发实战技巧】这一系列博主当作复习旧知识来进行写作,毕竟SQL开发在数据分析场景非常重要且基础,面试也会经常问SQL开发和调优经验,相信当我写完这一系列文章,也能再有所收获,未来面对SQL面试也能游刃有余~。


一、计算部门中哪个工资等级的员工最多

如题,这个需求怎么实现呢?
只需要如下图这么做就可以啦,每一步我都写了简短说明,这里使用的是 dense_rank而不是row_number,否则有失公允。

SQL> with t as
  2   ( --求出来每个部门每个薪资的人数
  3    select sal, deptno, count(*) as cnt from emp group by sal, deptno),
  4  t1 as --根据人数进行排序
  5   (select deptno,
  6           sal,
  7           dense_rank() over(partition by deptno order by cnt desc) as sortrn
  8      from t)
  9  select * from t1  --取出来排名第一的
 10  where sortrn =1;

DEPTNO       SAL     SORTRN
------ --------- ----------
    10   1300.00          1
    10   2450.00          1
    10   5000.00          1
    20   3000.00          1
    30   1250.00          1
                          1

6 rows selected

二、返回最值所在行数据

现在有个需求:返回部门10最大工资所在行的员工名称!
这个解决办法比较多了,我这里给大家提供两种:

  • 1、标量

这里给了三种写法,都比较麻烦,那你感觉数据量大的时候哪个快?

SQL> select deptno,
  2         empno,
  3         (select max(b.ename) from emp b where b.sal = a.max_sal) as 工资最高的人,
  4         ename,
  5         sal
  6    from (select deptno,
  7                 empno,
  8                 max(sal) over(partition by deptno) as max_sal,
  9                 ename,
 10                 sal
 11            from emp a
 12           where deptno = 10) a
 13   order by 1, 5 desc;

DEPTNO EMPNO 工资最高的人 ENAME            SAL
------ ----- ---------- ---------- ---------
    10  7839 KING       KING         5000.00
    10  7782 KING       CLARK        2450.00
    10  7934 KING       MILLER       1300.00

SQL> 
SQL>  with t as
  2    (select max(b.sal) mx from emp b where deptno = 10)
  3   select deptno, empno, ename, sal from emp where sal = (select mx from t);

DEPTNO EMPNO ENAME            SAL
------ ----- ---------- ---------
    10  7839 KING         5000.00
SQL> with t as
  2   (select max(b.sal) mx from emp b where deptno = 10)
  3  select deptno, empno, ename, sal from emp, t where sal = t.mx
  4  ;

DEPTNO EMPNO ENAME            SAL
------ ----- ---------- ---------
    10  7839 KING         5000.00

SQL> 
  • 2、分析函数

在Oracle里有分析函数可以直接满足这个需求,而且还可以方便地同时取最大及最小值:

SQL> select deptno,
  2         empno,
  3         max(ename) keep(dense_rank first order by sal) over(partition by deptno) as 工资最低的人,
  4         max(ename) keep(dense_rank last order by sal) over(partition by deptno) as 工资最搞高的人,
  5         ename,
  6         sal
  7    from emp
  8   where deptno = 10
  9   order by 1, 6 desc;

DEPTNO EMPNO 工资最低的人 工资最搞高的人 ENAME            SAL
------ ----- ---------- ---------- ---------- ---------
    10  7839 MILLER     KING       KING         5000.00
    10  7782 MILLER     KING       CLARK        2450.00
    10  7934 MILLER     KING       MILLER       1300.00

另外,first、last语句也可以放在group里与其他聚合函数一样使用,这时要去掉后面
over(partition by xxx)

SQL> select deptno,
  2         min(sal) as min_sal,
  3         max(ename) keep(dense_rank first order by sal) as 工资最低的人,
  4         max(sal) as max_sal,
  5         max(ename) keep(dense_rank last order by sal) as 工资最搞高的人
  6    from emp
  7   where deptno = 10
  8   group by deptno
  9   order by 1 desc;

DEPTNO    MIN_SAL 工资最低的人    MAX_SAL 工资最搞高的人
------ ---------- ---------- ---------- ----------
    10       1300 MILLER           5000 KING

或许有人注意到,在first、last语句中,我们不管取工资最低还是最高,都用聚合函数MAX。若要搞清楚这个MAX有什么用,需要换一个部门来看:

select deptno,
       empno,
       max(sal) over(partition by deptno) as max_sal,
       ename,
       sal
  from emp
 where deptno = 20
 order by 1, 5 desc;

可以看到,工资最高的有两个人,对于这种数据,first、last语句会出现什么结果呢?

SQL> select deptno,
  2         empno,
  3         ename,
  4         sal,
  5         min(ename)keep(dense_rank last order by sal)over(partition by deptno) as 工资最高的人min,
  6         max(ename)keep(dense_rank last order by sal)over(partition by deptno) as 工资最高的人max
  7    from scott.emp
  8   where deptno = 20
  9   order by 1, 4 desc;

DEPTNO EMPNO ENAME            SAL 工资最高的人MIN 工资最高的人MAX
------ ----- ---------- --------- ---------- ----------
    20  7788 SCOTT        3000.00 FORD       SCOTT
    20  7902 FORD         3000.00 FORD       SCOTT
    20  7566 JONES        2975.00 FORD       SCOTT
    20  7876 ADAMS        1100.00 FORD       SCOTT

工资最高的3000有两个人:SCOTT、FORD。当最值有重复数据时,keep(...)部分得到的是一个数据集(SCOTT,FORD),
这时前面的聚合函数就会起作用:min()max()分别得到"FORD"与"SCOTT"。

三、通过fisrt_value\last_value实现上面返回最值所在行数据

下面来看一个示例:

SQL> SELECT deptno,
  2  empno,
  3  first_value(ename)over(PARTITION BY deptno ORDER BY sal DESC)AS 工资最高的人,
  4  ename,sal
  5  FROM emp
  6  WHERE deptno=10 ORDER BY 1,5 DESC;

DEPTNO EMPNO 工资最高的人 ENAME            SAL
------ ----- ---------- ---------- ---------
    10  7839 KING       KING         5000.00
    10  7782 KING       CLARK        2450.00
    10  7934 KING       MILLER       1300.00

看上去这个语句没有问题,但若把DESC改写为last_value来看一下:

SQL> 
SQL> SELECT deptno,
  2  empno,
  3  last_value(ename)over(PARTITION BY deptno ORDER BY sal)AS 工资最高的人,
  4  ename,sal
  5  FROM emp
  6  WHERE deptno=10 ORDER BY 1,5 DESC;

DEPTNO EMPNO 工资最高的人 ENAME            SAL
------ ----- ---------- ---------- ---------
    10  7839 KING       KING         5000.00
    10  7782 CLARK      CLARK        2450.00
    10  7934 MILLER     MILLER       1300.00

SQL> 

结果不对了哈,下面先直接对比一下语法:

可以看到first_valuelast_valueorder byover()中,这实际上与累加模式类似。
first_value取分组(当然,因为这个查询中只有一个部门,也可以不分组)排序后,最前面一行的数据类似下面的语句:

SQL> SELECT deptno,
  2           empno,
  3           min(sal) over(PARTITION BY deptno ORDER BY sal desc) AS 最高工资,
  4           ename,
  5           sal
  6      FROM emp
  7     WHERE deptno = 10
  8     ORDER BY 1, 5 DESC;

DEPTNO EMPNO       最高工资 ENAME            SAL
------ ----- ---------- ---------- ---------
    10  7839       5000 KING         5000.00
    10  7782       2450 CLARK        2450.00
    10  7934       1300 MILLER       1300.00

last_value取分组排序后,最后面一行的数据类似于下列语句:

SQL> 
SQL> SELECT deptno,
  2           empno,
  3           max(sal) over(PARTITION BY deptno ORDER BY sal) AS 最高工资,
  4           ename,
  5           sal
  6      FROM emp
  7     WHERE deptno = 10
  8     ORDER BY 1, 5;

DEPTNO EMPNO       最高工资 ENAME            SAL
------ ----- ---------- ---------- ---------
    10  7934       1300 MILLER       1300.00
    10  7782       2450 CLARK        2450.00
    10  7839       5000 KING         5000.00

SQL> 

当部门改为20时,要分别取出"FORD"与"SCOTT",用first_value需要更改为:

SQL> SELECT deptno,
  2         empno,
  3         ename,
  4         sal,
  5         first_value(ename)over(partition by deptno order by sal desc,ename) as 工资最高的人min,
  6         first_value(ename)over(partition by deptno order by sal desc,ename desc) as 工资最高的人max
  7    FROM emp
  8   WHERE deptno = 20
  9   ORDER BY 1, 4 DESC;

DEPTNO EMPNO ENAME            SAL 工资最高的人MIN 工资最高的人MAX
------ ----- ---------- --------- ---------- ----------
    20  7902 FORD         3000.00 FORD       SCOTT
    20  7788 SCOTT        3000.00 FORD       SCOTT
    20  7566 JONES        2975.00 FORD       SCOTT
    20  7876 ADAMS        1100.00 FORD       SCOTT
    20  7369 SMITH         800.00 FORD       SCOTT

四、求总和的百分比

现在有个需求:计算各个部门的工资合计以及各个部门合计工资占总工资的比例!
现在给出来两种写:

  • 1、普通写法
SQL> select deptno, sm, ssm, round((nvl(sm, 0) / ssm) * 100, 2) as bl
  2    from (select deptno, sm, sum(sm) over() as ssm
  3            from (select deptno, sum(sal) as sm from emp group by deptno))
  4   order by 1;

DEPTNO         SM        SSM         BL
------ ---------- ---------- ----------
    10       8750      29025      30.15
    20      10875      29025      37.47
    30       9400      29025      32.39
                       29025          0

SQL> 
  • 2、使用ratio_to_report
SQL> select deptno, round(ratio_to_report(sm) over() * 100, 2) as bl
  2    from (select deptno, sum(sal) as sm from emp group by deptno)
  3   order by 1;

DEPTNO         BL
------ ----------
    10      30.15
    20      37.47
    30      32.39

总结

本章节主要介绍的就是如何查询最值所在行的信息,不早了,休息!

相关文章
|
1月前
|
SQL 存储 缓存
SQL Server 数据太多如何优化
11种优化方案供你参考,优化 SQL Server 数据库性能得从多个方面着手,包括硬件配置、数据库结构、查询优化、索引管理、分区分表、并行处理等。通过合理的索引、查询优化、数据分区等技术,可以在数据量增大时保持较好的性能。同时,定期进行数据库维护和清理,保证数据库高效运行。
|
2月前
|
SQL 移动开发 Oracle
SQL语句实现查询连续六天数据的方法与技巧
在数据库查询中,有时需要筛选出符合特定时间连续性条件的数据记录
|
2月前
|
SQL 存储 关系型数据库
添加数据到数据库的SQL语句详解与实践技巧
在数据库管理中,添加数据是一个基本操作,它涉及到向表中插入新的记录
|
2月前
|
SQL 数据挖掘 数据库
SQL查询每秒的数据:技巧、方法与性能优化
id="">SQL查询功能详解 SQL(Structured Query Language,结构化查询语言)是一种专门用于与数据库进行沟通和操作的语言
|
2月前
|
SQL 存储 缓存
SQL计算班级语文平均分:详细步骤与技巧
在数据库管理和分析中,经常需要计算某个班级在特定科目上的平均分
|
2月前
|
SQL 监控 数据处理
SQL数据库数据修改操作详解
数据库是现代信息系统的重要组成部分,其中SQL(StructuredQueryLanguage)是管理和处理数据库的重要工具之一。在日常的业务运营过程中,数据的准确性和及时性对企业来说至关重要,这就需要掌握如何在数据库中正确地进行数据修改操作。本文将详细介绍在SQL数据库中如何修改数据,帮助读者更好
447 4
|
2月前
|
SQL 分布式计算 关系型数据库
Hadoop-24 Sqoop迁移 MySQL到Hive 与 Hive到MySQL SQL生成数据 HDFS集群 Sqoop import jdbc ETL MapReduce
Hadoop-24 Sqoop迁移 MySQL到Hive 与 Hive到MySQL SQL生成数据 HDFS集群 Sqoop import jdbc ETL MapReduce
105 0
|
2月前
|
SQL 分布式计算 关系型数据库
Hadoop-23 Sqoop 数据MySQL到HDFS(部分) SQL生成数据 HDFS集群 Sqoop import jdbc ETL MapReduce
Hadoop-23 Sqoop 数据MySQL到HDFS(部分) SQL生成数据 HDFS集群 Sqoop import jdbc ETL MapReduce
49 0
|
3月前
|
关系型数据库 MySQL 网络安全
5-10Can't connect to MySQL server on 'sh-cynosl-grp-fcs50xoa.sql.tencentcdb.com' (110)")
5-10Can't connect to MySQL server on 'sh-cynosl-grp-fcs50xoa.sql.tencentcdb.com' (110)")
|
5月前
|
SQL 存储 监控
SQL Server的并行实施如何优化?
【7月更文挑战第23天】SQL Server的并行实施如何优化?
134 13