row_number()over(partition by col1 order by col2)
表示根据col1
分组,在分组内部根据col2
排序,而此函数计算的值就表示每组内部排序后的顺序编号(组内连续的唯一的)。 与rownum
的区别在于:使用rownum
进行排序的时候是先对结果集加入伪劣rownum
然后再进行排序,而row_number()
在包含排序从句后是先排序再计算行号码。
一、oracle中rownum
用于从查询返回的行的编号,返回的第一行分配的是1,第二行是2,依此类推,这个伪字段可以用于限制查询返回的总行数,而且rownum
不能以任何表的名称作为前缀。
1、rownum
对于等于某值的查询条件
如果希望找到学生表中第一条学生的信息,可以使用rownum=1
作为条件。但是想找到学生表中第二条学生的信息,使用rownum=2
结果查不到数据。因为rownum
都是从1开始,但是1以上的自然数在rownum
做等于判断是时认为都是false
条件,所以无法查到rownum = n
(n>1的自然数)。
SQL> select rownum,id,name from student where rownum=1; --有记录 SQL> select rownum,id,name from student where rownum =2; --无记录
2、rownum
对于大于某值的查询条件
如果想找到从第二行记录以后的记录,当使用rownum>2
是查不出记录的,可以使用以下的子查询方法来解决。注意子查询中的rownum
必须要有别名,否则还是不会查出记录来,这是因为rownum
不是某个表的列,如果不起别名的话,无法知道rownum
是子查询的列还是主查询的列。
SQL>select * from(select rownum no ,id,name from student) where no>2; --有记录 SQL> select * from(select rownum,id,name from student)where rownum>2; --无记录
3、rownum对于小于某值的查询条件
如果想找到第三条记录以前的记录,当使用rownum<3
是能得到两条记录的。显然rownum
对于rownum<n
((n>1的自然数)的条件认为是成立的,所以可以找到记录。
SQL> select rownum,id,name from student where rownum <3; --有记录
4、rownum和排序
Oracle中的rownum
的是在取数据的时候产生的序号,所以想对指定排序的数据去指定的rowmun
行数据就必须注意了。
SQL> select rownum ,id,name from student order by name;
ROWNUM ID NAME ---------- ------ --------------------------------------------------- 3 200003 李三 2 200002 王二 1 200001 张一 4 200004 赵四
可以看出,rownum
并不是按照name
列来生成的序号。系统是按照记录插入时的顺序给记录排的号,rowid
也是顺序分配的。为了解决这个问题,必须使用子查询
SQL> select rownum ,id,name from (select * from student order by name);
ROWNUM ID NAME ---------- ------ --------------------------------------------------- 1 200003 李三 2 200002 王二 3 200001 张一 4 200004 赵四
二、oracle中row_number()
1、row_number() over (order by col_1[,col_2 ...])
按照col_1[,col_2 ...]
排序,返回排序后的结果集,并且为每一行返回一个不相同的值。
2、row_number() over (partition by col_n[,col_m ...] order by col_1[,col_2 ...])
先按照col_n[,col_m ...
进行分组,再在每个分组中按照col_1[,col_2 ...]
进行排序(升序),最后返回排好序后的结果集
oracle
中row_number()
实例
1.使用row_number()
函数进行编号,如
select email,customerID, ROW_NUMBER() over(order by psd) as rows from QT_Customer
原理:先按psd进行排序,排序完后,给每条数据进行编号。
2.在订单中按价格的升序进行排序,并给每条记录进行排序代码如下:
select DID,customerID,totalPrice,ROW_NUMBER() over(order by totalPrice) as rows from OP_Order
3、统计每一个客户最近下的订单是第几次下的订单。
with tabs as ( select ROW_NUMBER() over(partition by customerID order by totalPrice) as rows,customerID,totalPrice, DID from OP_Order )
select MAX(rows) as '下单次数',customerID from tabs group by customerID
4、在使用over
等开窗函数时,over
里头的分组及排序的执行晚于“where,group by,order by”的执行。
select ROW_NUMBER() over(partition by customerID order by insDT) as rows, customerID,totalPrice, DID from OP_Order where insDT>'2011-07-22'
以上代码是先执行where
子句,执行完后,再给每一条记录进行编号。
三、row_number()
与rownum
的区别
使用rownum
进行排序的时候是先对结果集加入伪劣rownum
然后再进行排序,而row_number()
在包含排序从句后是先排序再计算行号码。
If opportunity doesn’t knock, build a door
rownum,rowid,row_number()及oracle分页查询
1.rownum
和rowid
都是伪列,但两者的根本是不同的,rownum
是根据sql
查询出来的结果给每行分配一个逻辑编号,不同的sql
也就会导致rownum
不同,但是rowid
是物理结构上的,在每条记录Insert
到数据库时,就会有一个唯一的物理记录。rowid
可以说是物理存在的,表示记录在表空间中的一个唯一位置ID,在DB
中唯一。只要记录没被搬动过,rowid
是不变的。rowid
相对于表来说相当于一般列。
rownum
常用语分页查询,rowid
则常用语去除重复记录。
2.rownum
是对结果集加的一个伪列,即先查到结果集之后再加上去的一个列(先有结果集)。简单的说,rownum
是对符合条件结果的序列号。总是从1开始排起,所以选出的结果中不能没有1而有其他大于1
的值。
也可以理解为rownum
是oracle
数据库从数据文件或缓冲区中读取数据的顺序。它取得第一条记录则rownum
为1,
第2条为2。如果使用>,>=,=,between...and
这些条件,因为从缓冲区或数据文件中得到的第一条记录的rownum
为1,则被删除,接着取下条,可是rownum
依旧为1
,有被删除,便没有了数据。
case1:
SQL> select * from emp where rownum between 2 and 5; EMPNO ENAME JOB MGR HIREDATE SAL COMM DEPTNO ----- ---------- --------- ----- ----------- --------- --------- ------
case2:
SQL> select * from emp where rownum<>3; EMPNO ENAME JOB MGR HIREDATE SAL COMM DEPTNO ----- ---------- --------- ----- ----------- --------- --------- ------ 7369 SMITH CLERK 7902 1980/12/17 800.00 20 7499 ALLEN SALESMAN 7698 1981/2/20 1600.00 300.00 30
case3:
SQL> select * from emp where rownum>0; EMPNO ENAME JOB MGR HIREDATE SAL COMM DEPTNO ----- ---------- --------- ----- ----------- --------- --------- ------ 7369 SMITH CLERK 7902 1980/12/17 800.00 20 7499 ALLEN SALESMAN 7698 1981/2/20 1600.00 300.00 30 7521 WARD SALESMAN 7698 1981/2/22 1250.00 500.00 30 7566 JONES MANAGER 7839 1981/4/2 2975.00 20 7654 MARTIN SALESMAN 7698 1981/9/28 1250.00 1400.00 30 7698 BLAKE MANAGER 7839 1981/5/1 2850.00 30 7782 CLARK MANAGER 7839 1981/6/9 2450.00 10 7788 SCOTT ANALYST 7566 1987/4/19 3000.00 20 7839 KING PRESIDENT 1981/11/17 5000.00 10 7844 TURNER SALESMAN 7698 1981/9/8 1500.00 0.00 30 7876 ADAMS CLERK 7788 1987/5/23 1100.00 20 7900 JAMES CLERK 7698 1981/12/3 950.00 30 7902 FORD ANALYST 7566 1981/12/3 3000.00 20 7934 MILLER CLERK 7782 1982/1/23 1300.00 10 14 rows selected
case4:
SQL> select * from emp where rownum between 1 and 3; EMPNO ENAME JOB MGR HIREDATE SAL COMM DEPTNO ----- ---------- --------- ----- ----------- --------- --------- ------ 7369 SMITH CLERK 7902 1980/12/17 800.00 20 7499 ALLEN SALESMAN 7698 1981/2/20 1600.00 300.00 30 7521 WARD SALESMAN 7698 1981/2/22 1250.00 500.00 30
3.rownum
和row_numbe() over
:
使用rownum
进行排序的时候是先对结果集加入伪列rownum
然后再进行排序,而row_number()
在包含排序从句后是先排序再计算行号码
case:
order by:
SQL> select a.*,rownum from emp a order by a.ename; EMPNO ENAME JOB MGR HIREDATE SAL COMM DEPTNO ROWNUM ----- ---------- --------- ----- ----------- --------- --------- ------ ---------- 7876 ADAMS CLERK 7788 1987/5/23 1100.00 20 11 7499 ALLEN SALESMAN 7698 1981/2/20 1600.00 300.00 30 2 7698 BLAKE MANAGER 7839 1981/5/1 2850.00 30 6 7782 CLARK MANAGER 7839 1981/6/9 2450.00 10 7 7902 FORD ANALYST 7566 1981/12/3 3000.00 20 13 7900 JAMES CLERK 7698 1981/12/3 950.00 30 12 7566 JONES MANAGER 7839 1981/4/2 2975.00 20 4 7839 KING PRESIDENT 1981/11/17 5000.00 10 9 7654 MARTIN SALESMAN 7698 1981/9/28 1250.00 1400.00 30 5 7934 MILLER CLERK 7782 1982/1/23 1300.00 10 14 7788 SCOTT ANALYST 7566 1987/4/19 3000.00 20 8 7369 SMITH CLERK 7902 1980/12/17 800.00 20 1 7844 TURNER SALESMAN 7698 1981/9/8 1500.00 0.00 30 10 7521 WARD SALESMAN 7698 1981/2/22 1250.00 500.00 30 3 14 rows selected
row_number() over(order by )
SQL> select a.*,row_number() over(order by a.ename) from emp a; EMPNO ENAME JOB MGR HIREDATE SAL COMM DEPTNO ROW_NUMBER()OVER(ORDERBYA.ENAM ----- ---------- --------- ----- ----------- --------- --------- ------ ------------------------------ 7876 ADAMS CLERK 7788 1987/5/23 1100.00 20 1 7499 ALLEN SALESMAN 7698 1981/2/20 1600.00 300.00 30 2 7698 BLAKE MANAGER 7839 1981/5/1 2850.00 30 3 7782 CLARK MANAGER 7839 1981/6/9 2450.00 10 4 7902 FORD ANALYST 7566 1981/12/3 3000.00 20 5 7900 JAMES CLERK 7698 1981/12/3 950.00 30 6 7566 JONES MANAGER 7839 1981/4/2 2975.00 20 7 7839 KING PRESIDENT 1981/11/17 5000.00 10 8 7654 MARTIN SALESMAN 7698 1981/9/28 1250.00 1400.00 30 9 7934 MILLER CLERK 7782 1982/1/23 1300.00 10 10 7788 SCOTT ANALYST 7566 1987/4/19 3000.00 20 11 7369 SMITH CLERK 7902 1980/12/17 800.00 20 12 7844 TURNER SALESMAN 7698 1981/9/8 1500.00 0.00 30 13 7521 WARD SALESMAN 7698 1981/2/22 1250.00 500.00 30 14 14 rows selected
case1:在最外层控制分页的最小值和最大值
SELECT * FROM (SELECT A.*, ROWNUM RN FROM GAS_CA.A_CARD_METER_PAY A WHERE A.PURCH_GAS_TIME BETWEEN TO_DATE('2015/1/1', 'YYYY/MM/DD') AND TO_DATE('2016/1/1', 'YYYY/MM/DD') AND A.ORG_NO LIKE '1009%') WHERE RN BETWEEN 10 AND 20;
case2:
SELECT * FROM (SELECT ROWNUM RN, A.* FROM GAS_CA.A_CARD_METER_PAY A WHERE A.PURCH_GAS_TIME BETWEEN TO_DATE('2015/1/1', 'YYYY/MM/DD') AND TO_DATE('2016/1/1', 'YYYY/MM/DD') AND A.ORG_NO LIKE '1009%' AND ROWNUM <= 20) WHERE RN >= 10;
对于case1
和case2
,绝大多数情况下,case2
要比第一个查询效率高得多。
因为在CBO
优化模式下,oracle
可以将外层的查询条件推到内层查询中,以提高内层查询的执行效率。对于第二份语句,第二层的查询条件where rownum<=40
就可以被oracle推入到内层查询中,这样oracle查询的结果一旦查过rownum
限制的条件,就终止查询将结果返回。而第一个语句,oracle
无法将第三层的条件推到最内层(即使推到最内层也没有意义,因为不知道RN代表什么)。
case3:有order by 的写法(较高效率)
SELECT T1.*, RN FROM (SELECT ROWNUM RN, T.* FROM (SELECT * FROM GAS_CA.A_CARD_METER_PAY A WHERE A.PURCH_GAS_TIME BETWEEN TO_DATE('2015/1/1', 'YYYY/MM/DD') AND TO_DATE('2016/1/1', 'YYYY/MM/DD') AND A.ORG_NO LIKE '1009%' ORDER BY A.PURCH_GAS_TIME) T WHERE ROWNUM <= 20) T1 WHERE RN >= 10;
case4:将查询条件放置最外层
SELECT * FROM (SELECT T.*, ROWNUM RN FROM (SELECT * FROM GAS_CA.A_CARD_METER_PAY A WHERE A.PURCH_GAS_TIME BETWEEN TO_DATE('2015/1/1', 'YYYY/MM/DD') AND TO_DATE('2016/1/1', 'YYYY/MM/DD') AND A.ORG_NO LIKE '1009%' ORDER BY A.PURCH_GAS_TIME) T) T1 WHERE T1.RN BETWEEN 10 AND 20;
ORACLE中的rownum排序及row_number()排序的区别
ORACLE
中常用的是通过rownum
来分页,下面来讨论下rownum
分页的原理,rownum
分页排序和row_number()
函数分页排序的区别。
菜鸟第一次用rownum
容易犯的错:
select * from emp where rownum>=5 and rownum<=10
执行后返回的结果集是空的。因为rownum
是oracle
预处理字段,默认标序是1,只有记录集已经满足条件后才会进行后续编号。这样你查询emp表时遍历第一条数据时rownum
是1
,不符合条件,继续遍历到第二条数据rownum
仍为1
,仍不符合条件,直至遍历完所有数据,都无数据返回。所以正确的写法是:
select * from (select rownum r,emp.* from emp where rownum<=10)e where e.r>=5
来简单解释下,首先此语句中select rownum r,emp.* from emp where
rownum<=10
被执行后当做一个视图(这里说下什么时候查询是一个视图什么时候叫子查询,在from
后面的嵌套查询是视图,在where后的嵌套查询是子查询),这个视图中的数据:包括emp
表中rownum
从1到10的数据,和一个真实列r列(可理解为此时rownum
伪列已插入到视图中被当做真实列),然后e.r表示查询这个视图中列r数字大于5的记录。
若你不写e.r而是写rownum>=5
依旧没有数据返回,是因为此时再写rownum
是查询视图时重新生成伪列rownum
了,而未用那个真实列r。就会犯上面的第一个错误。
下面继续说通过rownum
分页和row_number()
函数的区别。
我们如果想查得通过empno
排序后的分页数据,看几条sql:
sql1:
select * from (select rownum rr,emp.* from emp where rownum<=10 order by empno)v where v.rr>=5
sql2:
select * from (select rownum rr,e.* from (select * from emp order by empno)e where rownum<=10)v where v.rr>=5
sql3:
select * from (select row_number() over(order by empno) rr,emp.ename from emp)v where rr between 5 and 10
执行后发现都能返回结果集,但是sql1返回的结果集却不是我们想要的。
将sql1中的子查询提出来看:
select rownum rr,emp.* from emp where rownum<=10 order by empno
这条语句parse
的顺序是先执行from
语句,再执行where
再执行order by
。where rownum<=10
执行完后会随机取出10条数据,这10条数据的rownum
是1到10,再对这10条数据根据进行排序。这样就不是我们想得到的。
sql2,sql3执行后返回的结果都是我们想要的。sql2
是现在子查询中排完序再进行rownum
的筛选。
总结下,rownum
排序和row_number()
的区别:使用rownum
进行排序的时候是先对结果集加入伪列rownum
后再进行排序(如sql1的结果),而row_number()
在通过over()
里的排序过后再对每列加上一个数字,从以上三条sql可看出,rownum
排序用到了起码三层嵌套执行效率上不如row_number()
.