开发者社区> 技术小阿哥> 正文
阿里云
为了无法计算的价值
打开APP
阿里云APP内打开

Oracle单表去重

简介:
+关注继续查看
去重有两层含义,一是记录完全一样。而是符合一定条件的认为是重复。
 
根据表的数量,去重可划分为单表去重和多表关联去重。
 
对于去重,一般最容易想到的是用distinct,而distinct只能对完全重复的记录保留一条。distinct使用的是二重循环来去重的,如果数据量非常大的时候,会导致性能急剧下降。
 
下面是一个单表去重的测试,认为name字段相同的即为重复记录,要查询出一个结果,过滤掉重复,distinct显然不能满足要求。
 
表SQL:
create table A_TEST    
(    
        id                 number,    
        name         varchar2(20),    
        remark varchar2(20)    
);    

insert into A_TEST (ID, NAME, REMARK)    
values (1, 'a''ss');    

insert into A_TEST (ID, NAME, REMARK)    
values (2, 'b''xxx');    

insert into A_TEST (ID, NAME, REMARK)    
values (3, 'b''x');    

insert into A_TEST (ID, NAME, REMARK)    
values (4, 'b''asd');    

insert into A_TEST (ID, NAME, REMARK)    
values (5, 'c''axxx');    

insert into A_TEST (ID, NAME, REMARK)    
values (6, 'c''asdf');    
 
 
去重方式一(低效):
select a.*    
        from A_TEST a, (select min(id) as id from A_TEST t group by name) b    
where a.id = b.id;
 

去重方式一(高效):
select *    
        from (select a.*, rownum row_num from A_TEST a) x    
where x.row_num in (select min(rownum) from A_TEST t group by name)
 
 
可见,使用rownum的效率比使用id的效率要高,当表数据量很大的时候,差距会很明显。


本文转自 leizhimin 51CTO博客,原文链接:http://blog.51cto.com/lavasoft/368087,如需转载请自行联系原作者

版权声明:本文内容由阿里云实名注册用户自发贡献,版权归原作者所有,阿里云开发者社区不拥有其著作权,亦不承担相应法律责任。具体规则请查看《阿里云开发者社区用户服务协议》和《阿里云开发者社区知识产权保护指引》。如果您发现本社区中有涉嫌抄袭的内容,填写侵权投诉表单进行举报,一经查实,本社区将立刻删除涉嫌侵权内容。

相关文章
Oracle 数据库性能优化3日实战(企业培训)
课程名称一: Oracle性能优化及调整 课程时长 1天 课程深度: 高级 上机实验: 10%-30% 授课对象: Oracle开发人员、Oracle数据库管理人员,应用程序开发人员 课程描述: 本课程讲述Oracle数据库物理层规划,系统性能的监控,数据库性能参数调整,统计信息的收集,使用自动化调试工具优化数据库,I/O子系统的配置与设计以及性能优化方法论等。
1828 0
[20141024]使用emacs连接使用oracle数据库
[20141024]使用emacs连接使用oracle数据库.txt --前一阵子跟别人学习了使用emacs连接数据库.自己做一个简单记录. 1.首先需要安装emacs.
935 0
Oracle 10g Express Edition(XE) 转至数据库主页中文乱码问题的解决
Oracle 10g Express Edition是Oracle专门为小型用户提供的免费版本。
886 0
13688
文章
0
问答
文章排行榜
最热
最新
相关电子书
更多
低代码开发师(初级)实战教程
立即下载
阿里巴巴DevOps 最佳实践手册
立即下载
冬季实战营第三期:MySQL数据库进阶实战
立即下载