【大数据开发运维解决方案】Oracle Sql基础查询

本文涉及的产品
云原生大数据计算服务 MaxCompute,5000CU*H 100GB 3个月
云原生大数据计算服务MaxCompute,500CU*H 100GB 3个月
简介: 空字符串在oracle中常常相当于null,为什么不说空字符串等价于null呢,看案例:可以看到,本身deptno是number类型的,而‘’字符串本身是varchar类型,这与null可以是任何类型不同,所以也就不等价。

1、查找空值

null不支持加、减、乘、除、大小比较、相等比较,否则结果只能为空。

SQL> select * from dept where 1>=null;

DEPTNO DNAME          LOC
------ -------------- -------------

SQL> select * from dept where 1<=null;

DEPTNO DNAME          LOC
------ -------------- -------------

SQL> select * from dept where 1+ null<=0;

DEPTNO DNAME          LOC
------ -------------- -------------

SQL> select * from dept where 1+ null>=0;

DEPTNO DNAME          LOC
------ -------------- -------------

SQL> select * from dept where 1* null>=0;

DEPTNO DNAME          LOC
------ -------------- -------------

SQL> select * from dept where deptno=null;

DEPTNO DNAME          LOC
------ -------------- -------------

如果要查某个字段数据为空的记录时,应该用is null而不是=null,并且如果在子查询的查询过滤字段中存在null值而不过滤,那么整个查询结果将会返回空值,原理同上,后面会有具体实验。

2、将空值转换成实际值

nvl和coalesce相比较来说,后者更好用,看下面案例,返回多个值中第一个不为空的值:
先来组织数据:

with v as
 (select null as c1, null as c2, 1 as c3, null as c4, 2 as c5, null as c6
    from dual
  union all
  select null as c1, null as c2, null as c3, 3 as c4, null as c5, 2 as c6
    from dual)
select * from v
with v as
 (select null as c1, null as c2, 1 as c3, null as c4, 2 as c5, null as c6
    from dual
  union all
  select null as c1, null as c2, null as c3, 3 as c4, null as c5, 2 as c6
    from dual)
select coalesce(c1,c2,c3,c4,c5,c6) as c from v

可以看到,相对nvl来说,coalesce支持多个参数,能很方便的返回第一个不为空的值。如果上面的语句改用nvl,就要嵌套好多层,改写coalesce后的语句如下:

select nvl(nvl(nvl(nvl(nvl(c1,c2),c3),c4),c5),c6) as c from v

3、查询满足多个条件的行

对于见查询操作起来比较容易,对于多个条件的组合,要使用括号,这样在更改维护语句时可不再考虑优先级问题,而且可以很容易的借用各种工具找到各个组合的起止位置,比如查询:查询部门10中的所有员工、所有得到提成的员工以及部门20中工资不超过2000美元的员工。

select *
  from emp
 where ((deptno = 10 or comm is not null) or (sal <= 2000 and deptno = 20));

4、引号常用方式

平时用sql查询来生成一个sql脚本或则插入数据时引号的常用处理案例:
a.如果是生成脚本:

select 'insert into emp(empno,ename)values(123,''' || 'aa' || ''');'
  from dual

可以看到,对于生成插入脚本时,如果要插入的列中带有varchar类型数据,'insert into emp(empno,ename)values(123,'这一段本身是一个字符串,需要前后各一个引号引起来,由于后面紧接着aa是字符类型,所以需要引号一起来,又因为引号需要另一个引号做转译,就出现了,''' ||和 ''');'

5、在select语句中使用条件逻辑

这里先说case when,当然还有decode等,后面再一一说。
使用案例:

       with t as (
select (case when sal<=1000 then '0000-1000'
when sal<=2000 then '1000-2000'
  when sal<=300 then '2000-3000'
    when sal<=4000 then '3000-4000'
      when sal<=5000 then '4000-5000'
        else 'high'
          end) as 档次,ename,sal from emp
)
select 档次,count(*) as 人数
from t 
group by 档次
order by 1

或者

    select case deptno
         when 10 then
          'low'
         when 20 then
          'high'
         else
          'ww'
       end as lel
  from emp

6、限制返回的行数

再查询的时候并不需要每次都返回所有数据,比如进行抽查时候会只要求返回几条数据,我们可以通过使用伪例rownum来过滤,rownum依次对返回的每一条数据做一个标识。
如果用rownum=2来查询会发生什么?
因为rownum是依次对数据做标识,要把所有的数据都取出来才能对每条数据标记第一第二第三,然后才能取出来第二,正确的取第二行数据的查询应该是这样的:先生成序号再取第二条记录。

7、从表中随机的返回n条记录

像上面那种查数并不能做到随机返回n条记录,读者可以自己测一下多次执行上面取n条记录的查询,看查询结果就明白了。
这里我们通过使用dbms_random来对数据进行随机排序,然后取其中三行:

with t as (
select a.*,rownum as rm from emp a order by dbms_random.value()
)select * from t where rownum<=3;

多次执行上面sql看查询结果:
可以看出每次执行都是随机的三条,那这里我为什么要嵌套一层?直接这么用不就完事了:
select a.*, rownum as rm
from emp a
where rownum <= 3
order by dbms_random.value()
多次执行看查询结果:

连续三次的查询结果,我们可以看到,虽然上面三个查询结果empno 都是 7499 7521 7369 ,只是这三条记录每次所处的位置不同,这不能算是随机的取三条记录,而是三条一样的记录随机的分配不同的rownum,所以正确的写法是:先随机排序,再取数据。

8、模糊查询

主要说 escape可以 转义特殊有意义字符,看下面几个案例(从网上找了几个案例,懒得写案例了)

9、translate

先看几个案例

SQL> select translate('ab 你好 bdfsdsfs','abdfs','') as a from dual;
A
-
SQL> select translate('ab 你好 bdfsdsfs','abdfs','#') as a from dual;
A
-------
 # 你好
SQL> select translate('ab 你好 bdfsdsfs','1abdfs','1') as a from dual;
A
------
 你好

translate是按照位置进行字符替换,看第一个案例,如果被替换的字符串整体为空,那么整个查询结果也是空,第二个案例按照位置替换,字符a被替换成了#,根据这两个案例,在第三个案例中,要被替换的字符中加了个数字1,用来替换的字符列表中也只写了一个1,看查询结果看到所有的字母就全被替换了。translate用这个方法可以平时过滤一些不想要的字符。

10、nvl/nvl2/nvlliff

nvl(exp1,exp2);作用是如果表达式exp1为空则返回exp2表达式,如果exp1表达式不为空则返回exp1表达式。但nvl函数有一个前提条件是两个参数的数据类型要一样,不然会报错误。如下由于comm是数字类型,所以第二个参数不能是其它类型,不然会报错:

SQL> select nvl(comm,1) as comm from emp;

      COMM
----------
         1
       300
       500
         1
      1400
         1
SQL> select nvl(comm,'a') as comm from emp;
select nvl(comm,'a') as comm from emp

ORA-01722: 无效数字

nvl2(exp1,exp2,exp3);这个函数需要有三个参数。它的使用是如果exp1为空则返回exp3,如果exp1不为空则返回exp2。
但有一点需要注意的是nvl2函数中exp2与exp3数据类型要一样,当exp2与exp3两个参数数据类型不一样的时候,exp3参数数据类型会转换为exp2数据类型,但前提是可以进行转换才可以,如果不能进行转换是会报错误的,看下面案例:

SQL> select nvl2(comm,1,2)as a from emp where deptno=30;

         A
----------
         1
         1
         1
         2
         1
         2

6 rows selected
SQL> select nvl2(comm,'a',2)as a from emp where deptno=30;

A
-
a
a
a
2
a
2

6 rows selected
SQL> select nvl2(comm,2,'a')as a from emp where deptno=30;
select nvl2(comm,2,'a')as a from emp where deptno=30

ORA-01722: 无效数字

第一个案例exp2,exp3数据类型一致没问题,第二个案例中,exp2,exp3数据类型不一致,但是数字2可以转换成varchar类型'2',所以第二个也没报错,但是第三个案例中,字符a不能转成数值类型,所以报错。

nullif(exp1,exp2);它的作用是如果exp1与exp2两个参数的值相等则返回空,如果不相等则返回exp1,同样两个参数的数据类型也要一样。

11、感兴趣的数据排在前面

假如领导对工资在1000-2000之间的员工更感兴趣,于是要求工资在这个范围的员工要排在前面以便优先查看:
当然也可以把case when放到order by中写。

12、union all与空字符串

在使用union all时候,如果上下两个结果集列数不同可以在列少的那一个数据集加null值列补充:

select empno,ename,deptno from emp
union all
select empno,ename ,null from emp

空字符串在oracle中常常相当于null,为什么不说空字符串等价于null呢,看案例:
可以看到,本身deptno是number类型的,而‘’字符串本身是varchar类型,这与null可以是任何类型不同,所以也就不等价。

相关实践学习
基于MaxCompute的热门话题分析
本实验围绕社交用户发布的文章做了详尽的分析,通过分析能得到用户群体年龄分布,性别分布,地理位置分布,以及热门话题的热度。
SaaS 模式云数据仓库必修课
本课程由阿里云开发者社区和阿里云大数据团队共同出品,是SaaS模式云原生数据仓库领导者MaxCompute核心课程。本课程由阿里云资深产品和技术专家们从概念到方法,从场景到实践,体系化的将阿里巴巴飞天大数据平台10多年的经过验证的方法与实践深入浅出的讲给开发者们。帮助大数据开发者快速了解并掌握SaaS模式的云原生的数据仓库,助力开发者学习了解先进的技术栈,并能在实际业务中敏捷的进行大数据分析,赋能企业业务。 通过本课程可以了解SaaS模式云原生数据仓库领导者MaxCompute核心功能及典型适用场景,可应用MaxCompute实现数仓搭建,快速进行大数据分析。适合大数据工程师、大数据分析师 大量数据需要处理、存储和管理,需要搭建数据仓库?学它! 没有足够人员和经验来运维大数据平台,不想自建IDC买机器,需要免运维的大数据平台?会SQL就等于会大数据?学它! 想知道大数据用得对不对,想用更少的钱得到持续演进的数仓能力?获得极致弹性的计算资源和更好的性能,以及持续保护数据安全的生产环境?学它! 想要获得灵活的分析能力,快速洞察数据规律特征?想要兼得数据湖的灵活性与数据仓库的成长性?学它! 出品人:阿里云大数据产品及研发团队专家 产品 MaxCompute 官网 https://www.aliyun.com/product/odps&nbsp;
相关文章
|
2月前
|
Prometheus 运维 监控
Prometheus+Grafana+NodeExporter:构建出色的Linux监控解决方案,让你的运维更轻松
本文介绍如何使用 Prometheus + Grafana + Node Exporter 搭建 Linux 主机监控系统。Prometheus 负责收集和存储指标数据,Grafana 用于可视化展示,Node Exporter 则采集主机的性能数据。通过 Docker 容器化部署,简化安装配置过程。完成安装后,配置 Prometheus 抓取节点数据,并在 Grafana 中添加数据源及导入仪表盘模板,实现对 Linux 主机的全面监控。整个过程简单易行,帮助运维人员轻松掌握系统状态。
287 3
|
2月前
|
存储 分布式计算 安全
MaxCompute Bloomfilter index 在蚂蚁安全溯源场景大规模点查询的最佳实践
MaxCompute 在11月最新版本中全新上线了 Bloomfilter index 能力,针对大规模数据点查场景,支持更细粒度的数据裁剪,减少查询过程中不必要的数据扫描,从而提高整体的查询效率和性能。
|
2月前
|
机器学习/深度学习 人工智能 运维
智能化运维:AI与大数据在IT运维中的应用探索####
本文旨在探讨人工智能(AI)与大数据分析技术如何革新传统IT运维模式,提升运维效率与服务质量。通过具体案例分析,揭示AI算法在故障预测、异常检测及自动化修复等方面的实际应用成效,同时阐述大数据如何助力实现精准运维管理,降低运营成本,提升用户体验。文章还将简要讨论实施智能化运维面临的挑战与未来发展趋势,为IT管理者提供决策参考。 ####
|
3月前
|
运维 监控 关系型数据库
数据库管理中的自动化运维:挑战与解决方案
数据库管理中的自动化运维:挑战与解决方案
|
3月前
|
SQL 算法 大数据
为什么大数据平台会回归SQL
在大数据领域,尽管非结构化数据占据了大数据平台80%以上的存储空间,结构化数据分析依然是核心任务。SQL因其广泛的应用基础和易于上手的特点成为大数据处理的主要语言,各大厂商纷纷支持SQL以提高市场竞争力。然而,SQL在处理复杂计算时表现出的性能和开发效率低下问题日益凸显,如难以充分利用现代硬件能力、复杂SQL优化困难等。为了解决这些问题,出现了像SPL这样的开源计算引擎,它通过提供更高效的开发体验和计算性能,以及对多种数据源的支持,为大数据处理带来了新的解决方案。
|
3月前
|
负载均衡 大数据
大数据散列分区查询频率
大数据散列分区查询频率
33 5
|
3月前
|
运维 监控 安全
云计算环境下的运维挑战与解决方案
本文探讨了云计算环境中运维面临的主要挑战,包括资源管理、自动化部署、安全性问题等,并提出了相应的解决策略。通过案例分析和最佳实践,为云环境下的运维工作提供了指导和参考。
103 1
|
3月前
|
存储 大数据 数据管理
大数据分区提高查询性能
大数据分区提高查询性能
65 2
|
3月前
|
存储 负载均衡 大数据
大数据水平分区提高查询性能
【11月更文挑战第2天】
84 4
|
3月前
|
SQL 存储 算法
比 SQL 快出数量级的大数据计算技术
SQL 是大数据计算中最常用的工具,但在实际应用中,SQL 经常跑得很慢,浪费大量硬件资源。例如,某银行的反洗钱计算在 11 节点的 Vertica 集群上跑了 1.5 小时,而用 SPL 重写后,单机只需 26 秒。类似地,电商漏斗运算和时空碰撞任务在使用 SPL 后,性能也大幅提升。这是因为 SQL 无法写出低复杂度的算法,而 SPL 提供了更强大的数据类型和基础运算,能够实现高效计算。

热门文章

最新文章

推荐镜像

更多