Hive学习---4、函数(单行函数、高级聚合函数、炸裂函数、窗口函数)(一)

简介: Hive学习---4、函数(单行函数、高级聚合函数、炸裂函数、窗口函数)(一)

1、函数

1.1 函数简介

Hive会将常用的逻辑封装成函数给用户进行使用,类似java中的函数。

好处:避免用户反复写逻辑,可以直接拿来使用

重点:用户需要知道函数叫什么,能做什么

Hive提供了大量的内置函数,按照其特点大致可分为如下几类:单行函数、聚合函数、炸裂函数、窗口函数。

以下命令可用于查询所有内置函数的相关信息

--1、查看系统内置函数
show functions
--2、查看内置函数用法
desc function upper
--3查看内置函数详细信息
desc function extended upper

1.2 单行函数

单行函数的特点是一进一出,即输入一行,输出一行。

单行函数按照功能可分为如下几类:日期函数、字符串函数、集合函数、数学函数、流程控制函数。

1.2.1 算术运算函数
运算符 描述
A+B A和B 相加
A-B A减去B
A*B A和B 相乘
A/B A除以B
A%B A对B取余
A&B A和B按位取与
A B
A^B A和B按位取异或
~A A按位取反
--查询出所有员工的薪水后加100显示。
select sal+100 from emp;
1.2.2 数值函数

1、round:四舍五入

select round(3.3) ;   3

2、ceil:向上取整

select ceil(3.1);   4

3、floor:向下取整

select floor(6.8);   6
1.2.3 字符串函数

1、substring:截取字符串

--语法1
--substring(string A,int start)
--返回值:string
--说明:返回字符串A从start位置到结尾的字符串
--(1)获取第二个字符以后得所有字符
select substring("zhmagoodboy",2);  hmagoodboy
--(2)获取倒数第三个字符以后得所有字符
select substring("zhmagoodboy",-3)
boy
--语法2
--substring(string A,int start,int len)
--返回值:string
--说明:返回字符串A从start位置开始,长度为len的字符串
--从第三个字符开始,向后获取2个字符
select substring("zhmagoodboy",3,2)
ma

2、replace:替换

--语法:replace(string A, string B, string C) 
--返回值:string
--说明:将字符串A中的子字符串B替换为C。
select regexp_replace('zhm','h','H')   zHm

3、regexp_replace:正则替换

--语法:regexp_replace(string A,string B,string C)
--返回值:string
--说明:将字符串A中的符合java正则表达式B的部分替换为C。注意,在有些情况下要使用转义字符。
select regexp_replace('100-200','(\\d+)','num') num-num

4、regexp:正则匹配

--语法:字符串 regexp 正则表达式
--返回值:boolean
--说明:若字符串符合正则表达式,则返回true,否则返回false。
--(1)正则匹配成功,输出true
select 'dfsaaaa' regexp 'dfsa+'; true
--(2)正则匹配失败,输出false
select 'dfsaaaa' regexp 'dfsb+'; false

5、repeat:重复字符串

--语法:repeat(string A, int n)
--返回值:string
--说明:将字符串A重复n遍。
select repeat('123',2);  123123

6、spilt:字符串切割

--语法:split(string str, string pat) 
--返回值:array
--说明:按照正则表达式pat匹配到的内容分割str,分割后的字符串,以数组的形式返回。
select spilt('a-b-c-d','-');  ["a","b","c","d"]

7、nvl:替换null值

--语法:nvl(A,B) 
--说明:若A的值不为null,则返回A,否则返回B。 
select nvl(null,1);  1

8、concat:拼接字符串

--语法:concat(string A, string B, string C, ……) 
--返回:string
--说明:将A,B,C……等字符拼接为一个字符串
select concat('beijing','-','shanghai','-','shenzhen')  beijing-shanghai-shenzhen

9、concat_ws:以指定分割符拼接字符串或者字符串数组

--语法:concat_ws(string A, string…| array(string)) 
--返回值:string
--说明:使用分隔符A拼接多个字符串,或者一个数组的所有元素。
select concat_ws('-','beijing','shanghai','shenzhen'); beijing-shanghai-shenzhen

10、get_json_object:解析json字符串

--语法:get_json_object(string json_string,string path)
--返回值:string
--说明:解析json的字符串json_string,返回path指定的内容。如果输入的json字符无效,那么返回null。
--(1)获取json数组里面取得json具体数据
select get_json_object('[{"name":"邹哥哥","sex":"男","age":"24"},{"name":"邹小哥哥","sex":"男","age":"18"}]','$.[0].name');   邹哥哥
--(2)获取json数组里面的数据
 select get_json_object('[{"name":"邹哥哥","sex":"男","age":"24"},{"name":"邹小哥哥","sex":"男","age":"18"}]','$.[0]');
输出:{"name":"邹哥哥","sex":"男","age":"24"}
1.2.4 日期函数

1、unix_timestamp:返回当前或指定时间的时间戳

--语法:unix_timestamp()
--返回值:bigint
select unix_timestamp('2022/08/08','yyyy/MM/dd HH-mm-ss')
输出:1659946088

2、from_unixtime:转化UNIX时间戳(从 1970-01-01 00:00:00 UTC 到指定时间的秒数)到当前时区的时间格式

--语法:from_unixtime(bigint unixtime[, string format]) 
--返回值:string 
select from_unixtime(1659946088);   
输出:2022-08-08 08:08:08

3、current_date:当前日期

select current_date;  
输出:2023-06-2

4、current_timestamp:当前的日期加时间,并且精确的毫秒

select current_timestamp; 
输出:2023-06-2 15:32:22.402

5、month:获取日期中的月

--语法:month (string date) 
--返回值:int 
select month('2023-06-02 08:08:08');
输出:6

6、day:获取日期中的日

--语法:day (string date) 
--返回值:int 
select day('2023-06-02 08:08:08');
输出:2

7、day:获取日期中的小时

--语法:hour (string date) 
--返回值:int 
select hour('2023-06-02 08:08:08');
输出:8

8、datediff:两个日期相差的天数(结束日期减去开始日期的天数)

--语法:datediff(string enddate, string startdate) 
--返回值:int 
select datediff('2021-08-08','2022-10-09')
输出:-427

9、data_add:日期加天数

--语法:date_add(string startdate, int days) 
--返回值:string 
--说明:返回开始日期 startdate 增加 days 天后的日期
select data_add('2023-06-02',2);
输出:2023-06-04

10、date_sub:日期减天数

--语法:date_sub (string startdate, int days) 
--返回值:string 
--说明:返回开始日期startdate减少days天后的日期。
select data_sub('2023-06-04',2);
输出:2023-06-02

11、date_format:将标准日期解析成指定格式字符串

select date_format('2023-06-02','yyyy年-MM月-dd日')
输出:2023年-06月-02月
1.2.5 流程控制函数

1、case when:条件判断函数

--语法1:case when a then b[when c then d] * [else e] end
--返回值:T
--说明:如果a是true ,则返回b;如果c为true ,则返回d;否则返回e
select case when 1=2 then 'tom' when 2=2 then 'mary' else 'tim' end from table ename;
输出结果:mary
--语法2:case a when b then c [when d then e]*[else f] end
--返回值:T
--说明:如果a等于b,那么返回c;如果a等于d,那么返回e;否则返回f
select case 100 when 50 then 'tom' when 100 then 'mary' 
else 'tim' end from tableName;
输出结果:mary

2、if:条件判断,类型java中的三元运算符

-- 语法:if(boolean testCondition,T valueTrue,T valueFalseOrNull)
-- 返回值:T
-- 说明:当条件testCondition为true时,返回valueTrue;否则返回valueFalseOrNull
--(1)条件满足,输出正确
select if(10>5,'正确','错误');
输出:正确
--(2)条件满足,输出错误
select if(10<5,'正确','错误');
输出:错误
相关文章
|
1月前
|
SQL 分布式计算 Hadoop
Hadoop-14-Hive HQL学习与测试 表连接查询 HDFS数据导入导出等操作 逻辑运算 函数查询 全表查询 WHERE GROUP BY ORDER BY(一)
Hadoop-14-Hive HQL学习与测试 表连接查询 HDFS数据导入导出等操作 逻辑运算 函数查询 全表查询 WHERE GROUP BY ORDER BY(一)
38 4
|
1月前
|
SQL
Hadoop-14-Hive HQL学习与测试 表连接查询 HDFS数据导入导出等操作 逻辑运算 函数查询 全表查询 WHERE GROUP BY ORDER BY(二)
Hadoop-14-Hive HQL学习与测试 表连接查询 HDFS数据导入导出等操作 逻辑运算 函数查询 全表查询 WHERE GROUP BY ORDER BY(二)
33 2
|
2月前
|
SQL JavaScript 前端开发
Hive根据用户自定义函数、reflect函数和窗口分析函数
Hive根据用户自定义函数、reflect函数和窗口分析函数
33 6
|
2月前
|
SQL JSON Java
Hive学习-数据查询语句
Hive学习-数据查询语句
33 6
|
6月前
|
SQL 数据采集 数据挖掘
大数据行业应用之Hive数据分析航班线路相关的各项指标
大数据行业应用之Hive数据分析航班线路相关的各项指标
191 1
|
6月前
|
SQL 存储 大数据
【大数据技术Hadoop+Spark】Hive基础SQL语法DDL、DML、DQL讲解及演示(附SQL语句)
【大数据技术Hadoop+Spark】Hive基础SQL语法DDL、DML、DQL讲解及演示(附SQL语句)
253 0
|
6月前
|
SQL 分布式计算 数据库
【大数据技术Spark】Spark SQL操作Dataframe、读写MySQL、Hive数据库实战(附源码)
【大数据技术Spark】Spark SQL操作Dataframe、读写MySQL、Hive数据库实战(附源码)
249 0
|
6月前
|
SQL 存储 分布式计算
【大数据技术Hadoop+Spark】Hive数据仓库架构、优缺点、数据模型介绍(图文解释 超详细)
【大数据技术Hadoop+Spark】Hive数据仓库架构、优缺点、数据模型介绍(图文解释 超详细)
1070 0
|
1月前
|
SQL 分布式计算 Java
大数据-96 Spark 集群 SparkSQL Scala编写SQL操作SparkSQL的数据源:JSON、CSV、JDBC、Hive
大数据-96 Spark 集群 SparkSQL Scala编写SQL操作SparkSQL的数据源:JSON、CSV、JDBC、Hive
34 0
|
4月前
|
SQL 分布式计算 大数据
大数据处理平台Hive详解
【7月更文挑战第15天】Hive作为基于Hadoop的数据仓库工具,在大数据处理和分析领域发挥着重要作用。通过提供类SQL的查询语言,Hive降低了数据处理的门槛,使得具有SQL背景的开发者可以轻松地处理大规模数据。然而,Hive也存在查询延迟高、表达能力有限等缺点,需要在实际应用中根据具体场景和需求进行选择和优化。

热门文章

最新文章