Hive学习---4、函数（单行函数、高级聚合函数、炸裂函数、窗口函数）（一）-阿里云开发者社区

Hive学习---4、函数（单行函数、高级聚合函数、炸裂函数、窗口函数）（一）

2023-08-04 341 发布于吉林

版权

本文内容由阿里云实名注册用户自发贡献，版权归原作者所有，阿里云开发者社区不拥有其著作权，亦不承担相应法律责任。具体规则请查看《阿里云开发者社区用户服务协议》和《阿里云开发者社区知识产权保护指引》。如果您发现本社区中有涉嫌抄袭的内容，填写侵权投诉表单进行举报，一经查实，本社区将立刻删除涉嫌侵权内容。

简介： Hive学习---4、函数（单行函数、高级聚合函数、炸裂函数、窗口函数）（一）

1、函数

1.1 函数简介

Hive会将常用的逻辑封装成函数给用户进行使用，类似java中的函数。

好处：避免用户反复写逻辑，可以直接拿来使用

重点：用户需要知道函数叫什么，能做什么

Hive提供了大量的内置函数，按照其特点大致可分为如下几类：单行函数、聚合函数、炸裂函数、窗口函数。

以下命令可用于查询所有内置函数的相关信息

--1、查看系统内置函数
show functions
--2、查看内置函数用法
desc function upper
--3查看内置函数详细信息
desc function extended upper

1.2 单行函数

单行函数的特点是一进一出，即输入一行，输出一行。

单行函数按照功能可分为如下几类：日期函数、字符串函数、集合函数、数学函数、流程控制函数。

1.2.1 算术运算函数

运算符	描述
A+B	A和B 相加
A-B	A减去B

A*B	A和B 相乘
A/B	A除以B
A%B	A对B取余

A&B	A和B按位取与
A	B
A^B	A和B按位取异或
~A	A按位取反

--查询出所有员工的薪水后加100显示。
select sal+100 from emp;

1.2.2 数值函数

1、round：四舍五入

select round(3.3) ;   3

2、ceil：向上取整

select ceil(3.1);   4

3、floor：向下取整

select floor(6.8);   6

1.2.3 字符串函数

1、substring：截取字符串

--语法1
--substring(string A,int start)
--返回值：string
--说明：返回字符串A从start位置到结尾的字符串
--（1）获取第二个字符以后得所有字符
select substring("zhmagoodboy",2);  hmagoodboy
--（2）获取倒数第三个字符以后得所有字符
select substring("zhmagoodboy",-3)
boy
--语法2
--substring(string A,int start,int len)
--返回值：string
--说明：返回字符串A从start位置开始，长度为len的字符串
--从第三个字符开始，向后获取2个字符
select substring("zhmagoodboy",3,2)
ma

2、replace：替换

--语法：replace(string A, string B, string C) 
--返回值：string
--说明：将字符串A中的子字符串B替换为C。
select regexp_replace('zhm','h','H')   zHm

3、regexp_replace:正则替换

--语法：regexp_replace(string A,string B,string C)
--返回值：string
--说明：将字符串A中的符合java正则表达式B的部分替换为C。注意，在有些情况下要使用转义字符。
select regexp_replace('100-200','(\\d+)','num') num-num

4、regexp：正则匹配

--语法：字符串 regexp 正则表达式
--返回值：boolean
--说明：若字符串符合正则表达式，则返回true，否则返回false。
--(1)正则匹配成功，输出true
select 'dfsaaaa' regexp 'dfsa+'; true
--(2)正则匹配失败，输出false
select 'dfsaaaa' regexp 'dfsb+'; false

5、repeat：重复字符串

--语法：repeat(string A, int n)
--返回值：string
--说明：将字符串A重复n遍。
select repeat('123',2);  123123

6、spilt：字符串切割

--语法：split(string str, string pat) 
--返回值：array
--说明：按照正则表达式pat匹配到的内容分割str，分割后的字符串，以数组的形式返回。
select spilt('a-b-c-d','-');  ["a","b","c","d"]

7、nvl：替换null值

--语法：nvl(A,B) 
--说明：若A的值不为null，则返回A，否则返回B。 
select nvl(null,1);  1

8、concat：拼接字符串

--语法：concat(string A, string B, string C, ……) 
--返回：string
--说明：将A,B,C……等字符拼接为一个字符串
select concat('beijing','-','shanghai','-','shenzhen')  beijing-shanghai-shenzhen

9、concat_ws:以指定分割符拼接字符串或者字符串数组

--语法：concat_ws(string A, string…| array(string)) 
--返回值：string
--说明：使用分隔符A拼接多个字符串，或者一个数组的所有元素。
select concat_ws('-','beijing','shanghai','shenzhen'); beijing-shanghai-shenzhen

10、get_json_object：解析json字符串

--语法：get_json_object(string json_string,string path)
--返回值：string
--说明：解析json的字符串json_string,返回path指定的内容。如果输入的json字符无效，那么返回null。
--（1）获取json数组里面取得json具体数据
select get_json_object('[{"name":"邹哥哥","sex":"男","age":"24"},{"name":"邹小哥哥","sex":"男","age":"18"}]','$.[0].name');   邹哥哥
--（2）获取json数组里面的数据
 select get_json_object('[{"name":"邹哥哥","sex":"男","age":"24"},{"name":"邹小哥哥","sex":"男","age":"18"}]','$.[0]');
输出：{"name":"邹哥哥","sex":"男","age":"24"}

1.2.4 日期函数

1、unix_timestamp:返回当前或指定时间的时间戳

--语法：unix_timestamp()
--返回值：bigint
select unix_timestamp('2022/08/08','yyyy/MM/dd HH-mm-ss')
输出:1659946088

2、from_unixtime：转化UNIX时间戳（从 1970-01-01 00:00:00 UTC 到指定时间的秒数）到当前时区的时间格式

--语法：from_unixtime(bigint unixtime[, string format]) 
--返回值：string 
select from_unixtime(1659946088);   
输出：2022-08-08 08:08:08

3、current_date：当前日期

select current_date;  
输出：2023-06-2

4、current_timestamp：当前的日期加时间，并且精确的毫秒

select current_timestamp; 
输出：2023-06-2 15:32:22.402

5、month：获取日期中的月

--语法：month (string date) 
--返回值：int 
select month('2023-06-02 08:08:08');
输出：6

6、day：获取日期中的日

--语法：day (string date) 
--返回值：int 
select day('2023-06-02 08:08:08');
输出：2

7、day：获取日期中的小时

--语法：hour (string date) 
--返回值：int 
select hour('2023-06-02 08:08:08');
输出：8

8、datediff：两个日期相差的天数（结束日期减去开始日期的天数）

--语法：datediff(string enddate, string startdate) 
--返回值：int 
select datediff('2021-08-08','2022-10-09')
输出：-427

9、data_add:日期加天数

--语法：date_add(string startdate, int days) 
--返回值：string 
--说明：返回开始日期 startdate 增加 days 天后的日期
select data_add('2023-06-02',2);
输出：2023-06-04

10、date_sub：日期减天数

--语法：date_sub (string startdate, int days) 
--返回值：string 
--说明：返回开始日期startdate减少days天后的日期。
select data_sub('2023-06-04',2);
输出：2023-06-02

11、date_format:将标准日期解析成指定格式字符串

select date_format('2023-06-02','yyyy年-MM月-dd日')
输出：2023年-06月-02月

1.2.5 流程控制函数

1、case when：条件判断函数

--语法1：case when a then b[when c then d] * [else e] end
--返回值：T
--说明：如果a是true ，则返回b；如果c为true ，则返回d；否则返回e
select case when 1=2 then 'tom' when 2=2 then 'mary' else 'tim' end from table ename;
输出结果：mary
--语法2：case a when b then c [when d then e]*[else f] end
--返回值：T
--说明：如果a等于b，那么返回c；如果a等于d，那么返回e；否则返回f
select case 100 when 50 then 'tom' when 100 then 'mary' 
else 'tim' end from tableName;
输出结果：mary

2、if：条件判断，类型java中的三元运算符

-- 语法：if(boolean testCondition,T valueTrue,T valueFalseOrNull)
-- 返回值：T
-- 说明：当条件testCondition为true时，返回valueTrue；否则返回valueFalseOrNull
--(1)条件满足，输出正确
select if(10>5,'正确','错误');
输出：正确
--(2)条件满足，输出错误
select if(10<5,'正确','错误');
输出：错误

Hive学习---4、函数（单行函数、高级聚合函数、炸裂函数、窗口函数）（一）

1、函数

1.1 函数简介

1.2 单行函数

1.2.1 算术运算函数

1.2.2 数值函数

1.2.3 字符串函数

1.2.4 日期函数

1.2.5 流程控制函数

热门文章

最新文章

相关课程

相关电子书

相关实验场景

探索云世界

热门

云计算

大数据

云原生

人工智能

数据库

开发与运维

活动广场

任务中心

训练营

直播

乘风者计划

下载

镜像站

技术资料

Hive学习---4、函数（单行函数、高级聚合函数、炸裂函数、窗口函数）（一）

1、函数

1.1 函数简介

1.2 单行函数

1.2.1 算术运算函数

1.2.2 数值函数

1.2.3 字符串函数

1.2.4 日期函数

1.2.5 流程控制函数

热门文章

最新文章

相关课程

相关电子书

相关实验场景