【Hive】（十）Hive 行转列、列转行详解-阿里云开发者社区

【Hive】（十）Hive 行转列、列转行详解

2022-06-09 1028

版权

本文内容由阿里云实名注册用户自发贡献，版权归原作者所有，阿里云开发者社区不拥有其著作权，亦不承担相应法律责任。具体规则请查看《阿里云开发者社区用户服务协议》和《阿里云开发者社区知识产权保护指引》。如果您发现本社区中有涉嫌抄袭的内容，填写侵权投诉表单进行举报，一经查实，本社区将立刻删除涉嫌侵权内容。

简介： 【Hive】（十）Hive 行转列、列转行详解

文章目录

一、列转行

1．相关函数说明

2．数据准备

3．需求

4．创建本地constellation.txt，导入数据

5．创建hive表并导入数据

6．按需求查询数据

二、行转列

1．函数说明

2．数据准备

3．需求

4．创建本地movie.txt，导入数据

5．创建hive表并导入数据

6．按需求查询数据

一、列转行

1．相关函数说明

CONCAT(string A/col, string B/col…)：返回输入字符串连接后的结果，支持任意个输入字符串CONCAT_WS(separator, str1, str2,...)：它是一个特殊形式的 CONCAT()。第一个参数剩余参数间的分隔符。分隔符可以是与剩余参数一样的字符串。如果分隔符是NULL，返回值也将为 NULL。这个函数会跳过分隔符参数后的任何 NULL 和空字符串。分隔符将被加到被连接的字符串之间COLLECT_SET(col)：函数只接受基本数据类型，它的主要作用是将某字段的值进行去重汇总，产生array类型字段。

2．数据准备

name    constellation  blood_type
孙尚香 白羊座 A
司马懿 射手座 A
吕布  白羊座 B
貂蝉     白羊座  A
许褚     射手座  A

3．需求

把星座和血型一样的人归类到一起。结果如下：

射手座,A            司马懿|许褚
白羊座,A            孙尚香|貂蝉
白羊座,B            吕布

4．创建本地constellation.txt，导入数据

[root@zj1 data]# vi constellation.txt

5．创建hive表并导入数据

create table person_info(
name string, 
constellation string, 
blood_type string) 
row format delimited fields terminated by "\t";
load data local inpath "/opt/soft/data/constellation.txt" into table person_info;

6．按需求查询数据

select t1.base,
concat_ws('|',collect_set(t1.name)) name
from
(select name,concat(constellation,",",blood_type) base from person_info) t1
group by t1.base;

查询结果如下：

二、行转列

1．函数说明

EXPLODE(col)：将hive一列中复杂的array或者map结构拆分成多行。

LATERAL VIEW

用法：LATERAL VIEW udtf(expression) tableAlias AS columnAlias

解释：用于和split, explode等UDTF一起使用，它能够将一列数据拆成多行数据，在此基础上可以对拆分后的数据进行聚合

2．数据准备

movie category
《疑犯追踪》  悬疑,动作,科幻,剧情
《Lie to me》 悬疑,警匪,动作,心理,剧情
《战狼2》 战争,动作,灾难

3．需求

将电影分类中的数组数据展开。结果如下：

《疑犯追踪》      悬疑
《疑犯追踪》      动作
《疑犯追踪》      科幻
《疑犯追踪》      剧情
《Lie to me》    悬疑
《Lie to me》    警匪
《Lie to me》    动作
《Lie to me》    心理
《Lie to me》    剧情
《战狼2》        战争
《战狼2》        动作
《战狼2》        灾难

4．创建本地movie.txt，导入数据

[root@zj1 data]# vi movie.txt 
《疑犯追踪》  悬疑,动作,科幻,剧情
《Lie to me》 悬疑,警匪,动作,心理,剧情
《战狼2》 战争,动作,灾难

5．创建hive表并导入数据

create table movie_info(
    movie string, 
    category array<string>) 
row format delimited fields terminated by "\t"
collection items terminated by ",";
load data local inpath "/opt/soft/data/movie.txt" into table movie_info;

6．按需求查询数据

select
    movie,
    category_name
from 
    movie_info lateral view explode(category) table_tmp as category_name;

查询结果如下：

以上便是对 Hive 行转列、列转行的简单演示，如有疑问，欢迎留言，共同讨论😄

【Hive】（十）Hive 行转列、列转行详解

文章目录

一、列转行

1．相关函数说明

3．需求

4．创建本地constellation.txt，导入数据

5．创建hive表并导入数据

6．按需求查询数据

二、行转列

1．函数说明

3．需求

4．创建本地movie.txt，导入数据

5．创建hive表并导入数据

6．按需求查询数据

热门文章

最新文章

相关课程

相关电子书