【Hive】（五）Hive 中动态分区与静态分区详解-阿里云开发者社区

【Hive】（五）Hive 中动态分区与静态分区详解

2022-06-09 582

版权

本文内容由阿里云实名注册用户自发贡献，版权归原作者所有，阿里云开发者社区不拥有其著作权，亦不承担相应法律责任。具体规则请查看《阿里云开发者社区用户服务协议》和《阿里云开发者社区知识产权保护指引》。如果您发现本社区中有涉嫌抄袭的内容，填写侵权投诉表单进行举报，一经查实，本社区将立刻删除涉嫌侵权内容。

简介： 【Hive】（五）Hive 中动态分区与静态分区详解

文章目录

一、静态分区

二、动态分区

Hive中的分区有两种：动态分区和静态分区

一、静态分区

静态分区

1、创建分区表

hive> create table stu2(
    > id int,
    > name string,
    > likes array<string>,
    > adress map<string,string>
    > )
    > partitioned by (age int,sex string)
    > row format delimited
    > fields terminated by ','
    > collection items terminated by '-'
    > map keys terminated by ':'
    > lines terminated by '\n';

2、加载数据到分区表

hive> load data local inpath '/opt/soft/stu.txt' into table stu2
    > partition (age=20,sex="male");

alter table stu2 add partition(age=10,sex='female'); 
// 
show partitions stu2;   // 查看分区
alter table stu2 drop partition(age=10,sex='female');

3、这种手动指定分区加载数据，就是常说的静态分区的使用。但是在日常工作中用的比较多的是动态分区。

静态分区是在创建表的时候就指定分区或者将表已经创建之后再指定分区（使用alter关键字）

二、动态分区

1、创建目标表

hive> create table stuo1(
    > id int,
    > name string,
    > age int,
    > gender string,
    > likes array<string>,
    > address map<string,string>
    > )
    > row format delimited
    > fields terminated by ','
    > collection items terminated by '-'
    > map keys terminated by ':'
    > lines terminated by '\n';

hive> create table stuo2(
    > id int,
    > name string,
    > likes array<string>,
    > address map<string,string>
    > )
    > partitioned by (age int,gender string)
    > row format delimited
    > fields terminated by ','
    > collection items terminated by '-'
    > map keys terminated by ':'
    > lines terminated by '\n';

2、采用动态方式加载数据到目标表

加载之前先设置一下下面的参数

hive> set hive.exec.dynamic.partition=true;
hive> set hive.exec.dynamic.partition.mode=nonstrict;

开始加载

hive> insert into table stuo2 partition(age,gender)
    > select id,name,likes,address,age,gender from stuo1;

上面加载数据方式并没有指定具体的分区，只是指出了分区字段。在select最后一个字段必须跟你的分区字段，这样就会自行根据(age,gender)的value来分区。

3、验证一下

创建动态分区表：

首先是要创建静态分区表；然后将表设置为非严格模式；再次创建动态分区表，并加载数据。

加载数据的时候，是按照静态分区的模式，将数据加载到动态分区中去。

【Hive】（五）Hive 中动态分区与静态分区详解

文章目录

一、静态分区

1、创建分区表

2、加载数据到分区表

3、这种手动指定分区加载数据，就是常说的静态分区的使用。但是在日常工作中用的比较多的是动态分区。

二、动态分区

1、创建目标表

2、采用动态方式加载数据到目标表

3、验证一下

热门文章

最新文章

相关课程

相关电子书

热门

活动广场

任务中心

开发者评测

高校计划

乘风者计划

训练营

阿里云MVP

话题

直播

下载

镜像站

技术资料

插件

【Hive】（五）Hive 中动态分区与静态分区详解

文章目录

一、静态分区

1、创建分区表

2、加载数据到分区表

3、这种手动指定分区加载数据，就是常说的静态分区的使用。但是在日常工作中用的比较多的是动态分区。

二、动态分区

1、创建目标表

2、采用动态方式加载数据到目标表

3、验证一下

热门文章

最新文章

相关课程

相关电子书