Apache Hive--DDL--创建表--双分区表&小结| 学习笔记-阿里云开发者社区

Apache Hive--DDL--创建表--双分区表&小结| 学习笔记

2022-02-15 390

版权

本文内容由阿里云实名注册用户自发贡献，版权归原作者所有，阿里云开发者社区不拥有其著作权，亦不承担相应法律责任。具体规则请查看《阿里云开发者社区用户服务协议》和《阿里云开发者社区知识产权保护指引》。如果您发现本社区中有涉嫌抄袭的内容，填写侵权投诉表单进行举报，一经查实，本社区将立刻删除涉嫌侵权内容。

简介： 快速学习 Apache Hive--DDL--创建表--双分区表&小结

开发者学堂课程【大数据 Hive 教程精讲：Apache Hive--DDL--创建表--双分区表&小结】学习笔记，与课程紧密联系，让用户快速学习知识。

课程地址：https://developer.aliyun.com/learning/course/90/detail/1370

Apache Hive--DDL--创建表--双分区表&小结

内容介绍：

一、课堂笔记

1、hive 建立一张表跟已经存在的结构化的数据文件产生映射关系

映射成功之后，就可以通过写 sql 来分析这结构化的数据避免了写 mr 程序的麻烦

2、数据库---》/user/hive/warehouse下的一个文件夹对应

表---》数据库文件夹下面的子文件夹/user/hive/warehouse/itcast

.db/t_t1

表的数据位置目前不能随便存放一定要在指定的数据库表的文件夹下面

建立表的时候可能还需要指定分隔符否则有可能映射不成功

3、建表的时候一定要根据结构化数据文件的分隔符类型指定分隔符

建表的字段个数和字段类型要跟结构化数据中的个数类型一致

分隔符一般使用内置的来指定 ROW FORMAT DELIMITED 分割字段还是分割集

合等等

4、分区表字段不能够在表中已经存在

分区字段是一个虚拟的字段不存放任何数据

分区字段的数据来自于装载分区表数据的时候指定的

分区表的字段在 hdfs 上的效果就是在建立表的文件夹下面又创建了子文件

这样的目的把数据的划分更加细致减少了查询时候全表扫描的成本只需要按照指定的分区扫描数据并显示结果即可

zhangsanbeijing ,shanghai,tianjin,hangzhou

wangwushanghai,chengdu , wuhan ,haerbin

create table complex_array(name string ,work _locations array<string>)

ROw FORMAT DELIMITED FIELDS TERMINATED BY '\t’COLLECTION ITEMS TERMINATED BY '，';

create table t_user(id int，name string) partitioned by (country string) row format delimited fields terminat

LOAD DATA local INPATH '/root/hivedata/5.txt’ INTO rABLE t_user partition (country='USA');

create table day_hour_table (id int,content string) partitioned by (dt string,hour string)

LOAD DATA local INPATH '/root/hivedata/5.txt ' INTO PABE. t_user partition (country='USA ') ;

Apache Hive--DDL--创建表--双分区表&小结| 学习笔记

Apache Hive--DDL--创建表--双分区表&小结

一、课堂笔记

阿里云开发者学堂

热门文章

最新文章

相关课程

相关电子书

推荐镜像

探索云世界

热门

云计算

大数据

云原生

人工智能

数据库

开发与运维

活动广场

任务中心

训练营

直播

乘风者计划

下载

镜像站

技术资料

Apache Hive--DDL--创建表--双分区表&amp;小结| 学习笔记

Apache Hive--DDL--创建表--双分区表&amp;小结

一、课堂笔记

阿里云开发者学堂

热门文章

最新文章

相关课程

相关电子书

推荐镜像

Apache Hive--DDL--创建表--双分区表&小结| 学习笔记

Apache Hive--DDL--创建表--双分区表&小结