hive分区表实践

简介:

     HIVE把表组织成“分区”,这是一种根据“分区列”的值对表进行粗略划分的机制,使用分区可以加快数据分片的查询速度。

      表或分区可以进一步分为“桶”。它会为数据提供额外的结构以获得更高效的查询处理。

  1. 创建分区表

1
2
3
4
CREATE  TABLE  bills_detail (msgid STRING, time  STRING,spid STRING,opid STRING,spcode STRING,result STRING) 
PARTITIONED  BY  (dt STRING,type STRING) 
ROW FORMAT DELIMITED
FIELDS TERMINATED  BY  '\t'

  表结构

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
hive>  desc  bills_detail;
OK
msgid                   string                                      
time                     string                                      
spid                    string                                      
opid                    string                                      
spcode                  string                                      
result                  string                                      
dt                      string                                      
type                    string                                      
                  
# Partition Information          
# col_name              data_type               comment             
                  
dt                      string                                      
type                    string

  2.导入数据

1
2
load  data  local  inpath  '/home/hive/201601notify.txt'  into  table  bills_detail partition(dt= '201601' ,type= 'notifySmsDeliveryReceipt' );
load  data  local  inpath  '/home/hive/201601sendsms.txt'  into  table  bills_detail partition(dt= '201601' ,type= 'sendSms' );

hive中数据实际路径:

/apps/hive/warehouse/bills_detail/dt=201601/type=sendSms/201601sendsms.txt

3.查询数据

hive> select * from bills_detail where dt='201601' and type='sendSms' limit 10;



本文转自 穿越防火墙 51CTO博客,原文链接:http://blog.51cto.com/sjitwant/1933204

相关文章
|
6月前
|
SQL 大数据 HIVE
Hive 任务调优实践总结
Hive 任务调优实践总结
59 0
|
9天前
|
SQL 存储 Oracle
【赵渝强老师】Hive的分区表
Hive的分区表与Oracle、MySQL类似,通过分区条件将数据分隔存储,提高查询效率。本文介绍了静态分区表和动态分区表的创建与使用方法,包括具体SQL语句和执行计划分析,附带视频讲解。静态分区表需显式指定分区条件,而动态分区表则根据插入数据自动创建分区。
|
6月前
|
SQL 关系型数据库 MySQL
Sqoop【付诸实践 01】Sqoop1最新版 MySQL与HDFS\Hive\HBase 核心导入导出案例分享+多个WRAN及Exception问题处理(一篇即可学会在日常工作中使用Sqoop)
【2月更文挑战第9天】Sqoop【付诸实践 01】Sqoop1最新版 MySQL与HDFS\Hive\HBase 核心导入导出案例分享+多个WRAN及Exception问题处理(一篇即可学会在日常工作中使用Sqoop)
259 7
|
SQL 存储 分布式计算
Hive学习---5、分区表和分桶表
Hive学习---5、分区表和分桶表
|
6月前
|
SQL 存储 传感器
Hive中的分区表和非分区表有什么区别?请解释其作用和使用场景。
Hive中的分区表和非分区表有什么区别?请解释其作用和使用场景。
206 0
|
6月前
|
SQL 存储 关系型数据库
Presto【实践 01】Presto查询性能优化(数据存储+SQL优化+无缝替换Hive表+注意事项)及9个实践问题分享
Presto【实践 01】Presto查询性能优化(数据存储+SQL优化+无缝替换Hive表+注意事项)及9个实践问题分享
729 0
|
SQL 数据采集 存储
Hive SQL 迁移 Flink SQL 在快手的实践
快手数据架构工程师张芒,阿里云工程师刘大龙,在 Flink Forward Asia 2022 生产实践专场的分享。
733 1
Hive SQL 迁移 Flink SQL 在快手的实践
|
SQL 分布式计算 Java
阿里云MaxCompute-Hive UDF(Java)迁移上云实践
阿里云MaxCompute-Hive UDF(Java)迁移上云实践
|
SQL 文件存储 数据库
Hive分区表的新增字段数据为null的问题解决方法
Hive分区表的新增字段数据为null的问题解决方法
343 0
|
SQL 存储 数据采集
Hive 分区表和分桶表
Hive 分区和分桶的区别
162 0