hive分区表实践

简介:

     HIVE把表组织成“分区”,这是一种根据“分区列”的值对表进行粗略划分的机制,使用分区可以加快数据分片的查询速度。

      表或分区可以进一步分为“桶”。它会为数据提供额外的结构以获得更高效的查询处理。

  1. 创建分区表

1
2
3
4
CREATE  TABLE  bills_detail (msgid STRING, time  STRING,spid STRING,opid STRING,spcode STRING,result STRING) 
PARTITIONED  BY  (dt STRING,type STRING) 
ROW FORMAT DELIMITED
FIELDS TERMINATED  BY  '\t'

  表结构

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
hive>  desc  bills_detail;
OK
msgid                   string                                      
time                     string                                      
spid                    string                                      
opid                    string                                      
spcode                  string                                      
result                  string                                      
dt                      string                                      
type                    string                                      
                  
# Partition Information          
# col_name              data_type               comment             
                  
dt                      string                                      
type                    string

  2.导入数据

1
2
load  data  local  inpath  '/home/hive/201601notify.txt'  into  table  bills_detail partition(dt= '201601' ,type= 'notifySmsDeliveryReceipt' );
load  data  local  inpath  '/home/hive/201601sendsms.txt'  into  table  bills_detail partition(dt= '201601' ,type= 'sendSms' );

hive中数据实际路径:

/apps/hive/warehouse/bills_detail/dt=201601/type=sendSms/201601sendsms.txt

3.查询数据

hive> select * from bills_detail where dt='201601' and type='sendSms' limit 10;



本文转自 穿越防火墙 51CTO博客,原文链接:http://blog.51cto.com/sjitwant/1933204

相关文章
|
4月前
|
SQL 存储 传感器
Hive中的分区表和非分区表有什么区别?请解释其作用和使用场景。
Hive中的分区表和非分区表有什么区别?请解释其作用和使用场景。
56 0
|
9月前
|
SQL 存储 分布式计算
Hive学习---5、分区表和分桶表
Hive学习---5、分区表和分桶表
|
11月前
|
SQL 文件存储 数据库
Hive分区表的新增字段数据为null的问题解决方法
Hive分区表的新增字段数据为null的问题解决方法
253 0
|
11月前
|
SQL 存储 数据采集
Hive 分区表和分桶表
Hive 分区和分桶的区别
105 0
|
SQL HIVE
Hive创建分区表常用指令
Hive创建分区表常用指令
362 0
|
SQL 分布式计算 Hadoop
Hive分区表简介
如果一个表中数据很多,我们查询时就很慢,耗费大量时间,如果要查询其中部分数据该怎么办呢,这时我们引入分区的概念。 Hive中的分区表分为两种:静态分区和动态分区。
211 0
|
SQL 存储 数据库
hive分区表
Partition 对应于数据库的 Partition 列的密集索引 在 Hive 中,表中的一个 Partition 对应于表下的一个目录,所有的 Partition 的数据都存储在对应的目录中 例如: test表中...
1168 0
|
SQL HIVE 关系型数据库
|
5月前
|
SQL 数据采集 数据挖掘
大数据行业应用之Hive数据分析航班线路相关的各项指标
大数据行业应用之Hive数据分析航班线路相关的各项指标
108 1
|
5月前
|
SQL 存储 大数据
【大数据技术Hadoop+Spark】Hive基础SQL语法DDL、DML、DQL讲解及演示(附SQL语句)
【大数据技术Hadoop+Spark】Hive基础SQL语法DDL、DML、DQL讲解及演示(附SQL语句)
88 0