备案控制台

开发者社区数据库文章正文

Hive分区+根据分区查询

2022-12-29 916

版权

版权声明：

本文内容由阿里云实名注册用户自发贡献，版权归原作者所有，阿里云开发者社区不拥有其著作权，亦不承担相应法律责任。具体规则请查看《阿里云开发者社区用户服务协议》和《阿里云开发者社区知识产权保护指引》。如果您发现本社区中有涉嫌抄袭的内容，填写侵权投诉表单进行举报，一经查实，本社区将立刻删除涉嫌侵权内容。

简介： Hive分区+根据分区查询

分区
通过partition by(字段名 字段类型) - 分区最后会形成一个目录。
分区的字段，不在源数据中出现，但是表的一部分
创建一个分区表
hive> create table stud01(
       id string,
       name string,
       age int
     )
partitioned by (grade string)
row format delimited
fields terminated by '\t';
创建多级目录
hive> create table stud01(
    id string,
    name string,
    age int
    )
partitioned by (create_year string，create_month string)
row format delimited
fields terminated by '\t';
导入数据
在导入数据时，通过partition提定分区的值：
hive> load data local inpath '${env:HOME}/stud.txt' into table stud01 partition(grade='2009');
查看分区
hive>show partitions stu01;
查询分区数据
select * from AccountRegister where create_date="2014-10-1";

文章标签：

SQL

HIVE

关键词：

Hive分区

游客yno6xv7miabmw

目录

相关文章

赵广陆

|

SQL 分布式计算 Hadoop

Hive使用Impala组件查询(1)

Hive使用Impala组件查询(1)

赵广陆

503 0 0

我是廖志伟

|

SQL 存储分布式数据库

【通过Hive清洗、处理和计算原始数据，Hive清洗处理后的结果，将存入Hbase，海量数据随机查询场景从HBase查询数据】

【通过Hive清洗、处理和计算原始数据，Hive清洗处理后的结果，将存入Hbase，海量数据随机查询场景从HBase查询数据】

我是廖志伟

452 0 0

武子康

|

5月前

|

SQL 分布式计算 Hadoop

Hadoop-14-Hive HQL学习与测试表连接查询 HDFS数据导入导出等操作逻辑运算函数查询全表查询 WHERE GROUP BY ORDER BY（一）

Hadoop-14-Hive HQL学习与测试表连接查询 HDFS数据导入导出等操作逻辑运算函数查询全表查询 WHERE GROUP BY ORDER BY（一）

武子康

82 4 4

武子康

|

5月前

|

SQL

Hadoop-14-Hive HQL学习与测试表连接查询 HDFS数据导入导出等操作逻辑运算函数查询全表查询 WHERE GROUP BY ORDER BY（二）

Hadoop-14-Hive HQL学习与测试表连接查询 HDFS数据导入导出等操作逻辑运算函数查询全表查询 WHERE GROUP BY ORDER BY（二）

武子康

72 2 2

Z_sorrain

|

7月前

|

SQL 存储 HIVE

hive分区与分桶

hive分区与分桶

Z_sorrain

93 1 1

嘟嘟嘟嘟嘟嘟

|

8月前

|

SQL DataWorks 监控

DataWorks产品使用合集之同步数据到Hive时，如何使用业务字段作为分区键

DataWorks作为一站式的数据开发与治理平台，提供了从数据采集、清洗、开发、调度、服务化、质量监控到安全管理的全套解决方案，帮助企业构建高效、规范、安全的大数据处理体系。以下是对DataWorks产品使用合集的概述，涵盖数据处理的各个环节。

嘟嘟嘟嘟嘟嘟

74 1 1

冲冲冲c

|

9月前

|

SQL 分布式计算 DataWorks

DataWorks操作报错合集之在进行Hive分区truncate操作时遇到权限不足，怎么解决

DataWorks是阿里云提供的一站式大数据开发与治理平台，支持数据集成、数据开发、数据服务、数据质量管理、数据安全管理等全流程数据处理。在使用DataWorks过程中，可能会遇到各种操作报错。以下是一些常见的报错情况及其可能的原因和解决方法。

冲冲冲c

118 0 0

张飞的猪

|

9月前

|

SQL 资源调度数据库连接

Hive怎么调整优化Tez引擎的查询？在Tez上优化Hive查询的指南

在Tez上优化Hive查询，包括配置参数调整、理解并行化机制以及容器管理。关键步骤包括YARN调度器配置、安全阀设置、识别性能瓶颈（如mapper/reducer任务和连接操作），理解Tez如何动态调整mapper和reducer数量。例如，`tez.grouping.max-size` 影响mapper数量，`hive.exec.reducers.bytes.per.reducer` 控制reducer数量。调整并发和容器复用参数如`hive.server2.tez.sessions.per.default.queue` 和 `tez.am.container.reuse.enabled`

张飞的猪

807 0 0

Byyyi

|

10月前

|

SQL 存储大数据

Hive的查询、数据加载和交换、聚合、排序、优化

Hive的查询、数据加载和交换、聚合、排序、优化

Byyyi

198 2 2

极客李华

|

10月前

|

SQL 存储 HIVE

Hive中的动态分区是什么？请解释其作用和使用场景。

Hive中的动态分区是什么？请解释其作用和使用场景。

极客李华

169 0 0

热门文章

最新文章

基于云服务器的数仓搭建-hive/spark安装

seatunnel配置mysql2hive

如何在IDE中通过Spark操作Hive

hive聚合函数多行合并

Dataphin功能Tips系列（48)-如何根据Hive SQL/Spark SQL的任务优先级指定YARN资源队列

Hive架构优点及使用场景

HIVE的安装配置、mysql的安装、hive创建表、创建分区、修改表等内容、hive beeline使用、HIVE的四种数据导入方式、使用Java代码执行hive的sql命令

HADOOP之HIVE+MYSQL,HBASE+ZOOKEEPER

hive 参数设置大全

使用presto查询同步到hive的hudi数据

Dataphin功能Tips系列（48)-如何根据Hive SQL/Spark SQL的任务优先级指定YARN资源队列

seatunnel配置mysql2hive

如何在IDE中通过Spark操作Hive

基于云服务器的数仓搭建-hive/spark安装

hive聚合函数多行合并

了解Hive 工作原理：Hive 是如何工作的？

【赵渝强老师】Hive的分区表

【赵渝强老师】Hive的内部表与外部表

【赵渝强老师】Hive的体系架构

Hive和Pig的区别是什么？如何选择？

相关课程

更多

大数据Hive教程精讲

StarRocks 数据导入、建表查询以及manger管理

相关电子书

更多

Comparison of Spark SQL with Hive

Hive Bucketing in Apache Spark

2019大数据技术公开课第五季—Hive迁移到MaxCompute最佳实践

下一篇

获取百炼API-KEY