文档备案控制台

开发者社区大数据与机器学习实时计算 Flink 正文

hive建表的存储格式和压缩格式，选型，有什么准则吗

展开

收起

游客3oewgrzrf6o5c 2022-08-24 18:11:29 517 版权

1 条回答

写回答

取消提交回答

叶秋学长

全栈JAVA领域创作者
Hive建表的存储格式和压缩格式有很多选型，但是有一些准则可以帮助您选择。以下是一些常见的准则：
1. 存储格式：Hive支持多种存储格式，包括TEXTFILE、SEQUENCEFILE、ORC和PARQUET。其中，ORC和PARQUET是列式存储格式，可以提供更好的查询性能和压缩比。
2. 压缩格式：Hive支持多种压缩格式，包括gzip、lzo和snappy等。不同的压缩格式适用于不同的数据类型和场景。例如，gzip适用于冷数据(长时间未访问的数据),而lzo适用于热数据(经常访问的数据)。
2023-06-10 22:25:19

赞同展开评论

问答分类：

SQL 存储 HIVE 实时计算 Flink版

问答标签：

Hive存储 Hive存储压缩 Hive压缩 Hive格式 Hive存储格式

问答地址：

开发者社区 > 大数据与机器学习 > 实时计算 Flink > 问答

相关问答

实时计算 Flink版

大数据计算MaxCompute建表语句没有指定分隔符和存储方式？比方说像hive那样?

125

Druid 解析Hive建表语句解析报错

415

大数据计算MaxCompute adb通过外部表读取hive数据进行查询分析，无需存储就能查询吗？

156

StarRocksOnHive和TrinoOn Hive查询的是哪一份数据，数据是如何存储和压缩的？

134

AnalyticDB MySQL读取Hive TEXT格式数据

102

谁有flink cdc 可以连接hive的格式？

117

机器学习PAI特征平台离线存储目前除了maxcompute外，支持其他类型的存储了吗？比如hive表

163

DataWorks中datax 从hive（parquet格式）到mysql 报错？

609

DataWorks中hive的外表oss同步，报配置的path格式有误找不到文件路径是什么？

Hive SQL like方式建表格式化后执行报错

296

大数据与机器学习

实时计算 Flink

实时计算Flink版是阿里云提供的全托管Serverless Flink云服务，基于 Apache Flink 构建的企业级、高性能实时大数据处理系统。提供全托管版 Flink 集群和引擎，提高作业开发运维效率。

我要提问

收录在圈子:

阿里云实时计算Flink

199215

+ 订阅

实时计算 Flink 版（Alibaba Cloud Realtime Compute for Apache Flink，Powered by Ververica）是阿里云基于 Apache Flink 构建的企业级、高性能实时大数据处理系统，由 Apache Flink 创始团队官方出品，拥有全球统一商业化品牌，完全兼容开源 Flink API，提供丰富的企业级增值功能。

2026年阿里云服务器新手指南：配置选购、费用价格及使用全流程（图文教程）

2026 年阿里云服务器租用收费价格说明（含弹性裸金属服务器架构价格表）

阿里云2026年云服务器续费、升级、新购政策懒得梳理啦

00后大爷测评：阿里云服务器2核2G、2核4G配置租用收费标准及活动价格说明（2026版）

构建自己的AI编程助手：基于RAG的上下文感知实现方案

hive建表的存储格式和压缩格式，选型，有什么准则吗

实时计算 Flink

相关文章

热门讨论

热门文章