创建带压缩格式的orc表

简介: 文件存储格式: [STORED AS file_format]

创建表时添加一些两个选项

文件存储格式: [STORED AS file_format]
  • file_format:
    : SEQUENCEFILE
    | TEXTFILE -- (Default, depending on hive.default.fileformat configuration)
    | RCFILE -- (Note: Available in Hive 0.6.0 and later)
    | ORC -- (Note: Available in Hive 0.11.0 and later)
    | PARQUET -- (Note: Available in Hive 0.13.0 and later)
    | AVRO -- (Note: Available in Hive 0.14.0 and later)
    | INPUTFORMAT input_format_classname OUTPUTFORMAT output_format_classname
表属性值: [TBLPROPERTIES (property_name=property_value, ...)]

创建带压缩格式的orc表


导入数据并查看文件大小(原始文件大小为8M)




目录
相关文章
|
6月前
|
SQL 消息中间件 数据处理
DataX读取Hive Orc格式表丢失数据处理记录
DataX读取Hive Orc格式表丢失数据处理记录
253 0
|
5月前
|
存储 分布式计算 大数据
MaxCompute产品使用问题之创建了oss外表,格式指定的parquet,然后执行的写入,发现不是标准parquet的格式,该怎么办
MaxCompute作为一款全面的大数据处理平台,广泛应用于各类大数据分析、数据挖掘、BI及机器学习场景。掌握其核心功能、熟练操作流程、遵循最佳实践,可以帮助用户高效、安全地管理和利用海量数据。以下是一个关于MaxCompute产品使用的合集,涵盖了其核心功能、应用场景、操作流程以及最佳实践等内容。
|
SQL 存储 大数据
更改 HIVE 表字段数据类型有哪些注意事项?
更改 HIVE 表字段数据类型有哪些注意事项?
|
SQL 文件存储 数据库
Hive分区表的新增字段数据为null的问题解决方法
Hive分区表的新增字段数据为null的问题解决方法
342 0
|
SQL HIVE
hive创建表并指定字段分隔符
hive创建表并指定字段分隔符
|
SQL 分布式计算 Hadoop
Hive----数据插入、导入、导出
数据的插入、导入、导出
181 0
|
存储 SQL NoSQL
Hive----存储格式
存储格式
240 0
|
存储 SQL 分布式计算
|
存储 Apache 对象存储