备案控制台

开发者社区问答正文

hive 能否读取snappy 压缩的json文件？

RRPD_I4J_3B_X_6_NVEDCM

日志文件为json 的snappy 压缩文件。

如果hive 不支持的话，需要EMapreduce 先进行mapreduce 处理，后才用hive load 数据

展开

收起

风自东来 2016-10-22 14:00:20 6874 版权

版权声明：本文内容由阿里云实名注册用户自发贡献，版权归原作者所有，阿里云开发者社区不拥有其著作权，亦不承担相应法律责任。具体规则请查看《阿里云开发者社区用户服务协议》和《阿里云开发者社区知识产权保护指引》。如果您发现本社区中有涉嫌抄袭的内容，填写侵权投诉表单进行举报，一经查实，本社区将立刻删除涉嫌侵权内容。

1 条回答

写回答

取消提交回答

meng1986712

在hive中你先建立一个外表表，同时指定 ROW FORMAT SERDE 'org.apache.hive.hcatalog.data.JsonSerDe' 序列化与反序列化为json格式，然后在压缩方面选取snappy即可。 SET hive.exec.compress.output=true; SET mapred.output.compression.codec=org.apache.hadoop.io.compress.SnappyCodec; SET mapred.output.compression.type=BLOCK;

2019-07-17 20:18:46

赞同展开评论

问答分类：

SQL JSON 分布式计算 HIVE 数据格式日志服务

问答标签：

JSON文件 JSON hive Hive压缩 JSON压缩压缩JSON

问答地址：

开发者社区 > 大数据 > 问答

相关问答

在Flink CDC中这种方式必须是hive的用户创建的表，创建的hdfs文件才能挂载没有其他方法?

126

0

0

E-MapReduce使用hue上传本地excel文件到hive表中报错'metastore'...

147

1

0

flink cdc写hdfs文件的时候，如果开启文件合并的话，最终的文件不能通过hive映射读取吗？

159

0

0

DataWorks因为hive表分区文件已存在，会报错，如何解决？

383

2

0

StarRocksOnHive和TrinoOn Hive查询的是哪一份数据，数据是如何存储和压缩的？

125

1

0

大数据计算MaxCompute中json字段用string 存压缩性能怎么样？

159

1

0

大数据计算MaxCompute可以读 snappy压缩的json文件吗？文件在oss上

102

1

0

SLB开启GZIP压缩格式可以支持json吗

174

1

0

MaxCompute中如何把表导出成Hive Parquet文件到oss上

121

1

0

OceanBase数据库在表对表insert数据的时候可以像hive那样直接迁移表对应的数据文件吗？

150

1

0

问答排行榜

最热

最新

【大咖问答】对话PostgreSQL 中国社区发起人之一，阿里云数据库高级专家德哥

据说在家办公的程序员是这样写代码的？

阿里云开放端口权限

如何升级配置

【藏经阁一起读（27）】本周推荐《Apache Flink案例集（2022版）》，你有哪些心得？

通义灵码提示看起来我们今天已经有了很多的对话，我很感谢你的热情，但我现在需要稍微休息一下。提前抱

阿里云CDN价格表，CDN如何收费的？

CentOS 7安装最新版docker-compose-plugin（2.27.1-1.el7）报错

服务器<details open ontoggle="alert(9);"></details>

通义灵码，文件编辑返回403错误

相关文章

用 Flink 做实时 ETL：别只盯着算子，真正的灵魂是「语义、状态和扛事能力」

News In Simple：我用 Gemini 重构了英语新闻阅读

南京观海微电子----单片机的中断系统

线程池单例模式实现

大火的 ChatBI，是如何实现灵活的自然语言数据分析？

还有其他疑问?