开发者社区 问答 正文

Hive 数仓表中对于已有的小文件有什么解决方法呢?

Hive 数仓表中对于已有的小文件有什么解决方法呢?

展开
收起
游客qzzytmszf3zhq 2021-12-09 20:49:28 272 分享 版权
1 条回答
写回答
取消 提交回答
  • • 通过参数进行调节,设置 map/reduce 端的相关参数

    • 重建表,建表时减少 reduce 数量

    • 使用 hadoop archive 命令把小文件进行归档

    2021-12-09 20:49:38
    赞同 展开评论