开发者社区> 问答> 正文

FlinkSQL写hive orc表开启compact,任务异常重启,compact不生效?

如题,目前没有具体看是没生效,还是来不及compact。任务正常情况没问题,但是如果任务出现频繁错误,导致过一会重启一次,这种情况导致文件数暴增,compact功能不生效。*来自志愿者整理的flink邮件归档

展开
收起
moonlightdisco 2021-12-07 16:47:59 945 0
1 条回答
写回答
取消 提交回答
  • Hi!

    因为 compact 是在每次 checkpoint 的时候进行的,在做 checkpoint 之前产生的文件都是以 . 开头的,表示当前不可见。只有 checkpoint 之后才会重命名为可见文件。因此如果任务频繁出现错误,这些不可见文件就会留在目录里,导致文件数增加。建议首先把任务为什么频繁出错查出来。*来自志愿者整理的flink邮件归档

    2021-12-07 17:15:58
    赞同 展开评论 打赏
问答排行榜
最热
最新

相关电子书

更多
Comparison of Spark SQL with Hive 立即下载
Hive Bucketing in Apache Spark 立即下载
2019大数据技术公开课第五季—Hive迁移到MaxCompute最佳实践 立即下载