开发者社区> 问答> 正文

env.readFile 递归监控目录 如何清理状态(历史目录)?

env.readFile 递归监控目录 如何清理状态(历史目录)?

*来自志愿者整理的flink邮件归档

展开
收起
游客nnqbtnagn7h6s 2021-12-06 19:57:13 434 0
1 条回答
写回答
取消 提交回答
  • 我觉得这个也许可以先从业务上解决。比如你可以有另一个作业定期去 HDFS 上把过期的数据清理掉(比如半个月前的?)。

    另外,我也开了一个 issue 去跟进这个问题,看看社区里面对这块比较熟的同学有没有更好的建议。FLINK-18357 <https://issues.apache.org/jira/browse/FLINK-18357> 我的一个初步的想法是,是否可以有一个 inactive-interval 去标记一个子目录已经不会有新文件产生了,这样 checkpoint 就不用跟踪这个子目录下的所有文件。

    *来自志愿者整理的flink邮件归档

    2021-12-06 21:25:22
    赞同 展开评论 打赏
问答排行榜
最热
最新

相关电子书

更多
低代码开发师(初级)实战教程 立即下载
冬季实战营第三期:MySQL数据库进阶实战 立即下载
阿里巴巴DevOps 最佳实践手册 立即下载