开发者社区> 问答> 正文

Flink 社区版 checkpoint 的频率问题

各位大神好! 问题背景: 1.flink版本是社区版1.6,checkpoint采用的是RocksDBStateBackend 2.flink作业是5分钟窗口的统计,在设置checkpoint时interval间隔 如何设置,是否需要考虑窗口的时间? 3.目前我有一个flink作业的checkpoint大概情况如下,如果频繁checkpoint hdfs会产生大量操作日志,如果写入S3 也会有大量请求。我的解决办法是降低checkpoint频次(增大间隔时间)。

End to End DurationState SizeBuffered During Alignment Minimum1s35.4 MB0 B Average4s647 MB4.51 MB Maximum44s3.26 GB217 MB 我想请教下如何合理的设置checkpoint ?*来自志愿者整理的flink邮件归档

展开
收起
毛毛虫雨 2021-12-08 11:12:56 543 0
1 条回答
写回答
取消 提交回答
    1. Checkpoint interval 和 window size 没有必然关系
    2. 大量日志的话,这些日志是符合预期的吗,是的话,可以考虑更改日志级别,或者调整 checkpoint interval

    checkpoint interval 越频繁,作业 failover 后需要追的数据越少,同时 checkpoint 的开销越大,具体的你需要根据你的情况来进行调整,另外对于 RocksDBStateBackend,你是否开启了 Incremental checkpoint 呢?*来自志愿者整理的flink邮件归档

    2021-12-08 19:23:15
    赞同 展开评论 打赏
问答排行榜
最热
最新

相关电子书

更多
Flink CDC Meetup PPT - 龚中强 立即下载
Flink CDC Meetup PPT - 王赫 立即下载
Flink CDC Meetup PPT - 覃立辉 立即下载