开发者社区> 问答> 正文

为什么 flink checkpoint Checkpoint Duration (Async)?

flink 版本1.8 部署集群yarn

配置代码: StreamExecutionEnvironment.stateBackend(new FsStateBackend("hdfs://nsstreaming/streaming/flink_checkpoint/state").checkpointingInterval(10006010).checkpointTimeout(10006010).timeCharacteristic(TimeCharacteristic.IngestionTime).build(); 业务代码相对比较简单,内存占用较大 超过10分钟后开始报错,state 大概在1.5G时,开始耗时开始变长

*来自志愿者整理的flink邮件归档

展开
收起
游客nnqbtnagn7h6s 2021-12-06 19:42:24 504 0
1 条回答
写回答
取消 提交回答
  • 一般 Checkpoint 超时,可以先看看你的任务中,是否存在反压,比如 Sink 阶段,又或者是某个地方有 flatMap操作导致。

    然后看下自己任务中,是否存在热点问题等。如果一切都是正常的话,可以尝试使用 RocksDB 的增量 Checkpoint ,具体参考[1]。

    [1] https://ci.apache.org/projects/flink/flink-docs-release-1.10/ops/state/state_backends.html#rocksdb-state-backend-details

    *来自志愿者整理的flink邮件归档

    2021-12-06 21:17:36
    赞同 展开评论 打赏
问答排行榜
最热
最新

相关电子书

更多
Flink CDC Meetup PPT - 龚中强 立即下载
Flink CDC Meetup PPT - 王赫 立即下载
Flink CDC Meetup PPT - 覃立辉 立即下载