开发者社区 > 大数据与机器学习 > 实时计算 Flink > 正文

Flink CDC中Checkpoint 的清理策略一般是怎么设置的?

Flink CDC中Checkpoint 的清理策略一般是怎么设置的?发现跑一段时间后,占用空间还挺大大

展开
收起
真的很搞笑 2023-12-10 20:57:24 444 0
4 条回答
写回答
取消 提交回答
  • 面对过去,不要迷离;面对未来,不必彷徨;活在今天,你只要把自己完全展示给别人看。

    Flink CDC中Checkpoint的清理策略可以通过以下两种方式进行设置:

    1. 在Flink的配置文件中设置checkpoint的保留策略,例如可以设置为保留最近的3个checkpoint state。具体的配置代码如下:
      # 设置checkpoint自动清理策略,这里设置为保留最近的3个checkpoint
      state.checkpoints.num-retained = 3
      
    2. 在 Flink 程序中设置 Check point Retention Policy。

    需要注意的是,如果选择 RETAIN_ON_CANCELLATION 策略,需要手动清除该作业保留的 Checkpoint 状态信息,否则这些状态信息将永远保留在外部的持久化存储中。Flink任务取消时,支持两种清除策略:ExternalizedCheckpointCleanup.DELETE_ON_CANCELLATION和ExternalizedCheckpointCleanup.RETAIN_ON_CANCELLATION。第一种表示所有checkpoint状态将被删除,包括元数据和实际的程序状态;第二种表示保留外部化的checkpoints,但不会删除任何状态信息。这两种策略的选择取决于你的具体需求和使用场景。

    2023-12-11 16:18:06
    赞同 展开评论 打赏
  • Flink CDC中Checkpoint的清理策略一般可以通过以下几种方式设置:

    基于时间的清理策略:可以设置一个时间阈值,超过该阈值的Checkpoint会被清理掉。例如,可以设置保留最近7天的Checkpoint,过期的Checkpoint会被自动删除。

    基于状态的清理策略:可以设置一个状态阈值,当Checkpoint的状态超过该阈值时,可以选择删除最早的Checkpoint。这种策略可以根据状态的大小来决定删除哪些Checkpoint。

    手动清理策略:可以手动删除特定的Checkpoint,根据具体需求来进行清理操作。这种方式需要手动管理Checkpoint的清理过程。

    2023-12-11 08:59:45
    赞同 展开评论 打赏
  • 在Flink CDC中,Checkpoint的清理策略通常有两种设置方式:DELETE_ON_CANCELLATION和RETAIN_ON_CANCELLATION。

    DELETE_ON_CANCELLATION:仅当作业失败时,作业的 Checkpoint 才会被保留用于任务恢复。当作业取消时,Checkpoint 状态信息会被删除,因此取消任务后,不能从 Checkpoint 位置进行恢复任务。

    RETAIN_ON_CANCELLATION:当作业手动取消时,将会保留作业的 Checkpoint 状态信息。注意,这种情况下,需要手动清除该作业保留的 Checkpoint 状态信息,否则这些状态信息将永远保留在外部的持久化存储中。

    在实际生产环境中,如果状态超过100G,从 Savepoint 恢复任务时需要耗时10分钟以上,而 Checkpoint 可以在2分钟以内恢复完成,因此,对于状态超过100G的 Flink 任务,强烈建议使用 Checkpoint 恢复任务,而不是使用 Savepoint。

    总的来说,Flink CDC中的Checkpoint清理策略需要根据具体的业务需求和场景来选择合适的配置,以达到最佳的性能和资源利用率。

    2023-12-11 08:55:12
    赞同 展开评论 打赏
  • 2023-12-11 08:36:56
    赞同 展开评论 打赏

实时计算Flink版是阿里云提供的全托管Serverless Flink云服务,基于 Apache Flink 构建的企业级、高性能实时大数据处理系统。提供全托管版 Flink 集群和引擎,提高作业开发运维效率。

相关产品

  • 实时计算 Flink版
  • 相关电子书

    更多
    Flink CDC Meetup PPT - 龚中强 立即下载
    Flink CDC Meetup PPT - 王赫 立即下载
    Flink CDC Meetup PPT - 覃立辉 立即下载