开发者社区 > 大数据与机器学习 > 实时计算 Flink > 正文

Flink CDC中operator如何设置自动清理旧的checkpoint数据呢?

Flink CDC中operator如何设置自动清理旧的checkpoint数据呢?因为我的sql融合了很多表状态数据很大,但是看checkpoints有很多旧的,如何配置flink operator自动清理呢?streampark好用吗?感觉国内主导的很难稳定

展开
收起
真的很搞笑 2024-03-06 08:57:24 125 0
3 条回答
写回答
取消 提交回答
  • 面对过去,不要迷离;面对未来,不必彷徨;活在今天,你只要把自己完全展示给别人看。

    在Flink CDC中,可以通过配置文件或程序内设置来自动清理旧的checkpoint数据

    首先,可以在Flink的配置文件conf/flink-conf.yaml中设置保留checkpoint的数量。例如,要保留最近的10个checkpoint,可以添加配置state.checkpoints.num-retained: 10。其次,在Flink程序中,可以使用CheckpointConfig类来设置checkpoint的保留策略。例如,通过checkPointConfig.setCheckpointingMode(CheckpointingMode.EXACTLY_ONCE)checkPointConfig.setCheckpointTimeout(1 * 60 * 1000)等方法来配置checkpoint的模式和超时时间。此外,还可以选择在作业取消时是否保留外部保存的checkpoint信息,这可以通过设置env.getCheckpointConfig().enableExternalizedCheckpoints()来实现,并选择DELETE_ON_CANCELLATIONRETAIN_ON_CANCELLATION策略。

    至于Streampark的稳定性问题,根据社区反馈和企业实践,Streampark在稳定性和可用性方面已经得到了验证

    它支持最新的Flink版本,并且在多个版本的Flink上都进行了完整的支持和大量测试,以确保其稳定性和生产可用性。Streampark还通过规范项目配置、鼓励函数式编程等方式降低了学习成本和开发门槛,使得开发者能够更专注于核心业务逻辑。

    综上所述,Flink CDC中的operator可以通过配置文件或程序内设置来自动清理旧的checkpoint数据,而Streampark作为一个流处理平台,其稳定性和功能齐全性已经在实践中得到了验证,可以作为企业级应用的选择。

    2024-03-08 21:38:21
    赞同 1 展开评论 打赏
  • 关于Flink CDC中自动清理旧的checkpoint数据,Flink提供了Checkpoint清理机制。可以在Flink作业的Checkpoint配置中设置状态backend的保留策略,例如设置 checkpoint.expiration.duration 参数,指定checkpoint的有效期。StreamPArk作为阿里巴巴开源的Flink管理平台,可以帮助您更方便地管理作业和配置,其稳定性已在生产环境中得到验证。但具体选择仍需结合您的实际需求和团队技术栈来决定。

    2024-03-06 10:43:38
    赞同 展开评论 打赏
  • 在Apache Flink中,包括Flink CDC应用在内的所有作业的checkpoint清理策略是通过Flink集群级别的配置来管理的。要设置自动清理旧的checkpoint数据,可以编辑Flink的全局配置文件(通常是flink-conf.yaml),调整以下配置项:

    # 设置保留的checkpoint个数,仅保留最新的几个checkpoint
    state.checkpoints.num-retained: 3
    

    上述配置意味着Flink会自动保留最近的3个checkpoint,并在创建新checkpoint时删除旧的checkpoint。

    对于状态数据非常大的情况,确保合理的checkpoint保留策略和定期清理是非常重要的,以避免存储空间被过度占用。

    2024-03-06 09:28:52
    赞同 1 展开评论 打赏

实时计算Flink版是阿里云提供的全托管Serverless Flink云服务,基于 Apache Flink 构建的企业级、高性能实时大数据处理系统。提供全托管版 Flink 集群和引擎,提高作业开发运维效率。

相关产品

  • 实时计算 Flink版
  • 相关电子书

    更多
    Flink CDC Meetup PPT - 龚中强 立即下载
    Flink CDC Meetup PPT - 王赫 立即下载
    Flink CDC Meetup PPT - 覃立辉 立即下载