开发者社区 > 大数据与机器学习 > 实时计算 Flink > 正文

Flink CDC有没有集群升级或者中间遇到问题要重启的场景 线上很多任务是怎么启动?

Flink CDC有没有集群升级或者中间遇到问题要重启的场景 线上很多任务是怎么启动 集群重启所有的job不都挂掉了么 如果不加兜底监控中间很多任务会丢数据 还得手动补数 这种场景你们是有啥比较好的方案嘛?

展开
收起
cuicuicuic 2023-12-01 10:53:23 29 0
4 条回答
写回答
取消 提交回答
  • 在Flink CDC中,如果遇到需要重启集群的场景,确实存在一些挑战。首先,对于CDC Node的重启,最近的数据处理以及消息同步状态都可以在重启时自动恢复。然而,在断电后重启的情况下,Flink任务是否能恢复并继续处理数据,取决于多个因素。

    为了解决数据丢失的问题,可以采用以下方案:

    1. 使用checkpoint来记录程序的状态,以便在出现问题时可以从故障点开始恢复。
    2. 针对Oracle、MySQL、PostgreSQL等数据库,CDC Node需要单独开启一个Transaction,这样CDC Node处理记录可以原子性的写入目标数据源和Sink。
    3. 通过调整poll.await.time.ms和heartbeat等参数来优化数据的捕获和处理。

    此外,Flink提供了重启策略和故障恢复策略来控制Task的重启。如果没有定义重启策略,作业将遵循集群启动时加载的默认重启策略。如果提交作业时设置了重启策略,该策略将覆盖掉集群的默认策略。通过Flink的配置文件flink-conf.yaml来设置默认的重启策略。配置参数restart-strategy.type定义了采取何种策略。如果没有启用checkpoint,就采用“不重启”策略。如果启用了checkpoint且没有配置重启策略,那么就采用固定延时重启策略,此时最大尝试重启次数由Integer.MAX_VALUE参数设置。

    总之,在线上环境中部署Flink CDC任务时,需要充分考虑集群升级、故障恢复和数据丢失等问题,并采取相应的措施来确保任务的稳定性和数据的准确性。

    2023-12-02 15:57:07
    赞同 展开评论 打赏
  • 在 Flink CDC 中,确实存在集群升级或出现问题需要重启的场景。当整个 Flink 集群重启时,所有正在运行的 Job 确实会中断。

    为了应对这种情况以及避免数据丢失,可以考虑以下策略:

    1. 持久化保存点:Flink 提供了保存点(savepoint)的机制,可以将任务的状态和进程保存到持久化存储(如分布式文件系统、对象存储等)。在集群重启后,可以从保存点恢复任务的状态,并继续处理数据。这样可以避免数据丢失和手动补数的情况。

    2. 容错机制:Flink 作为一个流式处理引擎,内部具备容错机制。它会自动检测任务失败,并根据配置执行故障恢复。当集群重启后,未完成的任务会被重新调度并继续进行处理。通过合理配置 Flink 的容错参数,可以提高任务的可靠性和恢复能力。

    3. 监控和告警系统:建议使用监控和告警系统来监控 Flink 集群的健康状态。通过监控指标和日志信息,可以快速发现问题并采取相应的措施。及时的告警系统可以帮助您在集群出现问题时快速做出响应。

    4. 预案和自动化:制定好集群升级、异常情况处理的预案,并考虑使用自动化工具来执行重启和恢复操作。例如,可以使用脚本或配置管理工具来批量重启任务或进行自动化的保存点恢复。

    2023-12-02 10:22:22
    赞同 展开评论 打赏
  • 面对过去,不要迷离;面对未来,不必彷徨;活在今天,你只要把自己完全展示给别人看。

    使用Flink CDC时,集群升级或任务重启可能会导致数据丢失。为防止这种情况,可以采用以下策略:启用保存点和检查点、优化容错配置、实施监控告警系统、执行滚动更新以及制定备份回滚策略。

    2023-12-01 18:02:58
    赞同 展开评论 打赏
  • 我们用的是CDH集成, 之前flink版本升级过一次. 是运维同事搞的. 任务都是提交到yarn 上面的没有下线,也无需重启flink任务,此回答整理自钉群“Flink CDC 社区”

    2023-12-01 11:38:42
    赞同 展开评论 打赏

实时计算Flink版是阿里云提供的全托管Serverless Flink云服务,基于 Apache Flink 构建的企业级、高性能实时大数据处理系统。提供全托管版 Flink 集群和引擎,提高作业开发运维效率。

相关产品

  • 实时计算 Flink版
  • 相关电子书

    更多
    Flink CDC Meetup PPT - 龚中强 立即下载
    Flink CDC Meetup PPT - 王赫 立即下载
    Flink CDC Meetup PPT - 覃立辉 立即下载