开发者社区 > 大数据与机器学习 > 实时计算 Flink > 正文

如果Flink CDC挂了怎么办?

问题1:如果Flink CDC挂了怎么办?而且我是拉取mongo的那个oplog日志,那个oplog日志滚动速度很快,最多也就是保存一个小时左右把,有没有像sparkstreaming那样子,我启动的时候,先查询mysql保存的偏移量,然后呢去消费数据,消费完数据以后,再把偏移量写入到mysql里面,然后下一批次的时候,我再去查询mysql的偏移量,然后再处理数据。
问题2:我现在看看有没有什么其他可以实现的方式,你现在是这样子保证数据不丢?

展开
收起
真的很搞笑 2023-08-22 18:48:39 60 0
1 条回答
写回答
取消 提交回答
  • 回答1:那你自己可以定义算子过滤啊,把每一次的操作标识存储到缓存里 然后设置过期时间大于等于ck时间
    回答2:ck 可以啊,但是会存在重复采集 。开启ck后你只需要做下去重就行了,针对插入操作,因为ck存储有时间间隔,此回答整理自钉群“Flink CDC 社区”

    2023-08-22 18:52:41
    赞同 展开评论 打赏

实时计算Flink版是阿里云提供的全托管Serverless Flink云服务,基于 Apache Flink 构建的企业级、高性能实时大数据处理系统。提供全托管版 Flink 集群和引擎,提高作业开发运维效率。

相关产品

  • 实时计算 Flink版
  • 相关电子书

    更多
    PostgresChina2018_赖思超_PostgreSQL10_hash索引的WAL日志修改版final 立即下载
    Kubernetes下日志实时采集、存储与计算实践 立即下载
    日志数据采集与分析对接 立即下载