开发者社区 > 大数据与机器学习 > 实时计算 Flink > 正文

在Flink CDC中oraclecdc 监听新增的数据,有监听到重复的数据有解决方案吗?

在Flink CDC中oraclecdc 监听新增的数据,数据变动比较频繁,有监听到重复的数据有解决方案吗?

展开
收起
花开富贵111 2024-07-15 15:49:16 55 0
1 条回答
写回答
取消 提交回答
  • 使用uniqueKey配置来过滤重复事件。确保配置了主键字段,Flink会基于这些字段去重。
    在Flink作业中实现自定义的RichParallelSourceFunction,在并行实例之间添加状态协调,以确保全局去重。
    结合Flink的KeyedStream和State机制,基于业务键进行状态存储,每次新数据到来时检查状态,避免处理重复键值的数据。
    可参见官方文档

    2024-07-15 16:47:38
    赞同 4 展开评论 打赏

实时计算Flink版是阿里云提供的全托管Serverless Flink云服务,基于 Apache Flink 构建的企业级、高性能实时大数据处理系统。提供全托管版 Flink 集群和引擎,提高作业开发运维效率。

相关产品

  • 实时计算 Flink版
  • 相关电子书

    更多
    Flink CDC Meetup PPT - 龚中强 立即下载
    Flink CDC Meetup PPT - 王赫 立即下载
    Flink CDC Meetup PPT - 覃立辉 立即下载