Flink CDC里同一条记录短时间i,d,u,cdc到kafka是有序的,但从kafka消费时候会乱序。这个我也遇到目前只是设置kafka分区数为1或者放入kafka时候按记录主键分区解决。看资料说用flink水印来解决乱序问题,但我没测成功,有没有人玩过这种解决方式呢?
在Flink CDC中,确实可以使用水印(Watermark)机制来解决Kafka消费时的乱序问题。
水印是Flink中用于处理事件时间的一种机制,它允许系统在没有明确的时间戳信息的情况下,推断出数据的时间顺序。通过合理地设置水印,可以在一定程度上解决乱序问题。以下是使用水印解决乱序问题的一些关键点:
版权声明:本文内容由阿里云实名注册用户自发贡献,版权归原作者所有,阿里云开发者社区不拥有其著作权,亦不承担相应法律责任。具体规则请查看《阿里云开发者社区用户服务协议》和《阿里云开发者社区知识产权保护指引》。如果您发现本社区中有涉嫌抄袭的内容,填写侵权投诉表单进行举报,一经查实,本社区将立刻删除涉嫌侵权内容。
实时计算Flink版是阿里云提供的全托管Serverless Flink云服务,基于 Apache Flink 构建的企业级、高性能实时大数据处理系统。提供全托管版 Flink 集群和引擎,提高作业开发运维效率。