问题1:Flink CDC这种情况有没有办法去掉changelogNormalize节点,或者增加参数控制,其实很多mongo的collection是没有删除操作的,那么就不需要回撤(-U)的操作,这样是否能避免大状态问题,描述的好像不太对,想问是否能去掉这个状态数据,加它的目的是啥?因为我最近主要做数据接入这块,好像去掉之后没啥影响,但是像你说的后续的聚合、开窗等,确实需要这个算子
看状态是在changelogNormalize这个算子 问题2:请问怎么去掉这个算子?
版权声明:本文内容由阿里云实名注册用户自发贡献,版权归原作者所有,阿里云开发者社区不拥有其著作权,亦不承担相应法律责任。具体规则请查看《阿里云开发者社区用户服务协议》和《阿里云开发者社区知识产权保护指引》。如果您发现本社区中有涉嫌抄袭的内容,填写侵权投诉表单进行举报,一经查实,本社区将立刻删除涉嫌侵权内容。
回答1:应该是SinkMaterializer这个算子,办法去掉,不过去掉了后面的Flink SQL 运算会有正确性问题,比如后面接SQL 的聚合、window算子,计算结果会不正确,所以需要这个节点,我看你聊的和SinkMaterializer这个很像,不过它是在sink端的,感觉和changelogNormalizer作用差不多,此回答整理自钉群“Flink CDC 社区”
实时计算Flink版是阿里云提供的全托管Serverless Flink云服务,基于 Apache Flink 构建的企业级、高性能实时大数据处理系统。提供全托管版 Flink 集群和引擎,提高作业开发运维效率。