Flink CDC doris在order by xx limit 10 每次执行返回的结果都是不一致的, 无法做分页,有大佬遇到没?
版权声明:本文内容由阿里云实名注册用户自发贡献,版权归原作者所有,阿里云开发者社区不拥有其著作权,亦不承担相应法律责任。具体规则请查看《阿里云开发者社区用户服务协议》和《阿里云开发者社区知识产权保护指引》。如果您发现本社区中有涉嫌抄袭的内容,填写侵权投诉表单进行举报,一经查实,本社区将立刻删除涉嫌侵权内容。
非唯一排序键:如果您在 ORDER BY 的排序键上没有一个唯一性保证,那么如果有多条记录具有相同的排序键值,数据库系统可能返回任何顺序的结果。
数据变更:由于 CDC (Change Data Capture) 的目的是捕捉数据变更,所以如果底层数据正在不断变化,每次查询可能返回新变更的数据。
分布式环境的数据不一致:如果 Doris 是在分布式环境下运行的(尤其是在有多个副本的情况下),可能由于数据副本之间的同步延迟导致返回不一致的结果。
查询未指定完全排序条件:在 ORDER BY 中未包含足以解决排序歧义的列。例如,如果只根据价格排序,而有多个商品具有相同的价格,则排序结果可能不固定。为了保证一致的结果,您需要提供二级排序列来确保结果唯一。
并发查询导致的结果集不稳定:如果有多个并发查询在同时读取和更新数据,则可能导致不稳定的结果集。
ck在存的时候就按排序字段落到文件里面了吧,Doris和mysql一样,排序字段有相同的话都有不确定性——该回答整理自钉群“Flink CDC 社区”
实时计算Flink版是阿里云提供的全托管Serverless Flink云服务,基于 Apache Flink 构建的企业级、高性能实时大数据处理系统。提供全托管版 Flink 集群和引擎,提高作业开发运维效率。