FlinkCDC doris在order by xx limit 10 每次执行返回的结果都不一样?

Flink CDC doris在order by xx limit 10 每次执行返回的结果都是不一致的, 无法做分页,有大佬遇到没?

展开
收起
wenti 2023-02-06 15:27:48 433 分享 版权
2 条回答
写回答
取消 提交回答
  • 非唯一排序键:如果您在 ORDER BY 的排序键上没有一个唯一性保证,那么如果有多条记录具有相同的排序键值,数据库系统可能返回任何顺序的结果。

    数据变更:由于 CDC (Change Data Capture) 的目的是捕捉数据变更,所以如果底层数据正在不断变化,每次查询可能返回新变更的数据。

    分布式环境的数据不一致:如果 Doris 是在分布式环境下运行的(尤其是在有多个副本的情况下),可能由于数据副本之间的同步延迟导致返回不一致的结果。

    查询未指定完全排序条件:在 ORDER BY 中未包含足以解决排序歧义的列。例如,如果只根据价格排序,而有多个商品具有相同的价格,则排序结果可能不固定。为了保证一致的结果,您需要提供二级排序列来确保结果唯一。

    并发查询导致的结果集不稳定:如果有多个并发查询在同时读取和更新数据,则可能导致不稳定的结果集。

    2024-02-26 17:53:19
    赞同 展开评论
  • ck在存的时候就按排序字段落到文件里面了吧,Doris和mysql一样,排序字段有相同的话都有不确定性——该回答整理自钉群“Flink CDC 社区”

    2023-02-06 20:46:25
    赞同 展开评论

实时计算Flink版是阿里云提供的全托管Serverless Flink云服务,基于 Apache Flink 构建的企业级、高性能实时大数据处理系统。提供全托管版 Flink 集群和引擎,提高作业开发运维效率。

收录在圈子:
实时计算 Flink 版(Alibaba Cloud Realtime Compute for Apache Flink,Powered by Ververica)是阿里云基于 Apache Flink 构建的企业级、高性能实时大数据处理系统,由 Apache Flink 创始团队官方出品,拥有全球统一商业化品牌,完全兼容开源 Flink API,提供丰富的企业级增值功能。
还有其他疑问?
咨询AI助理