开发者社区> 问答> 正文

FlinkSQL over PARTITION BY窗口不同并行度计算结果不同是为什么?

大家好,我kafka中有一批数据,我在统计每个元素30分钟的count值时,发现当我设置不同并行度时,统计结果也不一样,请问应该以什么思路排查比较好

SELECT user, price, count(id) OVER ( PARTITION BY user ORDER BY actionTime RANGE BETWEEN INTERVAL '30' MINUTE preceding AND CURRENT ROW) AS c FROM kafkaTable;

当并行度等于分区数据,统计结果是最准确的 其次StreamTableEnvironmentAPI中table.exec.source.idle-timeout参数好像不生效?*来自志愿者整理的flink邮件归档

展开
收起
moonlightdisco 2021-12-02 14:10:55 816 0
1 条回答
写回答
取消 提交回答
  • 你好, 方便提供下完整的 sql 和配置? 另外可以用 1.13 新版本测试看下*来自志愿者整理的FLINK邮件归档

    2021-12-02 14:36:33
    赞同 展开评论 打赏
问答排行榜
最热
最新

相关电子书

更多
Get rid of traditional ETL, Move to Spark! 立即下载
低代码开发师(初级)实战教程 立即下载
阿里巴巴DevOps 最佳实践手册 立即下载