开发者社区 问答 正文

请问怎么做去重?

问题转自钉钉群: 21789141
image
image
请问怎么做去重?
不理解的是 distinct生效时 flink程序拿到了之前cache的状态值, 做了distinct, 状态值和新来的值都打印出来了, 而且都又计算了一次, 导致本来该算一次的数据算了两次,这种情况应该如何避免呢?

展开
收起
赵慧@ApacheFlink中文社区 2018-11-29 15:53:49 2201 分享 版权
1 条回答
写回答
取消 提交回答
  • 因为是流计算,所以中间状态的每一条数据都会输出,能保证最终的结果是对的。

    如果想要中间结果不输出,可以使用固窗来group by。

    2019-07-17 23:17:05
    赞同 展开评论
问答地址: