开发者社区> 问答> 正文

请问怎么做去重?

问题转自钉钉群: 21789141
image
image
请问怎么做去重?
不理解的是 distinct生效时 flink程序拿到了之前cache的状态值, 做了distinct, 状态值和新来的值都打印出来了, 而且都又计算了一次, 导致本来该算一次的数据算了两次,这种情况应该如何避免呢?

展开
收起
赵慧@ApacheFlink中文社区 2018-11-29 15:53:49 2081 0
1 条回答
写回答
取消 提交回答
  • 因为是流计算,所以中间状态的每一条数据都会输出,能保证最终的结果是对的。

    如果想要中间结果不输出,可以使用固窗来group by。

    2019-07-17 23:17:05
    赞同 展开评论 打赏
问答地址:
问答排行榜
最热
最新

相关电子书

更多
RowKey与索引设计:技巧与案例分析 立即下载
4个迭代,从批量交...1573957773.pdf 立即下载
低代码开发师(初级)实战教程 立即下载