开发者社区> 问答> 正文

flink数据sum后结果超过源数据

源数据为mysql数据,通过提取mysql数据后写入到kafka,flink接收数据做数据量统计,统计后出现统计量大于原始数据量的情况
CheckpointingMode(CheckpointingMode.EXACTLY_ONCE) 并且在数据统计之前做了去重操作!

请问有人遇到这种问题么?

展开
收起
游客o4epm44pp7fkq 2020-04-03 17:18:33 1938 0
1 条回答
写回答
取消 提交回答
  • 个人对建模比较关注

    sum之前先进行groupby去重,flink的上游会多次发生消息会导致重复计算

    2021-03-05 10:09:25
    赞同 展开评论 打赏
问答排行榜
最热
最新

相关电子书

更多
Flink CDC Meetup PPT - 龚中强 立即下载
Flink CDC Meetup PPT - 王赫 立即下载
Flink CDC Meetup PPT - 覃立辉 立即下载