开发者社区> 问答> 正文

双流Join 基于IngressTime计算后在按照Keyby sum聚集后每次计算结果不一致怎么办

请教各位,如题中所说计算结果不一致怎么办呢?*来自志愿者整理的FLINK邮件归档

展开
收起
玛丽莲梦嘉 2021-12-03 18:27:37 926 0
1 条回答
写回答
取消 提交回答
  • 双流join对数据和环境的要求很严格,这样适用的业务场景就会有限。没有办法保证环境和数据一致是严格符合的

    发送自 Windows 10 版邮件https://go.microsoft.com/fwlink/?LinkId=550986应用

    发件人: tisonma...@gmail.com 发送时间: 2020年4月15日 22:26 收件人: user-zhma...@flink.apache.org 主题: Re: 双流Join 基于IngressTime计算后在按照Keyby sum聚集后每次计算结果不一致的问题

    FYI

    https://ci.apache.org/projects/flink/flink-docs-stable/dev/event_time.html https://ci.apache.org/projects/flink/flink-docs-master/dev/event_timestamps_watermarks.html https://ci.apache.org/projects/flink/flink-docs-master/dev/event_timestamp_extractors.html

    IngestionTime 的时间基准是进入 Flink 系统即 Source 算子生产数据时附上的时间戳,你后面有 window/join,这个时间的间隔不是确定性的,大数据量下因为 GC 等原因有不同延迟从而导致 Window 划分不一致是正常的。即使使用 EventTime,在 Watermark 不够可靠的情况下也有可能不一致,足够可靠又可能受到滞后数据的影响损失性能并占用内存。可以看看上面文档的相关内容。*来自志愿者整理的FLINK邮件归档

    2021-12-03 18:55:02
    赞同 展开评论 打赏
问答地址:
问答排行榜
最热
最新

相关电子书

更多
低代码开发师(初级)实战教程 立即下载
冬季实战营第三期:MySQL数据库进阶实战 立即下载
阿里巴巴DevOps 最佳实践手册 立即下载