flink 1.12.0版本的interval join 实现应该看哪个地方的源码？

是看flink-streaming-java模块的org.apache.flink.streaming.api.operators.co.IntervalJoinOperator？

还是看flink-table-planner模块的org.apache.flink.table.runtime.join.TimeBoundedStreamJoin？

或者是看Blink里面是怎么实现的？我用的plan是Blink，所以想问interval join的实现应该具体看哪个地方的源码

展开

收起

游客f3qdfn6ohc63c 2021-02-07 17:28:51 1870 版权

阿里云 AI 助理回答

在Apache Flink中，Interval Join的实现取决于你使用的是SQL API还是直接使用DataStream API进行编程。根据你的描述，你提到了Flink的两个不同模块以及Blink Planner，这说明你在探索如何在Flink中实现时间窗口内的联接操作。

flink-streaming-java模块的org.apache.flink.streaming.api.operators.co.IntervalJoinOperator: 这个类是Flink Streaming API层面实现interval join的一个基础组件。如果你是在做基于DataStream API的低级别编程，想要了解或自定义interval join的逻辑，查看这个类会很有帮助。它提供了流式处理中如何按时间间隔匹配元素的基本实现逻辑。
flink-table-planner模块的org.apache.flink.table.runtime.join.TimeBoundedStreamJoin: 当你使用Flink SQL或者Table API时，这部分代码更相关。Flink Table/SQL API为用户提供了更高层次的抽象，使得编写复杂的数据处理逻辑更加简洁。TimeBoundedStreamJoin可能就是Table API中interval join转换成实际执行计划的一部分。如果你的应用是基于Table API或SQL，并且使用了Blink Planner作为查询优化器，那么理解这部分源码将有助于你了解interval join在规划和执行阶段的具体实现。
Blink里面是怎么实现的: Blink是Flink的一个早期分支，后来被合并回Flink主干，成为Flink的默认SQL引擎（即Blink Planner）。如果你正在使用的是现代版本的Flink并且指定了Blink Planner，那么上述提到的TimeBoundedStreamJoin等Table API相关的实现就与你直接相关。Blink对SQL查询的优化和执行进行了大量优化，包括但不限于interval join这类时间相关的操作。因此，关注Blink Planner如何翻译SQL语句到具体的执行计划，特别是涉及到时间窗口的操作，是非常有必要的。

综上所述，如果你主要通过SQL或Table API来编写应用，建议重点研究flink-table-planner模块的org.apache.flink.table.runtime.join.TimeBoundedStreamJoin，因为这更贴近于高级API的实现细节。同时，考虑到你是用的Blink Planner，确保你的学习路径也覆盖了Blink Planner如何处理这些查询的优化策略。而直接操作DataStream API的开发者，则可以深入研究flink-streaming-java模块的IntervalJoinOperator。

有帮助

无帮助

AI 助理回答生成答案可能存在不准确，仅供参考

0 条回答

写回答

取消提交回答

问答分类：

流计算实时计算 Flink版

问答标签：

实时计算 Flink版版本实时计算 Flink版join 实时计算 Flink版版本join 实时计算 Flink版源码实时计算 Flink版interval join

问答地址：

开发者社区 > 大数据与机器学习 > 实时计算 Flink > 问答

实时计算 Flink

实时计算Flink版是阿里云提供的全托管Serverless Flink云服务，基于 Apache Flink 构建的企业级、高性能实时大数据处理系统。提供全托管版 Flink 集群和引擎，提高作业开发运维效率。

我要提问

收录在圈子:

阿里云实时计算Flink

199215

+ 订阅

实时计算 Flink 版（Alibaba Cloud Realtime Compute for Apache Flink，Powered by Ververica）是阿里云基于 Apache Flink 构建的企业级、高性能实时大数据处理系统，由 Apache Flink 创始团队官方出品，拥有全球统一商业化品牌，完全兼容开源 Flink API，提供丰富的企业级增值功能。

文本字符数统计在线工具核心JS实现

什么是批处理？一文搞清批处理和流处理的区别

个人所得税计算器在线工具分享

Spark / Flink 跑在 Kubernetes 上真的更香吗？聊聊那些没人提前告诉你的性能坑

Dataphin功能Tips系列（95）如何自定义Dataphin告警消息

flink 1.12.0版本的interval join 实现应该看哪个地方的源码？

实时计算 Flink

相关文章

热门讨论

热门文章