请教各位大神: flink SQL 执行批处理时,如果我有两个表需要关联,那Flink-SQL写的join执行时,是不是需要先把两个表的数据都查出来,然后在Flink的内存中进行JOIN? 这样是不是比我在关系型数据库中执行JOIN性能低很多了?
版权声明:本文内容由阿里云实名注册用户自发贡献,版权归原作者所有,阿里云开发者社区不拥有其著作权,亦不承担相应法律责任。具体规则请查看《阿里云开发者社区用户服务协议》和《阿里云开发者社区知识产权保护指引》。如果您发现本社区中有涉嫌抄袭的内容,填写侵权投诉表单进行举报,一经查实,本社区将立刻删除涉嫌侵权内容。
flink有几种不同类型的join,这个执行过程 还真的比较复杂 应该不是 一两句话能说的清楚的.. 我自己有做过一个类似的etl的功能 需要考虑各种一致性的问题 ..,https://nightlies.apache.org/flink/flink-docs-release-1.16/zh/docs/dev/table/sql/queries/joins/ 官方关于Join的文档,可以看看,此回答整理自钉群“Flink CDC 社区”