文档备案控制台

开发者社区大数据与机器学习正文

请教各位大神： flink SQL 执行批处理时，如果我有两个表需要关联，那Flink-SQL写的j

请教各位大神： flink SQL 执行批处理时，如果我有两个表需要关联，那Flink-SQL写的join执行时，是不是需要先把两个表的数据都查出来，然后在Flink的内存中进行JOIN？这样是不是比我在关系型数据库中执行JOIN性能低很多了？

展开

收起

真的很搞笑 2023-04-26 10:31:01 195 版权

版权声明：本文内容由阿里云实名注册用户自发贡献，版权归原作者所有，阿里云开发者社区不拥有其著作权，亦不承担相应法律责任。具体规则请查看《阿里云开发者社区用户服务协议》和《阿里云开发者社区知识产权保护指引》。如果您发现本社区中有涉嫌抄袭的内容，填写侵权投诉表单进行举报，一经查实，本社区将立刻删除涉嫌侵权内容。

1 条回答

写回答

取消提交回答

芯在这

flink有几种不同类型的join，这个执行过程还真的比较复杂应该不是一两句话能说的清楚的.. 我自己有做过一个类似的etl的功能需要考虑各种一致性的问题 ..，https://nightlies.apache.org/flink/flink-docs-release-1.16/zh/docs/dev/table/sql/queries/joins/ 官方关于Join的文档，可以看看，此回答整理自钉群“Flink CDC 社区”

2023-04-27 15:07:16

赞同展开评论

问答分类：

SQL 关系型数据库流计算实时计算 Flink版云原生数据库 PolarDB

问答标签：

实时计算 Flink版SQL flink SQL 实时计算 Flink版批处理 SQL批处理 SQL flink

问答地址：

开发者社区 > 大数据与机器学习 > 问答

相关问答

在Flink大概什么样的场景会需要用到流批一体？一边处理实时流，一边批处理历史数据

251

1

0

在Flink CDC中批处理之后得度量数据为什么就不能拿了呢？

128

0

0

Flink CDC里1.16版本的flink-sql 不支持多if嵌套了嘛？

231

0

0

flink cdc 可以在flink-sql cli里面使用吗？报错如下怎么办？

194

1

0

Flink CDC在flink-sql中不知道应该怎样对应了？

247

2

0

Flink任务编排可以跑 msyql同步到mysql的批处理任务吗？

243

2

0

Flink 1.15 引入的自适应批处理调度器的主要优点是什么？

131

1

0

flink 批处理，source 和sink 都是holo ，有哪篇文章可以参考？

164

1

0

问一下flink批处理，join超20张表会报空指针，这边是不是有什么限制在里面？

291

7

0

Flink批处理之后得度量数据为啥就不能拿了呢？

219

7

0

大数据与机器学习

大数据领域前沿技术分享与交流，这里不止有技术干货、学习心得、企业实践、社区活动，还有未来。

我要提问

相关文章

覆盖索引：让你的查询直接从索引返回，彻底告别回表

智能问数如何帮助企业实现从'看报表'到'问问题'的思维转变?

MySQL索引底层原理：B+树能存多少数据？页分裂与回表机制详解

程序员进阶工程师必备技能之代码质量与重构能力（四）

做共享目录实时同步，踩过这些坑

热门讨论

热门文章

ODPS 的下一个15年，大数据将迎来春天还是寒冬？

P人出游，你是否需要一个懂你更懂规划的AI导游呢？来搭建专属文旅问答机器人吧

Flink CDC任务从savepoint/checkpoints状态中恢复作业错误问题

数据来源：com.alibaba.fastjson.JSONException: syntax er

哪位有编译好的cdc 2.2.0版本能能试用flink 1.14.2的包呀？

有用flink cdc同步mysql到hive这样搞过的源码吗?

flink1.19和hive3.1.3，cdc从mysql同步数据到hive，插入时报错？

flinkcdc在IDEA运行正常，打包就报错

调用数据源服务失败：调用数据源服务失败：获取实例的详细信息失败,请检查RDS购买者id和RDS实例名

大数据计算MaxCompute用kettle的转换功能去进行odps的同步数据可行吗？

展开全部

身怀绝技的开发者们，快来DataV玩转可视化组件

阿里封神谈hadoop生态学习之路

【玩转数据系列十】利用阿里云机器学习在深度学习框架下实现智能图片分类

odps是什么?

【技术实验】mysql准实时同步数据到Elasticsearch

数据仓库介绍与实时数仓案例

分布式快照算法: Chandy-Lamport

DataV接入ECharts图表库可视化利器强强联手

MaxCompute执行作业慢的原因排查

阿里云MaxCompute（大数据）公开数据集---带你玩转人工智能

展开全部

还有其他疑问?