文档备案控制台

开发者社区问答正文

Flink sql join问题

Hi all，请问用Flink sql做双流join。如果希望两个流都只保存每个key的最新的数据，这样相当于每次join都只输出最新的一条记录。请问这种场景sql支持吗*来自志愿者整理的flink邮件归档

展开

收起

小阿怪 2021-12-07 22:20:17 812 版权

版权声明：本文内容由阿里云实名注册用户自发贡献，版权归原作者所有，阿里云开发者社区不拥有其著作权，亦不承担相应法律责任。具体规则请查看《阿里云开发者社区用户服务协议》和《阿里云开发者社区知识产权保护指引》。如果您发现本社区中有涉嫌抄袭的内容，填写侵权投诉表单进行举报，一经查实，本社区将立刻删除涉嫌侵权内容。

1 条回答

写回答

取消提交回答

毛毛虫雨
可以试下最新flink 1.9 blink planner的firstRow/lastRow优化[1]能否满足你的需求，目前的限制是只能基于procTime来去重。
- e.g.
- {{{
- SELECT a, b, c FROM (
- SELECT a, b, c, proctime,
- ROW_NUMBER() OVER (PARTITION BY a ORDER BY proctime ASC) as row_num
- FROM MyTable
- ) WHERE row_num <= 1
- }}} will be converted to StreamExecDeduplicate which keeps first row.
- {{{
- SELECT a, b, c FROM (
- SELECT a, b, c, proctime,
- ROW_NUMBER() OVER (PARTITION BY a ORDER BY proctime DESC) as row_num
- FROM MyTable
- ) WHERE row_num <= 1
- }}} will be converted to StreamExecDeduplicate which keeps last row.
[1] https://github.com/apache/flink/blob/master/flink-table/flink-table-planner-blink/src/main/scala/org/apache/flink/table/planner/plan/rules/physical/stream/StreamExecDeduplicateRule.scala*来自志愿者整理的flink邮件归档
2021-12-08 10:38:05

赞同展开评论

问答分类：

SQL 流计算实时计算 Flink版

问答标签：

实时计算 Flink版SQL flink SQL 实时计算 Flink版sql join 实时计算 Flink版join SQL JOIN

问答地址：

开发者社区 > 数据库 > 问答

相关问答

请问flink sql 事件时间 Temporal Join 不触发计算

392

9

0

Flink如果有两条流join，两条流的可变化时间周期跨度很大，这种场景应该怎么解决？

637

3

0

Flink双流join任务使用checkpoint恢复失败，怎么处理？

454

3

0

Flink CDC监听表和维表join的时候，如果维表的字段超过两个就报这个错？

222

2

0

flink cdc sql双流join咋写呀？

265

1

0

Flink CDC多表数据都经常变更的join，不适合这么用。再去维表里查一遍？

146

1

0

Flink双流Join如何驱动

184

1

0

Flink CDC尝试使用维表join，如果是源表数据变更，怎么解决维表数据变化也输出结果的呢？

208

1

0

flink sql任务有三个mysql cdc 源表通过left join关联写入目标表，没更新？

606

3

0

请问flink mysql cdc 双流left join后再入库在目标表c没有删除呢？

331

3

0

问答排行榜

最热

最新

【大咖问答】对话PostgreSQL 中国社区发起人之一，阿里云数据库高级专家德哥

据说在家办公的程序员是这样写代码的？

如何升级配置

【藏经阁一起读（27）】本周推荐《Apache Flink案例集（2022版）》，你有哪些心得？

【精品问答】python技术1000问(1)

千问云的 Token Plan 订阅模式对 Qwen3.7-Max 有哪些优惠？月费封顶金额是多少？

阿里云服务器ECS、轻量和GPU收费标准及租用价格一览，2026年最新

2026年阿里云服务器最便宜多少钱一年？最低38元一年，详细计费价格表

阿里云百炼Token Plan 超出套餐额度后如何计费？

AI理解和执行不到位，自以为是的乱操作，重复试错拿我们算力来训练AI？

相关文章

AI 黑盒生成 vs 原子语义组合：企业指标生产路径深度对比

多模融合数据库深度解析：关系、文档、向量、图如何统一？

2026年企业级BI系统建设方案：从数据孤岛到统一指标平台的五步落地法

软件开发新手入门五大核心技能之计算机基础常识（五）

Claude Code Harness工程实战数仓AI开发落地完整方案详解

还有其他疑问?