文档备案控制台

开发者社区问答正文

请问Flink streaming sql是否支持两层group by聚合啊？

我们有个streaming sql得到的结果不正确，现象是sink得到的数据一会大一会小，我们想确认下，这是否是个bug，或者flink还不支持这种sql。具体场景是：先group by A, B两个维度计算UV，然后再group by A 把维度B的UV sum起来，对应的SQL如下：（A -> dt, B -> pvareaid) SELECT dt, SUM(a.uv) AS uv FROM ( SELECT dt, pvareaid, COUNT(DISTINCT cuid) AS uv FROM streaming_log_event WHERE action IN ('action1') AND pvareaid NOT IN ('pv1', 'pv2') AND pvareaid IS NOT NULL GROUP BY dt, pvareaid ) a GROUP BY dt; sink接收到的数据对应日志为： 2020-04-17 22:28:38,727 INFO groupBy xx -> to: Tuple2 -> Sink: Unnamed (1/1) (GeneralRedisSinkFunction.invoke:169) - receive data(false,0,86,20200417) 2020-04-17 22:28:38,727 INFO groupBy xx -> to: Tuple2 -> Sink: Unnamed (1/1) (GeneralRedisSinkFunction.invoke:169) - receive data(true,0,130,20200417) 2020-04-17 22:28:39,327 INFO groupBy xx -> to: Tuple2 -> Sink: Unnamed (1/1) (GeneralRedisSinkFunction.invoke:169) - receive data(false,0,130,20200417) 2020-04-17 22:28:39,327 INFO groupBy xx -> to: Tuple2 -> Sink: Unnamed (1/1) (GeneralRedisSinkFunction.invoke:169) - receive data(true,0,86,20200417) 2020-04-17 22:28:39,327 INFO groupBy xx -> to: Tuple2 -> Sink: Unnamed (1/1) (GeneralRedisSinkFunction.invoke:169) - receive data(false,0,86,20200417) 2020-04-17 22:28:39,328 INFO groupBy xx -> to: Tuple2 -> Sink: Unnamed (1/1) (GeneralRedisSinkFunction.invoke:169) - receive data(true,0,131,20200417)

我们使用的是1.7.2，测试作业的并行度为1。这是对应的 issue: https://issues.apache.org/jira/browse/FLINK-17228*来自志愿者整理的FLINK邮件归档

展开

收起

玛丽莲梦嘉 2021-12-03 18:23:19 1409 版权

版权声明：本文内容由阿里云实名注册用户自发贡献，版权归原作者所有，阿里云开发者社区不拥有其著作权，亦不承担相应法律责任。具体规则请查看《阿里云开发者社区用户服务协议》和《阿里云开发者社区知识产权保护指引》。如果您发现本社区中有涉嫌抄袭的内容，填写侵权投诉表单进行举报，一经查实，本社区将立刻删除涉嫌侵权内容。

1 条回答

写回答

取消提交回答

CCCC

这个是支持的哈。你看到的现象是因为group by会产生retract结果，也就是会先发送-[old]，再发送+[new]. 如果是两层的话，就成了：第一层-[old], 第二层-[cur], +[old] 第一层+[new], 第二层[-old], +[new]*来自志愿者整理的FLINK邮件归档

2021-12-03 18:51:47

赞同展开评论

问答分类：

SQL 流计算实时计算 Flink版云数据库 Tair（兼容 Redis）日志服务

问答标签：

flink SQL 实时计算 Flink版SQL SQL flink 实时计算 Flink版group 实时计算 Flink版聚合

问答地址：

开发者社区 > 数据库 > 问答

相关问答

Streaming DW在提供实时计算能力的同时，还能让用户覆盖什么能力？

144

1

0

Flink sql cdc 增量聚合有文档吗？比如说基于CDC，算交易额的汇总

201

1

0

大数据计算MaxCompute的sql用窗口函数和group by计算标准差结果为什么不一致？

187

1

0

为什么选择从Kafka + Spark Streaming转向Flink？

175

1

0

我要先o.execute_sql，再执行group by操作怎么操作？

119

0

0

Flink SQL 如何解决 Group Window Aggregate 中的数据倾斜问题？

364

1

0

怎么对o.execute_sql结果进行group by等操作?

109

0

0

PolarDB这个SQL 没有聚合，为什么会命中列存呢？

109

1

0

Apache Flink 和 Apache Spark Streaming在完整性推理方面有何不同？

177

1

0

请问下面这个sql 有关分组聚合问题要怎么解决？

125

1

0

问答排行榜

最热

最新

【大咖问答】对话PostgreSQL 中国社区发起人之一，阿里云数据库高级专家德哥

据说在家办公的程序员是这样写代码的？

如何升级配置

【藏经阁一起读（27）】本周推荐《Apache Flink案例集（2022版）》，你有哪些心得？

【精品问答】python技术1000问(1)

2026年阿里云怎么安装Hermes/OpenClaw？配置指南

2026年阿里云老用户优惠合集：长效普惠+节点大促+专项补贴说明

2026年阿里云新用户云服务器活动：官方入口与高性价比机型推荐

HappyHorse快乐小马模型在哪下载？

2026年阿里云企业用户大促入口全解：官网与控制台直达路径

相关文章

从 T+1 到分钟级：金城银行基于 Apache Doris 构建高可靠、强一致的实时数据平台

分组排名不用窗口函数？那你还在写几十行的子查询

PAI-FeatureStore特征平台的相关问答

MySQL介绍：零基础入门，读懂这款主流关系型数据库

Claude 4.5 Haiku 接入：DМ‌XΑ‌РΙ 优化轻量级模型调用栈

相关解决方案

更多

Flink 与 Hologres 搭建实时数仓

Flink CDC 实现企业级实时数据同步

原生 SQL 轻松实现多模态智能检索

还有其他疑问?