文档备案控制台

开发者社区大数据与机器学习实时计算 Flink 正文

请问在flink sql-client中进行做group by 聚合值统计的时候，流式查询时是怎么计

请问在flink sql-client中进行做group by 聚合值统计的时候，流式查询时是怎么计算的？是每次都把所有历史明细数据聚合一次吗？

展开

收起

游客3oewgrzrf6o5c 2022-07-11 18:06:44 692 版权

版权声明：本文内容由阿里云实名注册用户自发贡献，版权归原作者所有，阿里云开发者社区不拥有其著作权，亦不承担相应法律责任。具体规则请查看《阿里云开发者社区用户服务协议》和《阿里云开发者社区知识产权保护指引》。如果您发现本社区中有涉嫌抄袭的内容，填写侵权投诉表单进行举报，一经查实，本社区将立刻删除涉嫌侵权内容。

1 条回答

写回答

取消提交回答

叶秋学长

全栈JAVA领域创作者
在 flink sql-client 中进行 group by 聚合值统计时，流式查询时是通过窗口函数和聚合函数来计算的。具体来说，每次查询时，会对流式数据进行分组，并对每个分组内的数据应用聚合函数，从而得到每个分组的聚合结果。在这个过程中，系统并不会把所有历史明细数据都聚合一次，而是只对当前窗口内的数据进行聚合计算，从而提高查询效率。
例如，假设有一个流式数据，包含了用户ID、商品ID和购买时间等字段。如果要对每个用户的购买总数进行统计，可以使用以下 SQL 语句：
```
SELECT user_id, SUM(quantity) as total_buys
FROM orders
GROUP BY user_id
```
在这个语句中，GROUP BY 子句指定了对用户ID进行分组，SUM(quantity) 函数指定了对每个分组内的购买数量进行聚合计算。在查询时，系统会对每个用户的购买数量进行累加，并输出每个用户的购买总数。
2023-08-13 10:52:29

赞同展开评论

问答分类：

流计算实时计算 Flink版

问答标签：

实时计算 Flink版SQL flink SQL 实时计算 Flink版流式 SQL统计实时计算 Flink版统计

问答地址：

开发者社区 > 大数据与机器学习 > 实时计算 Flink > 问答

相关问答

实时计算 Flink版

ARMS应用监控如何统计慢SQL

271

1

0

Flink 使用维表加在 MC 的数据，MC中的某条数据变更了，sql统计的逻辑会变更吗？

249

1

0

在PolarDB中，执行统计sql 统计有 139286行用列存索引统计时间会有提升么？

707

1

0

给已有的维表开启binlog，然后再Flink中查询一直显示运行中，没有数据；这是为什么呢？

191

1

0

通过flink的SQL作业生成的宽表的数据结果，跟拼接代码在holo里跑出来的查询结果不一致为什么？

253

0

0

在Flink为什么我的sql统计count的结果会有负数存在呢？

332

1

0

Flink sql cdc 增量聚合有文档吗？比如说基于CDC，算交易额的汇总

235

1

0

大数据计算MaxCompute的sql用窗口函数和group by计算标准差结果为什么不一致？

259

1

0

我要先o.execute_sql，再执行group by操作怎么操作？

150

0

0

Flink SQL 如何解决 Group Window Aggregate 中的数据倾斜问题？

415

1

0

大数据与机器学习

实时计算 Flink

实时计算Flink版是阿里云提供的全托管Serverless Flink云服务，基于 Apache Flink 构建的企业级、高性能实时大数据处理系统。提供全托管版 Flink 集群和引擎，提高作业开发运维效率。

我要提问

收录在圈子:

阿里云实时计算Flink

199214

+ 订阅

实时计算 Flink 版（Alibaba Cloud Realtime Compute for Apache Flink，Powered by Ververica）是阿里云基于 Apache Flink 构建的企业级、高性能实时大数据处理系统，由 Apache Flink 创始团队官方出品，拥有全球统一商业化品牌，完全兼容开源 Flink API，提供丰富的企业级增值功能。

相关文章

阿里云Kafka一键入湖技术详解：Iceberg+OSS Table Bucket落地方案

阿里云检索分析服务Elasticsearch版对接使用全攻略

专访｜GEO落地工程师罗长才：解析GEO与低时延通信、算网基础设施的协同赋能逻辑

阿里云表格存储Tablestore对接使用完全指南：从入门到实战

别等用户跑路才报警！大数据风控，真正拼的是“毫秒级判断”

热门讨论

热门文章

Flink CDC任务从savepoint/checkpoints状态中恢复作业错误问题

Flink CDC 能适配达梦不？

有用flink cdc同步mysql到hive这样搞过的源码吗?

flink1.19和hive3.1.3，cdc从mysql同步数据到hive，插入时报错？

flinkcdc在IDEA运行正常，打包就报错

哪位有编译好的cdc 2.2.0版本能能试用flink 1.14.2的包呀？

Flink CDC里这个问题怎么解决？

在Flink想实时汇总数据，类似数据大屏功能，应该用阿里云Flink的什么功能服务？

那cdc最新版支持到flink的哪个版本，flink1.15还有guava兼容性问题吗？

flink 手动触发savepoint会出现timeout，有办法调整超市时间之类吗？

展开全部

Flink SQL 功能解密系列 —— 流式 TopN 挑战与实现

史上超强阵容！大数据及人工智能领域顶级盛会，Flink Forward Asia 2019 不容错过！

Apache Flink 漫谈系列(04) - State

Flink SQL 功能解密系列 —— 数据去重的技巧和思考

超燃！Apache Flink 全球顶级盛会强势来袭

基于实时计算（Flink）与高斯模型构建实时异常检测系统

Apache Flink 漫谈系列(06) - 流表对偶(duality)性

重磅揭晓！Flink Forward Asia 2019 议程完整出炉

Apache Flink 零基础入门（三）：DataStream API 编程

实时计算Flink on Kubernetes产品模式介绍

展开全部

还有其他疑问?