文档备案控制台

开发者社区大数据与机器学习实时计算 Flink 正文

flink SQL 多维分析（grouping sets）大家有没有遇到过瓶颈的，有什么优化方案嘛

flink SQL 多维分析（grouping sets）大家有没有遇到过瓶颈的，有什么优化方案嘛，topic一天一亿左右

展开

收起

雪哥哥 2022-11-20 21:55:16 645 版权

1 条回答

写回答

取消提交回答

武当张三丰丶

存在即是合理

目前没有经历过这么大的数据，但是可以用这些方向去优化，仅供参考：

1、使用更高效的算法：Flink SQL 支持多种算法来进行多维分析，例如 KMeans、DBSCAN 等。可以尝试使用这些算法来优化性能。

2、减少维度：如果数据集中有大量的重复数据，可以尝试减少维度来减少数据量。这可以通过删除重复行或使用 Spark SQL 的 distinct 函数来实现。

3、使用 Flink SQL 的聚合操作：Flink SQL 支持多种聚合操作，例如 sum、avg、max 等可以减少计算量。

4、使用 Flink SQL 的并行化功能：Flink SQL 支持并行化功能，可以加速计算。

5、使用 Flink SQL 的批处理功能：考虑使用 Flink SQL 的批处理功能来处理数据。

6、使用 Flink SQL 的缓存：Flink SQL 支持缓存功能

2023-04-19 14:04:53

赞同展开评论

问答分类：

SQL 流计算实时计算 Flink版

问答标签：

SQL优化 flink SQL 实时计算 Flink版SQL 实时计算 Flink版优化 SQL方案

问答地址：

开发者社区 > 大数据与机器学习 > 实时计算 Flink > 问答

相关问答

实时计算 Flink版

请问一下flink sql的问题 , 使用处理时间时，滚动窗口不支持grouping sets么？

378

实时计算 Flink版多维分析和报表查询有啥区别啊，和普通查询又有啥区别呢？

351

请问下，flink sql 创建后，源库删除，目标不删除，这个操作有好的解决方法没呀？

2146

各位大佬，请教一下，如果在flink cdc sql客户端使用SQL查询表，怎么能记录原系统的数据

2306

flink sql 可不可以实现过滤某种操作事件

2492

1872

flink cdc(mysql) -> elasticsearch7, 任务每次持续跑了一段时间之后

1462

哪位有编译好的cdc 2.2.0版本能能试用flink 1.14.2的包呀？

6298

各位大佬，请教个问题，使用flink cdc读取数据时，如果配置一个表，数据过滤是发生在server

2169

flink cdc 怎么做断点续传啊

6718

大数据与机器学习

实时计算 Flink

实时计算Flink版是阿里云提供的全托管Serverless Flink云服务，基于 Apache Flink 构建的企业级、高性能实时大数据处理系统。提供全托管版 Flink 集群和引擎，提高作业开发运维效率。

我要提问

收录在圈子:

阿里云实时计算Flink

199214

+ 订阅

实时计算 Flink 版（Alibaba Cloud Realtime Compute for Apache Flink，Powered by Ververica）是阿里云基于 Apache Flink 构建的企业级、高性能实时大数据处理系统，由 Apache Flink 创始团队官方出品，拥有全球统一商业化品牌，完全兼容开源 Flink API，提供丰富的企业级增值功能。

Bidfans接口参数精准校验体系杜绝非法请求风险

数据目录和数据字典有什么区别？一文讲清

执行计划进阶：读懂filtered和rows的组合，精准判断索引设计质量

API 接口慢调用根因定位：从 TCP 建连到数据库 IO 的全栈排查实战

从数据湖到多模态湖仓-基于阿里云 EMR Serverless StarRocks 与 DLF Paimon 构建AI时代的统一分析检索架构

flink SQL 多维分析（grouping sets）大家有没有遇到过瓶颈的，有什么优化方案嘛

实时计算 Flink

相关文章

相关解决方案

热门讨论

热门文章