开发者社区大数据与机器学习实时计算 Flink 正文

flink SQL 多维分析（grouping sets）大家有没有遇到过瓶颈的，有什么优化方案嘛

flink SQL 多维分析（grouping sets）大家有没有遇到过瓶颈的，有什么优化方案嘛，topic一天一亿左右

展开

收起

雪哥哥 2022-11-20 21:55:16 529 版权

1 条回答

写回答

取消提交回答

武当张三丰丶

存在即是合理

目前没有经历过这么大的数据，但是可以用这些方向去优化，仅供参考：

1、使用更高效的算法：Flink SQL 支持多种算法来进行多维分析，例如 KMeans、DBSCAN 等。可以尝试使用这些算法来优化性能。

2、减少维度：如果数据集中有大量的重复数据，可以尝试减少维度来减少数据量。这可以通过删除重复行或使用 Spark SQL 的 distinct 函数来实现。

3、使用 Flink SQL 的聚合操作：Flink SQL 支持多种聚合操作，例如 sum、avg、max 等可以减少计算量。

4、使用 Flink SQL 的并行化功能：Flink SQL 支持并行化功能，可以加速计算。

5、使用 Flink SQL 的批处理功能：考虑使用 Flink SQL 的批处理功能来处理数据。

6、使用 Flink SQL 的缓存：Flink SQL 支持缓存功能

2023-04-19 14:04:53

赞同展开评论

问答分类：

SQL 流计算实时计算 Flink版

问答标签：

SQL优化 flink SQL 实时计算 Flink版SQL 实时计算 Flink版优化 SQL方案

问答地址：

开发者社区 > 大数据与机器学习 > 实时计算 Flink > 问答

相关问答

实时计算 Flink版

真实业务的SQL有什么特点，导致传统方案需要怎样的架构来处理？

未来如何优化 Flink CDC OceanBase Connector 的数据读取？

在Flink CDC的并行读取最终方案中，你们是如何通过标签和通知机制来保证数据顺序和状态清理的？

128

在Hudi on Flink的初期使用中，你们遇到了哪些问题，并与Hudi社区一起进行了哪些优化？

在银行业务中，通过Flink分析的业务流程和指标如何优化业务流程？

在Flink CDC中，有什么方法优化吗？是否只能加资源?

132

在Flink CDC中，paimon sink 能够优化？

129

在Flink CDC中，线上发现消费速度有点慢，想优化下这俩参数？

社区在 Flink 的哪个版本中针对构建执行图的问题进行了优化？

Flink 社区对于状态重新分配的优化有何计划？

大数据与机器学习

实时计算 Flink

实时计算Flink版是阿里云提供的全托管Serverless Flink云服务，基于 Apache Flink 构建的企业级、高性能实时大数据处理系统。提供全托管版 Flink 集群和引擎，提高作业开发运维效率。

我要提问

收录在圈子:

阿里云实时计算Flink

199214

+ 订阅

实时计算 Flink 版（Alibaba Cloud Realtime Compute for Apache Flink，Powered by Ververica）是阿里云基于 Apache Flink 构建的企业级、高性能实时大数据处理系统，由 Apache Flink 创始团队官方出品，拥有全球统一商业化品牌，完全兼容开源 Flink API，提供丰富的企业级增值功能。

《理解MySQL数据库》从SQL语句到执行计划的转换艺术

《理解MySQL数据库》查询优化器深度解析智能查询优化的核心引擎

Java编程技巧：<where>和<if>标签的组合使用示例

设计模式了解吗，知道什么是饿汉式和懒汉式吗？

QuickSSO 与 ECreator 实操应用案例手册

flink SQL 多维分析（grouping sets）大家有没有遇到过瓶颈的，有什么优化方案嘛

实时计算 Flink

相关文章

热门讨论

热门文章