备案控制台

开发者社区 > 大数据与机器学习 > 实时计算 Flink > 正文

咨询一个Flink问题，非开窗，非聚合的数据倾斜有什么优化思路？

咨询一个Flink问题，非开窗，非聚合的数据倾斜有什么优化思路？；前提条件需要保证相同key的数据在一个task 里面处理；

场景大概是：上游kafka的数据是用户每个时间点的用户属性变化信息（可能这个时间点是 f1, f2, f3,属性变更；下一个时间点是: f2, f4 属性变更），需要写入到下游数据库
属性变化信息也分几种，同一条数据中的属性操作都是一样，比如这条数据需要给用户的属性做求和动作，下一条相同用户可能需要做局部更新动作，在或者相同用户做保留首次属性动作

我目前的算子结构是： map.filter.keyby.process.sink ==> key 是用户的ID

展开

收起

cuicuicuic 2024-04-17 14:05:44 14 0

0 条回答

写回答

取消提交回答

问答分类：

流计算消息中间件 Kafka 数据库实时计算 Flink版云消息队列 Kafka 版

问答标签：

实时计算 Flink版开窗实时计算 Flink版优化实时计算 Flink版聚合数据倾斜实时计算 Flink版数据倾斜实时计算 Flink版聚合

问答地址：

开发者社区 > 大数据与机器学习 > 实时计算 Flink > 问答

版权声明：本文内容由阿里云实名注册用户自发贡献，版权归原作者所有，阿里云开发者社区不拥有其著作权，亦不承担相应法律责任。具体规则请查看《阿里云开发者社区用户服务协议》和《阿里云开发者社区知识产权保护指引》。如果您发现本社区中有涉嫌抄袭的内容，填写侵权投诉表单进行举报，一经查实，本社区将立刻删除涉嫌侵权内容。

相关问答

实时计算 Flink版

Flink CDC请教一下这个机制有优化的配置吗？

5

0

0

Flink k8s HA 锁资源在etcd偶发出现写失败时候，请教一下这个机制有优化的配置吗？

8

1

0

请问flink后续版本有优化cdc count 统计时update 数据导致的重复计数问题吗？

27

0

0

Flink中keyby以后是按照每个key值分别开窗吧？不同key值的窗口是互不影响的对吗？

21

1

0

Flink对list接口排序进行优化，请问现在发布了吗？

25

1

0

优化Flink转换

1566

1

0

各位大佬，请教一下，如果在flink cdc sql客户端使用SQL查询表，怎么能记录原系统的数据

1858

1

0

那cdc最新版支持到flink的哪个版本，flink1.15还有guava兼容性问题吗？

972

0

0

flink cdc(mysql) -> elasticsearch7, 任务每次持续跑了一段时间之后

940

2

0

哪位有编译好的cdc 2.2.0版本能能试用flink 1.14.2的包呀？

712

1

0

大数据与机器学习

实时计算 Flink

实时计算Flink版是阿里云提供的全托管Serverless Flink云服务，基于 Apache Flink 构建的企业级、高性能实时大数据处理系统。提供全托管版 Flink 集群和引擎，提高作业开发运维效率。

我要提问

热门讨论

热门文章

FlinkCDC MySQL 中 scan.startup.mode 用的是什么模式啊？

flink1.15启动后无法访问webui的问题有人遇到过吗

Flink CDC有遇见这个问题的吗？

Flink这个未授权访问漏洞有什么解决方案吗？

yarn集群资源是充足的，为什么提交任务失败呢

阿里云实时计算的资源单位是什么？

Caused by: org.apache.kafka.common.errors.TimeoutE

flink怎么能够快速消费kafka数据，需要设置什么参数呢？

"flink-cdc-connector-mysql，这个报错怎么解决的？

Flink CDC中我使用了自定义聚合函数，但是报错这个需要怎么解决呢？

展开全部

数据仓库介绍与实时数仓案例

权威详解 | 阿里新一代实时计算引擎 Blink，每秒支持数十亿次计算

分布式Snapshot和Flink Checkpointing简介

Flink SQL 功能解密系列 —— 维表 JOIN 与异步优化

流计算StreamCompute

通过Flink实时构建搜索引擎的索引

Flume+Kafka+Flink+Redis构建大数据实时处理系统：实时统计网站PV、UV展示

阿里云实时计算产品案例&解决方案汇总

为什么说流处理即未来？

广告场景下的实时计算

展开全部

相关课程

更多

大数据Flink实时旅游平台环境篇 2020版

582

29

去学习

Apache Flink 入门到实战 - Flink开源社区出品

1392

16

去学习

实时计算 Flink 版产品入门与实操

3806

10

去学习

开源 Flink 极速上手教程

1752

7

去学习

大数据实时计算框架Spark快速入门

778

93

去学习

Apache Flink 入门

4826

9

去学习

相关电子书

更多

Flink CDC Meetup PPT - 龚中强 立即下载

Flink CDC Meetup PPT - 王赫 立即下载

Flink CDC Meetup PPT - 覃立辉 立即下载

相关实验场景

更多