备案控制台

开发者社区 > 大数据与机器学习 > 实时计算 Flink > 正文

Flink CDC一个场景中需要关联十几张表并聚合，每次变更都会更新到Kafka很多数据？

Flink CDC一个场景中需要关联十几张表并聚合，我现在使用了upsertkafaka将这个大融合切成多个，但是现在问题是这样每个新任务基于上次的upsert Kafka数据量非常大，每次变更都会更新到Kafka很多数据？有没有更好的方式比如结合ice格式的流融合？es8 table connector pls不想走中转感觉走upsertKafka会变慢？

展开

收起

真的很搞笑 2023-12-11 13:20:22 76 0

1 条回答

写回答

取消提交回答

小周sir

面对过去，不要迷离；面对未来，不必彷徨；活在今天，你只要把自己完全展示给别人看。

您可以考虑使用Flink CDC的流融合功能来解决这个问题。流融合可以将多个表的数据进行关联和聚合，并将结果写入到目标表中。相比于将数据写入到Kafka中再进行处理，流融合可以减少数据传输和处理的开销，提高系统的性能。

对于Iceberg格式的流融合，您可以使用Flink CDC的Iceberg Connector来实现。该连接器支持将数据写入到Iceberg表中，并提供了一些高级功能，如数据分区、数据文件管理和版本控制等。通过使用Iceberg Connector，您可以将多个表的数据进行关联和聚合，并将结果写入到Iceberg表中。

2023-12-12 17:36:11

赞同展开评论打赏

问答分类：

消息中间件 Kafka 流计算 ice 云消息队列 Kafka 版实时计算 Flink版

问答标签：

实时计算 Flink版CDC 实时计算 Flink版场景实时计算 Flink版数据实时计算 Flink版kafka 实时计算 Flink版变更

问答地址：

开发者社区 > 大数据与机器学习 > 实时计算 Flink > 问答

相关产品：

实时计算 Flink版

版权声明：本文内容由阿里云实名注册用户自发贡献，版权归原作者所有，阿里云开发者社区不拥有其著作权，亦不承担相应法律责任。具体规则请查看《阿里云开发者社区用户服务协议》和《阿里云开发者社区知识产权保护指引》。如果您发现本社区中有涉嫌抄袭的内容，填写侵权投诉表单进行举报，一经查实，本社区将立刻删除涉嫌侵权内容。

相关问答

实时计算 Flink版

Redis Stream在高吞吐场景下相比Kafka有哪些优势？

106

1

0

Kafka主要应用于哪些场景？

115

1

0

平台如何实现场景深度定制以降低Kafka消耗？

35

1

0

在Flink CDC中我的场景是把变更数据抽到Kafka进行实时计算，这种脏数据应该咋处理？

29

0

0

为什么Kafka在海量队列场景下存在性能问题?

29

1

0

企业版Flink CDC能从Hologress捕获变更数据到kafka或datahub吗

38

1

0

消息队列Kafka版变更实例规格时接入点会发生变化吗

21

1

0

消息队列Kafka版的topic售卖模式变更

35

1

0

Kafka主要有哪些应用的场景？详细说说

29

1

0

flink的一个场景问题

635

1

0

大数据与机器学习

实时计算 Flink

实时计算Flink版是阿里云提供的全托管Serverless Flink云服务，基于 Apache Flink 构建的企业级、高性能实时大数据处理系统。提供全托管版 Flink 集群和引擎，提高作业开发运维效率。

我要提问

相关产品

实时计算 Flink版

文档详情产品详情

热门讨论

热门文章

FFA 2024 大会门票免费送！AI时代下大数据技术未来路在何方？

flinkcdc性能很差

Flink sql将数组炸开，实现hive的explode函数的效果，还有什么其他好的方式？

请问如何用flink sql客户端用yarn application模式提交任务呢？

Flink如何配置Task Manager？

Flink 集群重启后，所有的Jobs任务全都没有了。如果快速恢复所有的任务

FlinkCDC MySQL 中 scan.startup.mode 用的是什么模式啊？

flink怎么能够快速消费kafka数据，需要设置什么参数呢？

大佬们，flink cdc如何集成达梦数据库？或者有没有解决方案？

flinkcdc启动，怎么修改默认端口号，默认是8081。

展开全部

数据仓库介绍与实时数仓案例

权威详解 | 阿里新一代实时计算引擎 Blink，每秒支持数十亿次计算

Flink SQL 功能解密系列 —— 维表 JOIN 与异步优化

Flume+Kafka+Flink+Redis构建大数据实时处理系统：实时统计网站PV、UV展示

阿里云实时计算产品案例&解决方案汇总

接着！！Apache Flink 全领域干货合集（持续更新）

回顾 | Kafka x Flink Meetup 与世界人工智能大会大数据 AI 专场精彩回顾（附PPT下载）

Apache Flink 的迁移之路，2 年处理效果提升 5 倍

Flink Checkpoint 问题排查实用指南

史上超强阵容！大数据及人工智能领域顶级盛会，Flink Forward Asia 2019 不容错过！

展开全部

相关课程

更多

实时数据分析：使用Flink实时发现最热Github项目

1133

1

去学习

实时数据接入：5分钟上手 Flink MySQL 连接器

613

1

去学习

消息队列Kafka入门课程

3487

4

去学习

大数据知识图谱系列—基于ELK+Flink日志全观测最佳实践

224

1

去学习

基于Flink的实时大数据应用Demo

268

1

去学习

分布式消息系统 Kafka 快速入门

979

24

去学习

相关电子书

更多

Java Spring Boot开发实战系列课程【第16讲】：Spring Boot 2.0 实战Apache Kafka百万级高并发消息中间件与原理解析 立即下载

MaxCompute技术公开课第四季之如何将Kafka数据同步至MaxCompute 立即下载

消息队列kafka介绍 立即下载

相关实验场景

更多