文档备案控制台

开发者社区大数据与机器学习实时计算 Flink 正文

flink cdc当sink开启多个parallel tasks后，是否考虑默认加一个机制？

flink cdc当sink开启多个parallel tasks后，sink表数据和source表数据不一致。如果恢复为单个task后，sink和source表数据是一致的。如果对key做hash，且key足够分散，数据倾斜会好点。不过这是flink function机制，flink cdc是否考虑默认加一个key selector的机制?

展开

收起

小小鹿鹿鹿 2024-05-31 17:39:02 284 版权

版权声明：本文内容由阿里云实名注册用户自发贡献，版权归原作者所有，阿里云开发者社区不拥有其著作权，亦不承担相应法律责任。具体规则请查看《阿里云开发者社区用户服务协议》和《阿里云开发者社区知识产权保护指引》。如果您发现本社区中有涉嫌抄袭的内容，填写侵权投诉表单进行举报，一经查实，本社区将立刻删除涉嫌侵权内容。

1 条回答

写回答

取消提交回答

Skyund

Flink CDC（Change Data Capture）主要用于捕获数据库的变化数据，而Flink的sink端处理数据时，如果开启了多个parallel tasks，确实可能会遇到数据一致性的问题，尤其是当sink写入的数据需要保持一定的顺序或唯一性时。这是因为多个sink tasks可能会并行写入同一目标，如果没有恰当的分区逻辑，就可能导致数据重复或丢失。

2024-05-31 18:35:39

赞同展开评论

问答分类：

流计算实时计算 Flink版

问答标签：

实时计算 Flink版CDC 实时计算 Flink版Sink 实时计算 Flink版机制实时计算 Flink版cdc sink 实时计算 Flink版tasks

问答地址：

开发者社区 > 大数据与机器学习 > 实时计算 Flink > 问答

相关问答

Flink HA的机制很好，但在api-server出问题重启的时候会导致消耗次数，怎么办？

216

2

0

我想测本地一下Flink CDC的checkpoint机制，能指点下这个大概哪里的问题么？

261

1

0

请教下 flink sql ROW_NUMBER()回退更新的机制，有相关文档介绍吗？

1004

3

0

在 Flink 机制中，DFS 如何帮助实现 DSTL 的短期持久化和一致性保证？

200

1

0

Flink中通过MQ的连接器消费数据时有确认机制吗？

432

2

0

对于Flink CDC，有机制能在快照阶段结束后给外部系统发消息吗？

171

1

0

在Flink CDC中binlog 有读取锁的机制吗？

191

0

0

Flink状态机制是什么

155

1

0

Flink CDC这种hook机制，flink有么子？

188

0

0

Flink CDC请教一下这个机制有优化的配置吗？

186

0

0

大数据与机器学习

实时计算 Flink

实时计算Flink版是阿里云提供的全托管Serverless Flink云服务，基于 Apache Flink 构建的企业级、高性能实时大数据处理系统。提供全托管版 Flink 集群和引擎，提高作业开发运维效率。

我要提问

相关文章

实时云渲染是什么？一文读懂实时云渲染、WebGL 与像素流的核心区别

阿里云实时计算Flink版对接实战：从数据源到结果表的全链路开发指南

广告竞价为什么要拼毫秒级速度？揭秘 RTB 实时广告系统背后的数据流水线设计

告别干扰困扰！RFID手持机在复杂仓储中的可靠表现

分链路差异化设计的DSP准实时数仓｜钛动科技基于阿里云实时计算 Flink 版 + DLF Paimon + EMR Serverless StarRocks 的实践

热门讨论

热门文章

Flink CDC任务从savepoint/checkpoints状态中恢复作业错误问题

哪位有编译好的cdc 2.2.0版本能能试用flink 1.14.2的包呀？

FLink 1.13版本升级Flink 1.17 报错，怎么解决？

FLink 1.13版本升级Flink 1.17 报错，怎么处理？

Flink cdc sqlserver 希望不同步某些数据行

Flink 1.13版本升级Flink 1.17 报错有人知道为什么吗?

那cdc最新版支持到flink的哪个版本，flink1.15还有guava兼容性问题吗？

flink CDC 当第一次全量正常输出后，源表中数据任何变更就无法再被捕获到了，为什么？

Flink CDC中，有哪位大佬有flink 版本和cdc版本的适配统计啊？

Flink CDC 能适配达梦不？

展开全部

数据仓库介绍与实时数仓案例

实时计算 Flink SQL 核心功能解密

流计算精品翻译: The Dataflow Model

接着！！Apache Flink 全领域干货合集（持续更新）

Flink SQL 功能解密系列 —— 流式 TopN 挑战与实现

Flink SQL 功能解密系列 —— 流计算“撤回(Retraction)”案例分析

深入了解 Flink 网络栈（二）：监控、指标和处理背压

Flink: 快速构建统一的实时日志平台

Apache Flink 漫谈系列(15) - DataStream Connectors之Kafka

【阿里内部应用】基于Blink为新商业调控打造实时大数据交互查询服务

展开全部

还有其他疑问?