文档备案控制台

开发者社区大数据与机器学习实时计算 Flink 正文

关于Flink CDC开启newlyAddedTable参数，不采集新的分表这个行为，是设计就是如？

关于Flink CDC开启newlyAddedTable参数，不采集新的分表这个行为，是设计就是如此吗？看起来源码里是判断如果开启了newlyAddedTable，新的分表的数据就直接不往下游发送了？

展开

收起

真的很搞笑 2023-08-01 12:59:37 170 版权

版权声明：本文内容由阿里云实名注册用户自发贡献，版权归原作者所有，阿里云开发者社区不拥有其著作权，亦不承担相应法律责任。具体规则请查看《阿里云开发者社区用户服务协议》和《阿里云开发者社区知识产权保护指引》。如果您发现本社区中有涉嫌抄袭的内容，填写侵权投诉表单进行举报，一经查实，本社区将立刻删除涉嫌侵权内容。

1 条回答

写回答

取消提交回答

清风拂袖

Flink CDC 开启 newlyAddedTable 参数后，是不采集新的分表的数据的。这是为了避免当数据库新增分表时，Flink CDC 会将新增分表的数据全部发送到下游，导致下游的数据量过大。

如果您需要采集新增分表的数据，可以将 newlyAddedTable 参数设置为 false。但是，需要注意的是，当数据库新增分表时，Flink CDC 可能会错过新增分表的数据。

以下是 Flink CDC 不采集新增分表数据的原因：

当数据库新增分表时，Flink CDC 无法保证新增分表的数据和原有分表的数据是一致的。例如，新增分表可能包含原有分表中没有的数据，或者包含原有分表中数据的更新。如果 Flink CDC 直接将新增分表的数据发送到下游，可能会导致下游的数据不一致。
当数据库新增分表时，Flink CDC 无法保证新增分表的数据能够正确地落到下游。例如，新增分表的数据可能太大，导致下游无法处理。或者，新增分表的数据可能包含不正确的数据，导致下游的数据不正确。如果 Flink CDC 直接将新增分表的数据发送到下游，可能会导致下游出现问题。
因此，为了避免这些问题，Flink CDC 默认不采集新增分表的数据。如果您确实需要采集新增分表的数据，可以将 newlyAddedTable 参数设置为 false，但是需要注意上述的风险。

2023-09-25 18:06:19

赞同展开评论

问答分类：

流计算实时计算 Flink版

问答标签：

实时计算 Flink版CDC 实时计算 Flink版采集实时计算 Flink版参数实时计算 Flink版cdc分表实时计算 Flink版分表

问答地址：

开发者社区 > 大数据与机器学习 > 实时计算 Flink > 问答

相关问答

实时计算 Flink版

为什么flink cdc不能相同库共用一个源，然后再分表？

266

1

0

Flink mysql如果是分表的话这里要把所有表的名字都分别填一下么？

164

1

0

Flink参数里已经加了这个参数，为什么作业还是报错日期为0？

216

0

0

在 Flink 1.15 中，CAST 操作的默认行为有何变化？

250

1

0

使用flink-connector-oracle连接器实时采集oracle中的数据？

285

0

0

Flink 在哪个版本修复了 curator2.0 组件在 ZooKeeper状态下的行为问题？

183

1

0

Flink有没有什么参数可以设置mysql作为source的 binlog的保存时长？

244

1

0

机器学习PAI使用Flink写入行为序列时，报featureview not found是什么原因？

210

1

0

在Flink CDC中采集oracle19c的pdb库报这个错误，如何解决？

313

1

0

在Flink CDC中如下是这个参数控制保留hive 多久的分区吗？

204

0

0

大数据与机器学习

实时计算 Flink

实时计算Flink版是阿里云提供的全托管Serverless Flink云服务，基于 Apache Flink 构建的企业级、高性能实时大数据处理系统。提供全托管版 Flink 集群和引擎，提高作业开发运维效率。

我要提问

相关文章

别等用户跑路才报警！大数据风控，真正拼的是“毫秒级判断”

StarRocks x Fluss x Paimon 湖流一体方案：构建秒级响应、湖流一体的实时数据引擎

为什么你的物联网平台总是“掉链子”？真正的问题，不是设备，而是数据平台！

实时云渲染是什么？一文读懂实时云渲染、WebGL 与像素流的核心区别

阿里云实时计算Flink版对接实战：从数据源到结果表的全链路开发指南

热门讨论

热门文章

Flink CDC任务从savepoint/checkpoints状态中恢复作业错误问题

哪位有编译好的cdc 2.2.0版本能能试用flink 1.14.2的包呀？

FLink 1.13版本升级Flink 1.17 报错，怎么解决？

FLink 1.13版本升级Flink 1.17 报错，怎么处理？

Flink 1.13版本升级Flink 1.17 报错有人知道为什么吗?

Flink cdc sqlserver 希望不同步某些数据行

flink CDC 当第一次全量正常输出后，源表中数据任何变更就无法再被捕获到了，为什么？

Flink CDC 能适配达梦不？

那cdc最新版支持到flink的哪个版本，flink1.15还有guava兼容性问题吗？

有用flink cdc同步mysql到hive这样搞过的源码吗?

展开全部

Flink SQL 功能解密系列 —— 流式 TopN 挑战与实现

基于Flink的实时日志分析系统实践

深入了解 Flink 网络栈（二）：监控、指标和处理背压

开篇 | 揭秘 Flink 1.9 新架构，Blink Planner 你会用了吗？

基于Flink和规则引擎的实时风控解决方案

Flink on YARN（上）：一张图轻松掌握基础架构与启动流程

从 Storm 到 Flink，汽车之家基于 Flink 的实时 SQL 平台设计思路与实践

实时欺诈检测（风控）

【阿里内部应用】基于Blink构建亲听项目以及全链路debug项目实时响应能力

阿里重磅开源全球首个批流一体机器学习平台Alink，Blink功能已全部贡献至Flink

展开全部

还有其他疑问?