备案控制台

开发者社区大数据与机器学习实时计算 Flink 正文

请教各位，如果CDC JOB停止了一段时间后，再重新启动，那么两次JOB之间的数据，会按照数据库的操

请教各位，如果CDC JOB停止了一段时间后，再重新启动，那么两次JOB之间的数据，会按照数据库的操作行为形成Insert/Update Before / Updata After / DELETE的rowkind吗？还是在第二次JOB启动的时候，只会以全量数据同步的方式，全部以Insert向后续算子输出？谢谢

展开

收起

游客3oewgrzrf6o5c 2022-08-09 10:09:11 410 版权

版权声明：本文内容由阿里云实名注册用户自发贡献，版权归原作者所有，阿里云开发者社区不拥有其著作权，亦不承担相应法律责任。具体规则请查看《阿里云开发者社区用户服务协议》和《阿里云开发者社区知识产权保护指引》。如果您发现本社区中有涉嫌抄袭的内容，填写侵权投诉表单进行举报，一经查实，本社区将立刻删除涉嫌侵权内容。

阿里云 AI 助理回答

在CDC JOB停止一段时间后重新启动的情况下，作业的行为取决于所使用的具体技术（如Flink CDC）以及作业的配置方式。通常，Flink CDC支持从上次停止的位置继续读取Binlog，这意味着它能够捕获到两次JOB执行期间数据库中的所有变更操作，包括Insert、Update Before（如果支持并配置）、Update After及DELETE操作。

对于MySQL CDC：如果作业配置为在重启时从最新状态恢复（即利用checkpoint或savepoint），那么它会继续从上次停止的Binlog位置读取，因此能够识别出所有的变更事件，并以相应的RowKind（例如+I, -U, +U, -D）输出到后续算子。这确保了数据的连续性和一致性，不会简单地以全量插入的方式处理。
对于MongoDB CDC：在MongoDB 6.0及以上版本且开启了前像功能时，通过配置'scan.full-changelog' = 'true'，可以在SQL作业中输出-U（更新前镜像值）消息，实现更细粒度的变更记录处理。而在较低版本或特定配置下，可能需要额外逻辑来管理状态以获取更新前的镜像值，但基本原理仍然是基于增量日志进行连续处理，而非全量同步。

综上所述，只要作业被正确配置为断点续传模式，并且数据库的Binlog或类似变更日志没有因为过期而被清理，两次JOB之间的数据变更应当会被识别并以相应的RowKind形式输出，而不是仅以全量插入的方式处理。

有帮助

无帮助

AI 助理回答生成答案可能存在不准确，仅供参考

0 条回答

写回答

取消提交回答

问答分类：

数据库实时计算 Flink版

问答标签：

数据库数据 cdc数据数据库数据库cdc job数据库 cdc job数据库

问答地址：

开发者社区 > 大数据与机器学习 > 实时计算 Flink > 问答

相关问答

实时计算 Flink版

Flink CDC 同步mysql binglog 的时候，这个服务每天准时都会报这个错误怎么回事

175

0

0

Flink CDC 里我现在需要同步一个数据库的数据转换到另一个库需要怎么做？

200

2

0

Flink CDC程序设置监控ORACLE的一张表，大概需要消耗多少数据库资源？

122

0

0

Flink CDC里一般轨迹点数据用什么数据库存比较好？

113

1

0

为啥看不到 flink cdc 支持数据库版本范围？为啥不维护？

76

1

0

Flink CDC 里能抽取达梦数据库嘛？

390

1

0

Flink CDC 里启动多个job清洗会对原数据库的Binlog有什么影响吗？有什么推荐的方式吗？

166

1

0

OceanBase数据库这个用户的密码是创建时生效的吗？

138

1

0

OceanBase数据库这个获取oracle读库的oma 版本有限制吗？

133

1

0

OceanBase数据库如何反向生成PDM文件

126

1

0

大数据与机器学习

实时计算 Flink

实时计算Flink版是阿里云提供的全托管Serverless Flink云服务，基于 Apache Flink 构建的企业级、高性能实时大数据处理系统。提供全托管版 Flink 集群和引擎，提高作业开发运维效率。

我要提问

收录在圈子:

阿里云实时计算Flink

199215

+ 订阅

实时计算 Flink 版（Alibaba Cloud Realtime Compute for Apache Flink，Powered by Ververica）是阿里云基于 Apache Flink 构建的企业级、高性能实时大数据处理系统，由 Apache Flink 创始团队官方出品，拥有全球统一商业化品牌，完全兼容开源 Flink API，提供丰富的企业级增值功能。

相关文章

现在阿里云服务器打几折？2026年阿里云服务器优惠活动解析：购买、续费与升级指南

阿里云服务器最新活动价格：新用户专享u2a实例和新老用户同享云服务器活动价格参考

RFID智能化车辆管理方案让效率倍增

MongoDB常用命令

阿里云2026年优惠建站费用全解析：三种方案的价格、功能与选型指南

热门讨论

热门文章

Flink CDC任务从savepoint/checkpoints状态中恢复作业错误问题

Flink1.17为什么需要JDK 11呢？JDK8我试了也能运行

请问一下Flink mysqlcdc获取到数据之后关联结果不更新这个怎么办?

Flink CDC有知道Mac m1下的docker 环境如何开启sqlserver代理吗？

Flink CDC 人大金仓能作为source吗？支持bin-log吗？

Flink CDC把主表先全量同步到索引中更新到索引中这种怎么搞？

flink cdc同步的源表，一定要有主键么？

我使用flink cdc StartupOptions.latest() 采最新的日志。要是程序挂了

flink datastream ，向clickhouse插入数据时怎么关闭插入时更新,

flink cdc source端能降低消费速度嘛？

展开全部

Flink SQL 功能解密系列 —— 流式 TopN 挑战与实现

Flink SQL 功能解密系列 —— 流计算“撤回(Retraction)”案例分析

咱们从头到尾讲一次 Flink 网络流控和反压剖析

基于Flink和规则引擎的实时风控解决方案

如何分析及处理 Flink 反压？

日处理数据量超10亿：友信金服基于Flink构建实时用户画像系统的实践

Apache Flink 零基础入门（一）：基础概念解析

【阿里内部应用】基于Blink构建亲听项目以及全链路debug项目实时响应能力

Apache Flink 进阶（三）：Checkpoint 原理解析与应用实践

小红书如何实现高效推荐？解密背后的大数据计算平台架构

展开全部

还有其他疑问?