文档备案控制台

开发者社区大数据与机器学习实时计算 Flink 正文

flink oracle cdc 增量阶段可能会丢数据吗，没有信息？

flink oracle cdc 增量阶段可能会丢数据吗，没有信息？

展开

收起

真的很搞笑 2023-09-20 13:23:44 396 版权

版权声明：本文内容由阿里云实名注册用户自发贡献，版权归原作者所有，阿里云开发者社区不拥有其著作权，亦不承担相应法律责任。具体规则请查看《阿里云开发者社区用户服务协议》和《阿里云开发者社区知识产权保护指引》。如果您发现本社区中有涉嫌抄袭的内容，填写侵权投诉表单进行举报，一经查实，本社区将立刻删除涉嫌侵权内容。

1 条回答

写回答

取消提交回答

清风拂袖

Flink Oracle CDC 的增量阶段不会丢数据。Oracle CDC 会使用 SELECT SCN FROM V$TRANSACTION V WHERE V$TRANSACTION.XID IS NULL 查询获取当前事务的 SCN，然后将这个 SCN 作为增量阶段的起始 SCN。当 Oracle 数据库中发生数据变更时，Oracle CDC 会将变更数据提交到 Kafka，并将变更数据对应的 SCN 也提交到 Kafka。那么，只要 Flink Oracle CDC 的增量阶段的起始 SCN 大于等于 Kafka 中提交的第一个 SCN，那么 Flink Oracle CDC 就不会丢数据。

如果 Flink Oracle CDC 的增量阶段的起始 SCN 小于 Kafka 中提交的第一个 SCN，那么 Flink Oracle CDC 可能会丢数据。因为 Flink Oracle CDC 在增量阶段不会读取 Kafka 中之前提交的数据。

为了避免数据丢失，可以使用以下方法：

在 Flink Oracle CDC 的任务启动前，将 Oracle 数据库中的所有数据提交到 Kafka。
在 Flink Oracle CDC 的任务中设置 useChangeStream 为 true。当设置为 true 时，Flink Oracle CDC 会在增量阶段读取 Kafka 中之前提交的数据。
在 Flink Oracle CDC 的任务中设置 resumeFromChangeStreamOffset 属性。该属性指定从 Kafka 中哪一个 SCN 开始读取数据。如果指定的 SCN 大于等于 Kafka 中提交的第一个 SCN，那么 Flink Oracle CDC 就不会丢数据。
如果您有任何其他问题，可以联系 Flink 社区寻求帮助。

2023-10-19 09:43:11

赞同展开评论

问答分类：

Oracle 关系型数据库流计算实时计算 Flink版

问答标签：

实时计算 Flink版CDC Oracle数据库一键上云flink 实时计算 Flink版数据 Oracle数据库一键上云数据 flink Oracle数据库一键上云

问答地址：

开发者社区 > 大数据与机器学习 > 实时计算 Flink > 问答

相关问答

实时计算 Flink版

flink cdc 采集oracle 间歇性丢数据，日志里也没报错的情况，怎么回事？

430

0

0

Flink CDC2.4用online模式增量抓取oracle数据有数据丢失，有了解这个情况的吗？

379

3

0

Flink CDC中oracle-cdc全量没有问题，增量也没有问题，但是持续跑一段时间出这个错了？

248

1

0

flink cdc mysql到kafka为啥会丢数据呢？

178

0

0

Flink CDC 从oracle到mysql时最小补充日志是不是不足以提供变更的信息

325

1

0

flink es connector7丢数据

303

0

0

在Flink CDC中oraclecdc丢数据日志只看到这个warn ，如何解决？

314

0

0

在Flink CDC中oceanbase oracle initial模式全量转增量读取报错怎么办？

461

7

0

在Flink CDC中oraclecdc偶发丢数据，如何解决？

173

0

0

Flink CDC中oracle为啥报这个错，本来是连上了获取到了信息，然后继续扔数据就报这个错？

108

1

0

大数据与机器学习

实时计算 Flink

实时计算Flink版是阿里云提供的全托管Serverless Flink云服务，基于 Apache Flink 构建的企业级、高性能实时大数据处理系统。提供全托管版 Flink 集群和引擎，提高作业开发运维效率。

我要提问

相关文章

云原生部署实战！Taocarts助力反向海淘代购系统实现高可用、低延迟

国产向量数据库有哪些？两大技术流派深度对比与选型指南

InnoDB索引结构深潜：B+Tree与回表机制的底层逻辑

阿里云PolarDB跨区域灾备部署完全指南：从GDN架构到异地容灾实战

相关解决方案

更多

多模态数据信息提取

Flink CDC 实现企业级实时数据同步

基于数据闪回，快速恢复数据

海量异构数据预处理破局之道

分析 Agent 实现一键 AI 数据洞察

热门讨论

热门文章

Flink CDC任务从savepoint/checkpoints状态中恢复作业错误问题

有用flink cdc同步mysql到hive这样搞过的源码吗?

flink1.19和hive3.1.3，cdc从mysql同步数据到hive，插入时报错？

flinkcdc在IDEA运行正常，打包就报错

Flink CDC 能适配达梦不？

哪位有编译好的cdc 2.2.0版本能能试用flink 1.14.2的包呀？

那cdc最新版支持到flink的哪个版本，flink1.15还有guava兼容性问题吗？

如何用实时数据同步打破企业数据孤岛？

在Flink想实时汇总数据，类似数据大屏功能，应该用阿里云Flink的什么功能服务？

咨询下各位大佬，用Flink CDC 2.2.0同步MYSQL数据库，库表是latin1编码的时候？

展开全部

数据仓库介绍与实时数仓案例

通过Flink实时构建搜索引擎的索引

Flume+Kafka+Flink+Redis构建大数据实时处理系统：实时统计网站PV、UV展示

流计算精品翻译: The Dataflow Model

回顾 | Kafka x Flink Meetup 与世界人工智能大会大数据 AI 专场精彩回顾（附PPT下载）

Flink SQL 功能解密系列 —— 流式 TopN 挑战与实现

Apache Flink 的迁移之路，2 年处理效果提升 5 倍

基于实时计算（Flink）打造一个简单的实时推荐系统

Flink Checkpoint 问题排查实用指南

广告场景下的实时计算

展开全部

还有其他疑问?