实时计算 Flink版产品使用合集之flinkcdc回撤流如果更新之前的数据，会把先前的数据删除，再插入更新的数据吗-阿里云开发者社区

实时计算 Flink版产品使用合集之flinkcdc回撤流如果更新之前的数据，会把先前的数据删除，再插入更新的数据吗

2024-05-23 325

版权

本文内容由阿里云实名注册用户自发贡献，版权归原作者所有，阿里云开发者社区不拥有其著作权，亦不承担相应法律责任。具体规则请查看《阿里云开发者社区用户服务协议》和《阿里云开发者社区知识产权保护指引》。如果您发现本社区中有涉嫌抄袭的内容，填写侵权投诉表单进行举报，一经查实，本社区将立刻删除涉嫌侵权内容。

简介： 实时计算Flink版作为一种强大的流处理和批处理统一的计算框架，广泛应用于各种需要实时数据处理和分析的场景。实时计算Flink版通常结合SQL接口、DataStreamAPI、以及与上下游数据源和存储系统的丰富连接器，提供了一套全面的解决方案，以应对各种实时计算需求。其低延迟、高吞吐、容错性强的特点，使其成为众多企业和组织实时数据处理首选的技术平台。以下是实时计算Flink版的一些典型使用合集。

问题一：flinkcdc可以读到Oracle的ddl不？

flinkcdc可以读到Oracle的ddl不？

参考答案：

Flink CDC 可以读取到 Oracle 的 DDL（数据定义语言）语句，但是Flink CDC 可以读取到 Oracle 的 DDL（数据定义语言）语句，但是需要使用 Flink CDC 的 Debezium 模式。在 Debezium 模式下，Flink CDC 会监听 Oracle 数据库中的 binlog，从而获取到所有的 DDL 语句、DML 语句和 DDL 事件等。

需要注意的是，在使用 Flink CDC 读取 Oracle 的 DDL 语句时，需要确保 Oracle 数据库开启了 binlog 功能，并且配置了正确的 binlog 参数。同时，还需要在 Flink CDC 中正确配置相关的参数，例如设置要监听的表名、用户名、密码等。

关于本问题的更多回答可点击进行查看：

https://developer.aliyun.com/ask/577382

问题二：Flink CDC在运行过程中会重复，这个是咋回事？

Flink CDC在运行过程中会重复，这个是咋回事？

MySQL的server id ，给的是一个范围

参考答案：

从您提供的日志来看，Flink CDC在运行过程中可能会出现重复读取MySQL Binlog的情况。这是因为Flink CDC使用了MySQL Binlog作为其数据源，而在某些情况下，同一个事件可能会被多次写入到MySQL Binlog中。

当Flink CDC连接到MySQL服务器时，它会开始监听MySQL Binlog中的事件，并将这些事件转换为Flink可用的数据流。在这个过程中，如果同一个事件被多次写入到MySQL Binlog中（例如，因为主从复制或者备份恢复等原因），那么Flink CDC可能会接收到多个相同事件的副本。

为了避免这种重复读取的问题，Flink CDC提供了重试机制。如果在处理某个事件时发生错误，Flink CDC会重新尝试处理该事件，直到成功为止。这样可以保证即使有重复的事件，也能正确地处理它们。

如果您希望避免这种重复读取的问题，可以考虑以下几种方法：

确保MySQL主从复制和备份恢复的配置能够尽量减少重复事件的发生。例如，可以通过调整binlog_format参数来控制MySQL Binlog的格式，以减少重复事件的数量。
使用Flink CDC的重试机制。虽然这可能会增加一些额外的开销，但是它可以保证在处理重复事件时不会丢失任何数据。
对于特定的应用场景，可以考虑使用更高级的解决方案，如基于Kafka或Pulsar等消息队列的CDC服务，这些服务通常具有更好的容错能力和处理重复事件的能力。

关于本问题的更多回答可点击进行查看：

https://developer.aliyun.com/ask/577381

问题三：flink cdc 能从kafka消费数据写到doris吗？

flink cdc 能从kafka消费数据写到doris吗？

参考答案：

可以

关于本问题的更多回答可点击进行查看：

https://developer.aliyun.com/ask/577380

问题四：flinkcdc回撤流如果更新之前的数据会把先前的数据删除，再插入更新的数据？

flinkcdc回撤流如果更新之前的数据会把先前的数据删除，再插入更新的数据？

参考答案：

正常是会直接更新的，你这个不是直接写到数据库吧

关于本问题的更多回答可点击进行查看：

https://developer.aliyun.com/ask/577379

问题五：Flink CDC由于启用了自动提交，因此无法在未提交的情况下执行？

Flink CDC由于启用了自动提交，因此无法在未提交的情况下执行？io.debezium.debezium异常

参考答案：

Flink CDC 是为实现数据库增量数据同步至 Flink 流处理引擎而设计的工具，其基于 Change Data Capture（CDC）技术。在操作过程中，如果遇到 io.debezium.debezium 异常，这可能与Flink CDC的自动提交功能有关。当启用了自动提交，任务会在完成一部分操作后自动提交，如果在未提交时执行某些操作可能会引发异常。对于这种问题，你可以尝试禁用自动提交功能，然后手动控制任务的提交时机。同时，如果发现 Checkpoint 失败，用户还可以通过 Flink Web UI 进行快速定位 Checkpoint 失败的原因，或者查看任务的具体日志进行定位

关于本问题的更多回答可点击进行查看：

https://developer.aliyun.com/ask/577378

实时计算 Flink版产品使用合集之flinkcdc回撤流如果更新之前的数据，会把先前的数据删除，再插入更新的数据吗

问题一：flinkcdc可以读到Oracle的ddl不？

问题二：Flink CDC在运行过程中会重复，这个是咋回事？

问题三：flink cdc 能从kafka消费数据写到doris吗？

问题四：flinkcdc回撤流如果更新之前的数据会把先前的数据删除，再插入更新的数据？

问题五：Flink CDC由于启用了自动提交，因此无法在未提交的情况下执行？