Flink CDC中就是起了一个flink job吗？

展开

收起

十一0204 2023-07-26 08:07:01 120 版权

3 条回答

写回答

取消提交回答

Star时光

是的，Flink CDC 是在 Flink 上运行的一个作业（job）。它利用 Flink 的流式处理能力来实时捕获和解析变化数据，并将其转发到目标系统，如消息队列（如 Kafka）或其他外部存储。

Flink CDC 通过读取数据库的变化日志（如 Oracle 的 Redo Log 或 MySQL 的 Binlog）来实现增量数据抓取。它会将变化数据解析为类似流的形式，并应用相应的转换操作，然后将结果发送到指定的输出源。

作为一个 Flink 作业，您可以使用 Flink 提供的命令行工具、REST API 或 Flink SQL 来提交和管理 Flink CDC 作业。您可以指定所需的配置参数，如数据库连接信息、表配置、CDC 插件版本等。

Flink CDC 还提供了一些特定的功能，如事务保证、状态管理、容错等，以确保准确和可靠的数据传输和处理。

总之，Flink CDC 是基于 Flink 框架构建的用于捕获和处理数据库变化数据的作业。通过使用 Flink 的分布式计算能力，它能够处理大规模的数据和实时的数据流。

2023-07-31 23:11:02

赞同展开评论
算精通

北京阿里云ACE会长

是的，Flink CDC 是一个基于 Flink 的数据同步工具，它通过启动一个 Flink Job 来实现数据的实时同步。具体来说，Flink CDC 在 Flink 的分布式计算框架上构建了一个数据同步任务，该任务包含一个或多个 Flink DataStream，用于实时读取、转换和写入数据。
在启动 Flink CDC 任务时，需要指定数据源、目标源、数据同步方式等相关参数，然后通过 Flink 的客户端程序提交任务到 Flink 集群中运行。一旦任务被提交并启动运行，Flink CDC 就会开始实时同步数据，直到任务被手动停止或出现错误。
需要注意的是，Flink CDC 的数据同步任务是基于 Flink 的分布式计算框架构建的，因此需要在运行 Flink CDC 任务时，保证 Flink 集群的可

2023-07-29 16:36:07

赞同展开评论
意中人jswy

意中人就是我呀！

没出现过丢数据，如果有，我们会排查，是不是有什么问题，如果不是flink-cdc本身的问题，查不出来，那么我们会手动补一份。起一个cdc任务，再补一下，设置不同的server-id，等指标currentEmitEventTimeLag有数据再停止即可。此回答整理至钉群“Flink CDC 社区”。

2023-07-26 12:04:02

赞同展开评论

Flink CDC中就是起了一个flink job吗？

实时计算 Flink

相关文章

热门讨论

热门文章