大佬，Flink CDC 中你下游怎么解决的呢。可以指教一下不，往kafka发？kafka来回拨位点

大佬，Flink CDC 中你下游怎么解决的呢。可以指教一下不，往kafka发？kafka来回拨位点？

展开

收起

真的很搞笑 2023-07-02 17:19:38 187 版权

3 条回答

写回答

取消提交回答

Star时光

在 Flink CDC 中使用 Kafka 作为下游时，可以考虑以下两种解决方案：

1. 使用自定义反序列化器：您可以在 Flink CDC 中使用自定义的反序列化器，将数据从 CDC 格式转换成正确的格式，然后将转换后的数据写入 Kafka。在 Kafka 中，您可以使用 Kafka Connect 的 Avro Converter 或者 JSON Converter 来对数据进行反序列化，以保证数据的正确性。

2. 使用 Kafka 的位点：在 Flink CDC 中，您可以使用 Flink Kafka Consumer 将 CDC 数据流直接写入 Kafka。在写入 Kafka 时，可以记录 Kafka Consumer 的位点（offset），即当前消费到的位置。下次启动 Flink CDC 时，可以设置 Kafka Consumer 的起始位点为上次记录的位点，以确保不会重复消费已经处理过的数据。

需要注意的是，如果选择使用 Kafka Consumer 的位点来进行数据消费和回放，确保 Kafka 中的数据能够长期保存，以便 Flink CDC 可以从指定位点开始重新消费数据。如果 Kafka 中的数据已被删除，将无法使用该方式进行回放。

2023-07-30 11:02:28

赞同展开评论
算精通

北京阿里云ACE会长

针对您提到的 Oracle CDC Connector 将 Number 类型的 0 值转换成科学计数法表示，并使用 String 类型进行存储所导致的问题，如果您使用 Kafka 作为 Flink CDC 的下游，可以考虑以下两种解决方案：
使用自定义反序列化器
在 Flink CDC 中，可以使用自定义反序列化器，将科学计数法表示的数值转换成正确的 Number 类型，并将 JSON 转换成 Flink 的 Row 类型，然后将 Row 类型的数据写入 Kafka。在 Kafka 中，您可以使用 Kafka Connect 的 Avro Converter 或者 JSON Converter 来对数据进行反序列化，以保证数据的正确性。
使用 Kafka 的位点
在 Flink CDC 中，可以使用 Flink Kafka Consumer，将 CDC 数据流直接写入 Kafka。在写入 Kafka 时，可以使用 Kafka Consumer 的位点，在数据写入 Kafka 后将位点记录下来。在下次启动 Flink CDC 时，可以设置 Kafka Consumer 的起始位点为上次写入的位点，以确保不会重复消费数据。
需要注意的是，使用 Kafka Consumer 的位点需要确保 Kafka 中的数据能够长期存储。如果 Kafka 中的数据已经被删除，将无法使用

2023-07-30 10:11:17

赞同展开评论
芯在这

datastream 里面有个时间在kafka消费的时候进行比对，此回答整理自钉群“Flink CDC 社区”

2023-07-02 17:31:07

赞同展开评论

大佬，Flink CDC 中你下游怎么解决的呢。可以指教一下不，往kafka发？kafka来回拨位点

实时计算 Flink

相关文章

热门讨论

热门文章