请教个问题,在debezium自定义转换器中怎么判断当前数据是全量还是增量呢?

请教个问题,在debezium自定义转换器中怎么判断当前数据是全量还是增量呢?

展开
收起
十一0204 2023-04-10 21:38:36 370 分享 版权
2 条回答
写回答
取消 提交回答
  • 意中人就是我呀!

    可以这样理解,有数据时间戳的都是增量 此答案整理自钉群“Flink CDC 社区”

    2023-04-12 08:46:55
    赞同 展开评论
  • 坚持这件事孤独又漫长。
    • 可以通过检查SourceRecord中的操作类型进行判断。操作类型有CREATE、UPDATE和DELETE三种。CREATE表示新增数据的全量,UPDATE表示修改数据的增量,DELETE表示删除数据的增量。因此,如果操作类型为CREATE,则当前数据为全量;如果操作类型为UPDATE或DELETE,则当前数据为增量。可以通过以下代码示例实现:
    public class CustomDebeziumConverter implements DebeziumDeserializationSchema<Map<String, String>> {
        @Override
        public void open(DeserializationContext deserializationContext) throws Exception {
            // ...
        }
    
        @Override
        public Map<String, String> deserialize(SourceRecord sourceRecord) throws Exception {
            String operation = (String) sourceRecord.value().get("op");
            if ("c".equals(operation)) {
                // 新增数据的全量
                // ...
            } else if ("u".equals(operation)) {
                // 修改数据的增量
                // ...
            } else if ("d".equals(operation)) {
                // 删除数据的增量
                // ...
            }
        }
    
        @Override
        public TypeInformation<Map<String, String>> getProducedType() {
            // ...
        }
    }
    
    2023-04-11 08:54:30
    赞同 展开评论

实时计算Flink版是阿里云提供的全托管Serverless Flink云服务,基于 Apache Flink 构建的企业级、高性能实时大数据处理系统。提供全托管版 Flink 集群和引擎,提高作业开发运维效率。

收录在圈子:
实时计算 Flink 版(Alibaba Cloud Realtime Compute for Apache Flink,Powered by Ververica)是阿里云基于 Apache Flink 构建的企业级、高性能实时大数据处理系统,由 Apache Flink 创始团队官方出品,拥有全球统一商业化品牌,完全兼容开源 Flink API,提供丰富的企业级增值功能。
还有其他疑问?
咨询AI助理