为啥flink cdc 读出来的是这样的？

展开

收起

小小鹿鹿鹿 2024-02-06 20:42:27 99 版权

阿里云 AI 助理回答

Flink CDC 读取数据时，可能会出现一些不符合预期的结果，这通常与配置、数据库特性或Flink CDC的工作机制有关。以下是可能导致这种情况的原因及解决方案：

1. 时间字段的时区问题

如果读取的 timestamp 字段存在时区偏差（例如相差8小时），可能是因为CDC作业中配置的 server-time-zone 参数与MySQL服务器的时区不一致。

解决方案：

确保在Flink CDC配置中正确设置 server-time-zone 参数，使其与MySQL服务器的时区一致。
示例配置：
```
'server-time-zone' = 'Asia/Shanghai'
```

2. Binlog记录的全实例级别变更

即使Flink CDC只关注某一张表，MySQL的Binlog仍然会记录整个实例的所有表的变更。这种机制可能导致读取的数据量超出预期。

解决方案：

使用Source复用功能，避免重复读取Binlog数据，从而减少带宽消耗。

配置示例：

'scan.incremental.snapshot.enabled' = 'true'

3. 正则表达式解析问题

如果使用了 table-name 的正则表达式来匹配表名，但正则表达式中包含逗号（,），会导致解析失败。这是因为Debezium使用逗号作为分隔符，不支持带逗号的正则表达式。

解决方案：

使用括号将多个正则表达式组合起来，避免直接使用逗号。

示例配置：

'table-name' = '(t_process_wi_history_\d{1}|t_process_wi_history_\d{2})'

4. 全量与增量切换阶段的问题

在从全量读取切换到增量读取时，如果全量阶段耗时过长，可能导致最后一个分片数据量过大，出现OOM（内存溢出）问题。此外，如果Checkpoint间隔时间设置过大，也可能导致增量读取延迟。

解决方案：

增加MySQL Source端的并发度，加快全量读取速度。
根据业务需求合理设置Checkpoint间隔时间。

示例配置：

'parallelism' = 4
'checkpoint.interval' = '5min'

5. DDL事件未被捕获

如果需要捕获数据库中的DDL事件（如表结构变更），但Flink CDC默认不会处理这些事件。

解决方案：

在DataStream API中使用 MySqlSource，并启用 includeSchemaChanges 参数。

示例代码：

MySqlSource<String> mySqlSource = MySqlSource.<String>builder()
  .includeSchemaChanges(true)
  .build();

6. 分库分表读取问题

如果目标数据库是分库分表结构，但Flink CDC未正确读取所有分表数据，可能是因为 table-name 配置未正确匹配所有表。

解决方案：

使用正则表达式匹配所有分表。例如，监控所有以 user_ 为前缀的表：
```
'table-name' = 'user_.*'
```

7. 重复数据投递问题

在非正常情况下（如故障发生时），Flink CDC可能会接收到重复的变更事件，导致下游处理结果异常。

解决方案：

启用去重功能，并在源表上定义主键。

示例配置：

'table.exec.source.cdc-events-duplicate' = 'true'

8. MongoDB CDC的特殊行为

如果使用的是MongoDB CDC源表，可能会遇到以下情况： - 全量与增量切换：MongoDB CDC会先读取全量数据，然后平滑切换到增量读取（oplog）。如果发生故障，能够保证Exactly Once语义。 - 启动模式：支持多种启动模式（如 initial、latest-offset 和 timestamp），可以根据需求选择合适的模式。

解决方案：

根据业务需求选择合适的启动模式。例如，跳过快照阶段，从指定时间戳开始读取：
```
'scan.startup.mode' = 'timestamp'
'scan.startup.timestamp-millis' = '1698768000000'
```

9. 其他潜在问题

数据库压力过大：多个CDC作业可能导致数据库压力过高。可以通过将表同步到Kafka消息队列中，再消费Kafka数据进行解耦。
无法下载依赖包：如果无法下载 flink-sql-connector-mysql-cdc-2.2-SNAPSHOT.jar，建议使用稳定版本（如 2.1.0）。