Flink CDC中mysql从库重启后，无法从chk启动任务，这个有人碰到过么？

Flink CDC中mysql从库重启后，无法从chk启动任务，这个有人碰到过么illegalstateexception: The connector is trying to read binlog starting at Struct{version=1.6.4.Final,connector=mysql,name=mysql_binlog_source,ts_ms=1683624339743,db=,server_id=0,file=mysql-bin.012070,pos=869539790,row=0}, but this is no longer available on the server. Reconfigure the connector to use a snapshot when needed.

展开

收起

真的很搞笑 2023-05-14 21:03:35 131 版权

阿里云 AI 助理回答

在使用Flink CDC读取MySQL从库的Binlog时，如果从库重启后无法从Checkpoint（chk）启动任务，并报错如下：

IllegalStateException: The connector is trying to read binlog starting at Struct{version=1.6.4.Final,connector=mysql,name=mysql_binlog_source,ts_ms=1683624339743,db=,server_id=0,file=mysql-bin.012070,pos=869539790,row=0}, but this is no longer available on the server. Reconfigure the connector to use a snapshot when needed.

该问题的核心原因是Flink CDC尝试从某个Binlog位点恢复数据消费，但该位点对应的Binlog文件已经被清理或不可用。以下是问题的原因分析和解决方案：

问题原因

Binlog文件被清理
MySQL从库上的Binlog文件可能因为以下原因被清理：
- 从库的Binlog保留时间过短（例如默认只保留10秒到几小时）。
- 主库同步到从库的数据量较大，导致Binlog文件快速滚动并被清理。
- RDS MySQL实例的Binlog清理策略（如最长保留18小时或占用存储空间超过30%时自动清理）。
从库未正确配置Binlog写入
如果从库未启用log-slave-updates参数，主库同步过来的数据不会写入从库的Binlog文件中，导致CDC无法读取变更数据。
Checkpoint保存的位点失效
Flink CDC在Checkpoint中记录了Binlog的消费位点，但如果从库重启后，这些位点对应的Binlog文件已被清理，则无法从该位点恢复。

解决方案

1. 增加从库Binlog的保留时间

确保从库上的Binlog文件不会因过期而被清理。可以通过以下命令调整Binlog的保留时间：

-- 查看当前Binlog保留时间
SHOW VARIABLES LIKE 'expire_logs_days';

-- 设置Binlog保留时间为7天
SET GLOBAL expire_logs_days = 7;

注意：对于阿里云RDS MySQL实例，建议联系技术支持调整Binlog保留策略，避免因存储空间限制导致Binlog被清理。

2. 确保从库正确配置Binlog写入

为了支持Flink CDC监听从库，需要对从库进行以下配置：

-- 启用从库将主库同步的数据写入自身Binlog
SET GLOBAL log_slave_updates = 1;

-- 如果主库启用了GTID模式，从库也需要启用GTID模式
SET GLOBAL gtid_mode = ON;
SET GLOBAL enforce_gtid_consistency = ON;

重要提示：完成上述配置后，需重启从库以使配置生效。

3. 调整Flink作业的启动策略

如果Binlog文件已被清理，无法从Checkpoint恢复，则需要重新配置Flink作业的启动策略：

全新启动（Snapshot模式）
配置scan.startup.mode为initial，让Flink CDC重新执行全量快照读取，然后切换到增量模式读取Binlog。
```
CREATE TABLE mysql_source (...) WITH (
  'connector' = 'mysql-cdc',
  'scan.startup.mode' = 'initial'
);
```
从最新位点启动
如果不需要历史数据，可以配置scan.startup.mode为latest-offset，让Flink CDC从最新的Binlog位点开始读取。
```
CREATE TABLE mysql_source (...) WITH (
  'connector' = 'mysql-cdc',
  'scan.startup.mode' = 'latest-offset'
);
```