实时计算 Flink版操作报错之从specified offset启动没有问题，但是停机后从savepoint恢复则报错binlog被purge（实际文件还在），如何处理-阿里云开发者社区

实时计算 Flink版操作报错之从specified offset启动没有问题，但是停机后从savepoint恢复则报错binlog被purge（实际文件还在），如何处理

2024-05-23 529

版权

本文内容由阿里云实名注册用户自发贡献，版权归原作者所有，阿里云开发者社区不拥有其著作权，亦不承担相应法律责任。具体规则请查看《阿里云开发者社区用户服务协议》和《阿里云开发者社区知识产权保护指引》。如果您发现本社区中有涉嫌抄袭的内容，填写侵权投诉表单进行举报，一经查实，本社区将立刻删除涉嫌侵权内容。

简介： 在使用实时计算Flink版过程中，可能会遇到各种错误，了解这些错误的原因及解决方法对于高效排错至关重要。针对具体问题，查看Flink的日志是关键，它们通常会提供更详细的错误信息和堆栈跟踪，有助于定位问题。此外，Flink社区文档和官方论坛也是寻求帮助的好去处。以下是一些常见的操作报错及其可能的原因与解决策略。

问题一：flink cdc (2.4.1) 重启的时候作为参数传给flink cdc吗？

flink cdc (2.4.1) 从specified offset启动没有问题，但是停机后从savepoint恢复则报错binlog被purge（实际文件还在）。是需要停机前手工记录gtid，重启的时候作为参数传给flink cdc吗？

参考回答：

Flink CDC在从MySQL读取binlog时，依赖于binlog的持久化以保证故障恢复后能够继续正确地从上次中断的地方开始处理变更数据。如果在停机后从savepoint恢复时遇到binlog被purged的错误，但实际上文件还在，这通常意味着MySQL已经清理了binlog历史记录，而这些记录是Flink CDC任务所需要的。

MySQL通过参数配置binlog的保留策略，例如expire_logs_days或binlog_expire_logs_seconds等，当达到设定的时间阈值后，MySQL会自动删除旧的binlog文件，即使文件物理上可能仍存在于磁盘上，但在数据库内部已不可见。

在使用Flink CDC进行故障恢复时，确实需要确保相关的binlog文件在任务重启时仍然可用。由于Flink CDC通常会保存GTID（全局事务标识符）或其他形式的位置信息到savepoint中以便恢复，因此不需要手动记录GTID并在重启时传给Flink CDC。

但是，如果因为MySQL的binlog清理策略导致必要的binlog文件不再可访问，那么即便GTID或其他位置信息还在savepoint中，也无法正常恢复。

为了解决这个问题，可以考虑调整MySQL的binlog保留策略，确保在Flink CDC任务可能需要恢复的时间窗口内不会自动清理binlog文件。另外，在计划维护或升级之前，也可以考虑暂停binlog清理，并确保所有的CDC任务都已成功checkpoint或者savepoint，然后再进行下一步操作。

如果确实遇到了因为binlog清理而导致无法恢复的情况，且物理binlog文件还存在，理论上可以通过手动方式将这些文件重新加入到MySQL的binlog列表中并设置正确的GTID范围，但这需要对MySQL有深入理解且操作较为复杂，一般不建议这样做。

关于本问题的更多回答可点击原文查看：

https://developer.aliyun.com/ask/584448

问题二：flink cdc 版本2.3.0flink 1.16.1数据库中有这个表，这个问题有人遇到过嘛？

flink cdc 版本2.3.0

flink 1.16.1

数据库中有这个表，但是被过滤掉了看日志

'alliance_sit_db.crowd_config' is filtered out of capturing

Can't find any matched tables, please check your configured database-name: [alliance_sit_db] and table-name: [crowd_config]

这个问题有人遇到过嘛？

参考回答：

参考解决方案地址：https://help.aliyun.com/zh/flink/support/faq-about-cdc?spm=a2c4g.11186623.0.i24#section-2xe-ipt-694

报错原因

1.配置的表名无法在数据库中找到时，出现该报错。

2.Flink作业里包含不同数据库的表，当使用的账号没有其中某些数据库权限时，出现该报错。

解决方案

1.检查对应表名是否在数据库中存在。

2.为账号添加作业中所有数据库的对应权限。

关于本问题的更多回答可点击原文查看：

https://developer.aliyun.com/ask/584444

问题三：Flink CDC图中这个流程，建表会报错有没什么参数配置可以解决？

Flink CDC图中这个流程，如果mysql有个主键是BIGINT UNSIGNED，就会报错。这个类型会被转化成decimal，然后starrocks主键不支持这个类型所以建表会报错有没什么参数配置可以解决？

参考回答：

试下加上 debezium.bigint.unsigned.handling.mode : long 这个配置

关于本问题的更多回答可点击原文查看：

https://developer.aliyun.com/ask/584443

问题四：Flink CDC中oracle 出现这个问题，怎么解决？

Flink CDC中oracle 出现这个问题，怎么解决？mysql是正常的，flink版本从1.18到1.15都不行，mysql使用flink1.16可以正常，使用flink1.18也会有这个错误

参考回答：

这个报错提示是因为缺少flink client的jar,一般在项目中添加上相应版本的jar即可解决。

可以添加依赖：

关于本问题的更多回答可点击原文查看：

https://developer.aliyun.com/ask/584438

问题五：Flink CDC多次执行sql查询报错怎么办？

Flink CDC多次执行sql查询报错怎么办？Caused by: org.apache.flink.util.FlinkRuntimeException: Cannot have more than one execute() or executeAsync() call in a single environment.

参考回答：

flink在本地运行没问题，但是通过flink页面提交任务就会Cannot have more than one execute() or executeAsync() call in a single environment

原因：

flink内部默认会使用全局任务链，每次提交任务，如果存在该任务就会获取到同一个任务执行器，这样就会出现同一个任务多个地方执行execute(),就会报上面这个错。

解决方案：

在执行execute()之前加上这一行代码
希望能够帮助你

关于本问题的更多回答可点击原文查看：

https://developer.aliyun.com/ask/584437

实时计算 Flink版操作报错之从specified offset启动没有问题，但是停机后从savepoint恢复则报错binlog被purge（实际文件还在），如何处理

问题一：flink cdc (2.4.1) 重启的时候作为参数传给flink cdc吗？

问题二：flink cdc 版本2.3.0flink 1.16.1数据库中有这个表，这个问题有人遇到过嘛？

问题三：Flink CDC图中这个流程，建表会报错有没什么参数配置可以解决？

问题四：Flink CDC中oracle 出现这个问题，怎么解决？

问题五：Flink CDC多次执行sql查询报错怎么办？

实时计算 Flink

热门文章

最新文章

相关产品

相关课程

相关电子书

相关实验场景