Flink CDC中oracle-cdc 通过接口调用保存 savepoint 老是报错,checkpoint 是正常的,
,这个是什么问题了,异常信息看不出具体的报错原因
,是 oracle 版本的问题么?oracle 19c?
版权声明:本文内容由阿里云实名注册用户自发贡献,版权归原作者所有,阿里云开发者社区不拥有其著作权,亦不承担相应法律责任。具体规则请查看《阿里云开发者社区用户服务协议》和《阿里云开发者社区知识产权保护指引》。如果您发现本社区中有涉嫌抄袭的内容,填写侵权投诉表单进行举报,一经查实,本社区将立刻删除涉嫌侵权内容。
在Flink CDC中使用oracle-cdc
连接器时,通过接口调用保存savepoint失败,而checkpoint正常运行,这种情况可能涉及多个潜在问题。以下是详细分析和解决方案:
Savepoint和Checkpoint虽然都用于保存作业状态,但它们的实现机制有所不同: - Checkpoint:主要用于容错,由Flink自动触发,通常依赖于增量快照机制。 - Savepoint:用户手动触发,用于长期保存作业状态,支持作业的迁移或版本升级。
由于Savepoint需要更完整的状态信息,因此对系统的要求更高,可能会暴露一些Checkpoint未触发的问题。
You are using the new V4 state engine to restore old state data from a checkpoint
的报错。DEBUG
,以获取更详细的日志信息。execution.checkpointing.tolerable-failed-checkpoints
参数值,允许更多的Checkpoint失败重试。restart-strategy
为fixed-delay
,并增加restart-strategy.fixed-delay.attempts
的值,以提高作业的容错能力。You are using the new V4 state engine to restore old state data from a checkpoint
的报错。DEBUG
,以捕获更详细的异常信息。具体操作如下:
log.level: DEBUG
如果上述方法仍无法解决问题,建议按照以下步骤进一步排查: 1. 复现问题:尝试在测试环境中复现问题,观察是否与生产环境一致。 2. 收集日志:收集Flink作业的日志、Oracle数据库的日志以及Flink CDC连接器的日志。 3. 联系技术支持:将日志和配置信息提供给阿里云技术支持团队,以便进一步分析。
Savepoint失败的原因可能涉及Oracle CDC连接器的兼容性、状态一致性问题或GeminiStateBackend的版本差异。建议从连接器配置、Savepoint触发策略和日志分析入手,逐步排查问题。如果问题仍未解决,请联系技术支持团队获取进一步帮助。您可以复制页面截图提供更多信息,我可以进一步帮您分析问题原因。
实时计算Flink版是阿里云提供的全托管Serverless Flink云服务,基于 Apache Flink 构建的企业级、高性能实时大数据处理系统。提供全托管版 Flink 集群和引擎,提高作业开发运维效率。