转自钉钉群21789141:请问下各位大佬,在Flink里面频繁出现Checkpoint expired before completing的错误,状态本身并不大,看了一下Checkpoint确认的进度56/64 (88%),还有几个不知道什么原因迟迟收不到Acknowledge。请问下出现这种现象是什么原因?
通问,同一个流程,逻辑稍微有所不同,一个可以写,另外一个写到96%之后就收不到Acknowledge了,然后就超时了,被这个问题困扰很久了。有时候又可以写成功。
出现这个问题从两方面考虑:
1.checkpoint设置的时间过短(包括完成checkpoint的超时时间)
env.enableCheckpointing(5000) 这里的5秒生产肯定是不够的
env.getCheckpointConfig.setCheckpointTimeout(60000)
2.得从你代码逻辑着手,是不是代码中有出现checkpoint无法完成的逻辑。
强思:缺省cp timeout为10分钟: DEFAULT_TIMEOUT = 10 60 1000;
可以通过 env.getCheckpointConfig().setCheckpointTimeout(900000); 进行设置
是否用户自己设置太短了,如果10分钟都不能完成checkpoint,需要检查为什么这么慢。
版权声明:本文内容由阿里云实名注册用户自发贡献,版权归原作者所有,阿里云开发者社区不拥有其著作权,亦不承担相应法律责任。具体规则请查看《阿里云开发者社区用户服务协议》和《阿里云开发者社区知识产权保护指引》。如果您发现本社区中有涉嫌抄袭的内容,填写侵权投诉表单进行举报,一经查实,本社区将立刻删除涉嫌侵权内容。