请教大家: flink1.9.1任务已经fail掉了,但在yarn上这个application还是在running,且yarn上分配的资源变成了1,程序中用的是固定延迟重启策略,请问有人知道任务挂掉但yarn上一直在running是什么原因么? http://apache-flink.147419.n8.nabble.com/file/t802/Inked%E6%8D%95%E8%8E%B711_LI.jpg http://apache-flink.147419.n8.nabble.com/file/t802/%E6%8D%95%E8%8E%B7.png*来自志愿者整理的flink邮件归档
版权声明:本文内容由阿里云实名注册用户自发贡献,版权归原作者所有,阿里云开发者社区不拥有其著作权,亦不承担相应法律责任。具体规则请查看《阿里云开发者社区用户服务协议》和《阿里云开发者社区知识产权保护指引》。如果您发现本社区中有涉嫌抄袭的内容,填写侵权投诉表单进行举报,一经查实,本社区将立刻删除涉嫌侵权内容。
问题描述: 用户遇到的问题是Flink 1.9.1版本的任务虽然已经失败,但在YARN上显示的状态依然是Running。此外,任务使用了固定延迟重启策略,并且在任务失败后,YARN上分配给该任务的资源降为1。
原因分析:
解决方案与建议:
注意事项:
综上所述,任务挂掉但YARN上显示Running状态主要与Flink的重启策略及YARN资源管理机制有关。通过细致排查和适当调整,可以有效解决此类问题并提升系统的健壮性。您可以复制页面截图提供更多信息,我可以进一步帮您分析问题原因。