flink的taskmanager被系统杀掉的情况大家有碰到过吗?
我配置了40G的内存
taskmanager.memory.process.size: 40g
结果他跟系统申请了54G的内存,结果被系统杀掉了
[10573691.500740] Out of memory: Kill process 31746 (java) score 746 or sacrifice child
[10573691.502711] Killed process 31746 (java), UID 0, total-vm:54752988kB, anon-rss:49306888kB, file-rss:0kB, shmem-rss:0kB
很奇怪啊?版本是1.15.4
Flink 的 taskmanager 可能被系统杀掉有以下几个原因:
系统资源不足,比如内存不足、CPU 负载过高。
系统出现问题,比如系统崩溃。
用户手动杀掉 taskmanager。
如果 taskmanager 被系统杀掉,会导致 Flink 作业失败。
要解决这个问题,可以根据具体情况采取以下措施:
提高系统资源,比如增加内存、减少其他进程的负载。
修复系统问题。
避免手动杀掉 taskmanager。
如果无法解决这个问题,可以考虑使用 Flink 的容错机制,比如容错重启、容错 checkpoint。
版权声明:本文内容由阿里云实名注册用户自发贡献,版权归原作者所有,阿里云开发者社区不拥有其著作权,亦不承担相应法律责任。具体规则请查看《阿里云开发者社区用户服务协议》和《阿里云开发者社区知识产权保护指引》。如果您发现本社区中有涉嫌抄袭的内容,填写侵权投诉表单进行举报,一经查实,本社区将立刻删除涉嫌侵权内容。
实时计算Flink版是阿里云提供的全托管Serverless Flink云服务,基于 Apache Flink 构建的企业级、高性能实时大数据处理系统。提供全托管版 Flink 集群和引擎,提高作业开发运维效率。