开发者社区> 问答> 正文

JobManager responsible for xxx lost the leadersh

JobManager responsible for ff2118284beed21ac220ee7cc0a639c0 lost the

leadership.

这种错误原因是什么,会导致任务重启,本身压力大,突然重启使用10分钟前的ckpt,压力更大了。*来自志愿者整理的flink邮件归档

展开
收起
小阿怪 2021-12-07 11:08:58 1277 0
1 条回答
写回答
取消 提交回答
  • 你是 on-yarn 的模式吗? JobManager 并不是 worker,只是控制 Checkpoint ,接收 TM 的心跳等,可以看下在这个之前的其它日志。 还可以看下 ZK 是否正常等。 On-yarn 的话,也可以看下 NM 对这个AM处理 的日志。*来自志愿者整理的flink邮件归档

    2021-12-07 12:09:44
    赞同 展开评论 打赏
问答地址:
问答排行榜
最热
最新

相关电子书

更多
Sparklint a Tool for Identifying and Tuning Inefficient Spark Jobs Across Your Cluster 立即下载
ALLUXIO (FORMERLY TACHYON): UNIFY DATA AT MEMORY SPEED - EFFECTIVE USING SPARK WITH ALLUXIO 立即下载
Borgaonkar-New-Adventures-In-Spying-3G-And-4G-Users-Locate-Track-And-Monitor 立即下载