我在更换jdk版本的时候忘记暂停当前进程导致进程java进程一时匹配强制发生错误退出导致。
但是我重启整个集群之后,使用ps -ef|grep pid 检查进程其实是存在的。
就就是一种进程假死情况,网上一般都是进hsperfdata_然后删了对应进程文件,其实删了以后再开集群又会遇到这个情况,这和jps服务有关,它会默认去tmp本地查找以往对应进程。
其实rm -rf /tmp/hsperfdata_*治标不治本,如果是假死状态其实不用管也行,只是jps查找不到。
使用
sudo -u hdfs jps
能查看到进程。