E-MapReduce如何判断HDFS属于高可靠性或高可用性受损
按照以下步骤进行排查,以下任意一项有异常,则判定为HDFS高可靠性、高可用性受损,非紧急,可根据业务反馈情况评估影响范围大小。
首先判断ZKFC、JN、DN进程是否正常,通过控制台查看状态是否正常,也可进一步通过后台命令:ps -ef|grep -i 'pid'查看进程是否存在,以及是否最近有重启;
去到对应进程的运行日志目录下查看日志是否正常在更新,cd /var/log/hadoop-hdfs ls -rlt查看运行日志最后更新时间是否在刷新;
进一步分析按照以下步骤进行:
检查所在的ecs主该进程所在主机是否正常:嫦娥平台健康检查+管控界面是否有异常事件(如oom)+常用命令诊断(df -h、df -i、free -g、top);
查看对应进程的运行日志,过滤error或者fatal等信息,根据报错信息再做进一步分析。
确认zk服务是否正常,同样是查看进程,查看日志,以及zk登入测试。
版权声明:本文内容由阿里云实名注册用户自发贡献,版权归原作者所有,阿里云开发者社区不拥有其著作权,亦不承担相应法律责任。具体规则请查看《阿里云开发者社区用户服务协议》和《阿里云开发者社区知识产权保护指引》。如果您发现本社区中有涉嫌抄袭的内容,填写侵权投诉表单进行举报,一经查实,本社区将立刻删除涉嫌侵权内容。