开发者社区 问答 正文

E-MapReduce如何判断HDFS属于高可靠性或高可用性受损

已解决

E-MapReduce如何判断HDFS属于高可靠性或高可用性受损

展开
收起
阿里云服务支持 2022-12-13 15:43:22 307 分享 版权
1 条回答
写回答
取消 提交回答
  • 官方回答

    按照以下步骤进行排查,以下任意一项有异常,则判定为HDFS高可靠性、高可用性受损,非紧急,可根据业务反馈情况评估影响范围大小。

    1. 首先判断ZKFC、JN、DN进程是否正常,通过控制台查看状态是否正常,也可进一步通过后台命令:ps -ef|grep -i 'pid'查看进程是否存在,以及是否最近有重启;

    2. 去到对应进程的运行日志目录下查看日志是否正常在更新,cd /var/log/hadoop-hdfs ls -rlt查看运行日志最后更新时间是否在刷新;

    进一步分析按照以下步骤进行:

    1. 检查所在的ecs主该进程所在主机是否正常:嫦娥平台健康检查+管控界面是否有异常事件(如oom)+常用命令诊断(df -h、df -i、free -g、top);

    2. 查看对应进程的运行日志,过滤error或者fatal等信息,根据报错信息再做进一步分析。

    3. 确认zk服务是否正常,同样是查看进程,查看日志,以及zk登入测试。

    2022-12-13 15:44:45
    赞同 展开评论