在ECS上上部署SPARK,使用内网IP测试没问题,换成外网后在:
Re-format filesystem in Storage Directory /root/soft/apache/hadoop/hadoop-2.7.7/tmp/dfs/name ? (Y or N) Y
18/12/15 17:03:09 INFO client.QuorumJournalManager: Waited 18001 ms (timeout=60000 ms) for a response for hasSomeData. No responses yet.
18/12/15 17:03:10 INFO client.QuorumJournalManager: Waited 19002 ms (timeout=60000 ms) for a response for hasSomeData. No responses yet.
出错,应该是权限问题,但不知道怎么解决,求大神提示!!
版权声明:本文内容由阿里云实名注册用户自发贡献,版权归原作者所有,阿里云开发者社区不拥有其著作权,亦不承担相应法律责任。具体规则请查看《阿里云开发者社区用户服务协议》和《阿里云开发者社区知识产权保护指引》。如果您发现本社区中有涉嫌抄袭的内容,填写侵权投诉表单进行举报,一经查实,本社区将立刻删除涉嫌侵权内容。
根据您提供的错误信息,问题似乎与Hadoop的NameNode启动失败有关,特别是在尝试使用外网IP时。错误提示显示在等待QuorumJournalManager响应时超时,这可能涉及到网络配置或权限设置不正确。尽管您的参考资料主要聚焦于如何使用eRDMA优化Spark集群性能,但我们可以从中借鉴一些通用的故障排查思路来解决您的问题。以下是一些建议步骤:
检查网络配置:
DNS解析与主机名验证:
/etc/hosts
文件中。Hadoop安全与权限:
/root/soft/apache/hadoop/hadoop-2.7.7/tmp/dfs/name
),确保Hadoop用户有读写权限。Hadoop配置调整:
dfs.namenode.journalnode.rpc-address.timeout.ms
的值,以给予更长的响应等待时间。日志深入分析:
重启服务与测试:
hadoop dfsadmin -report
命令检查HDFS状态,确认所有DataNode是否正常连接到NameNode。如果以上步骤不能解决问题,建议进一步检查网络拓扑、安全组规则以及任何可能影响网络通信的系统级配置。由于具体环境和配置细节未知,可能需要根据实际情况灵活调整解决方案。