分布式集群通常包含非常多的机器,收到机架槽位和交换机网口的限制,通常大型分布式集群会跨好几个机架 机架内机器之间的网络速度通常会高于跨机架机器之间的网络速度 机架之间机器的网络通信通常受到上层交换机间网络带宽的限制 文件块的放置 假设一个Block有3份备份 一份放在NameNode指定的DataNode上,一份放在与指定DataNode不在同一台机器上的DataNode上,最后一份放在与指定DataNode同一机架的DataNode上 备份的目的是为了数据安全,采用这种配置方式主要是考虑同一机架内机器宕机的情况,以及不同机架之间进行数据复制会带来的性能降低问题
版权声明:本文内容由阿里云实名注册用户自发贡献,版权归原作者所有,阿里云开发者社区不拥有其著作权,亦不承担相应法律责任。具体规则请查看《阿里云开发者社区用户服务协议》和《阿里云开发者社区知识产权保护指引》。如果您发现本社区中有涉嫌抄袭的内容,填写侵权投诉表单进行举报,一经查实,本社区将立刻删除涉嫌侵权内容。