存储在HDFS上面的文件实际上是由若干个数据块(Block,大小默认为128MB)组成,每一个Block会设定一个副本数N,表示这个Block在写入的时候会写入N个数据节点,以达到数据备份的目的。读取的时候只需要依次读取组成这个文件的Block即可完整读取整个文件,注意读取时只需选择N个副本中的任何一个副本进行读取即可。
资料来源:《HBase原理与实践》,文章链接:https://developer.aliyun.com/article/724670
版权声明:本文内容由阿里云实名注册用户自发贡献,版权归原作者所有,阿里云开发者社区不拥有其著作权,亦不承担相应法律责任。具体规则请查看《阿里云开发者社区用户服务协议》和《阿里云开发者社区知识产权保护指引》。如果您发现本社区中有涉嫌抄袭的内容,填写侵权投诉表单进行举报,一经查实,本社区将立刻删除涉嫌侵权内容。