从分布式系统中读取数据时,可以并行地从多台服务器上读取数据,同时利用 多台服务器的性能和带宽来传输数据。
如下图所示,原本一份完整的数据存储到服务器 A 和服务器 B 上,然后被切分为数据块1、数据块 2、数据块 3 和数据块 4,数据块 1 和 2 存储在服务器 A 上,数据块 3 和 4 存储在服务器 B 上。此时,服务器 C 需要读取数据,可以利用并行技术同时从服务器 A 和服务器 B 上读取相应的数据块到服务器 C,然后在服务器 C 上组合成完整的数据,比只从单一服务器上读取完整数据的效率和性能要高很多。
以上内容摘自《海量数据处理与大数据技术实战》电子书,点击https://developer.aliyun.com/topic/download?id=8205可下载完整版
版权声明:本文内容由阿里云实名注册用户自发贡献,版权归原作者所有,阿里云开发者社区不拥有其著作权,亦不承担相应法律责任。具体规则请查看《阿里云开发者社区用户服务协议》和《阿里云开发者社区知识产权保护指引》。如果您发现本社区中有涉嫌抄袭的内容,填写侵权投诉表单进行举报,一经查实,本社区将立刻删除涉嫌侵权内容。