可以将必要的数据在本地物理机上存储一份,以避免频繁地从其他物理机上获取自身计算或其他任务所需要的数据,然后将本地计算的结果再传输到其他机器上供其他机器上的任务使用。
如下图所示,服务器 1 和服务器 2 都将自身计算任务所需要的数据保存到本地服务器上,不需要从其他服务器上获取计算所需要的数据资源,大大节省了服务器与服务器之间通信的带宽和网络传输的数据量。服务器 1 和服务器 2 将计算结果上报给服务器 3,同时服务器 3 将结果存储到本地服务器上,也无须再从服务器 1 和服务器 2 上获取计算任务所需要的数据资源,大大提高了整体系统的数据存储吞吐量和吞吐性能。
以上内容摘自《海量数据处理与大数据技术实战》电子书,点击https://developer.aliyun.com/topic/download?id=8205可下载完整版
版权声明:本文内容由阿里云实名注册用户自发贡献,版权归原作者所有,阿里云开发者社区不拥有其著作权,亦不承担相应法律责任。具体规则请查看《阿里云开发者社区用户服务协议》和《阿里云开发者社区知识产权保护指引》。如果您发现本社区中有涉嫌抄袭的内容,填写侵权投诉表单进行举报,一经查实,本社区将立刻删除涉嫌侵权内容。