(1)计算和通信的重叠。传统的计算和通信是串行的,即先做完梯度计算、再做 梯度通信,我们的第一个优化工作是将计算和通信重叠起来,尽量减少通信的开销。 (2)去中心化梯度协商。传统分布式梯度协商方式是根节点和所有节点都协商, 因此根节点的负担会随着节点数增加而大幅升高。而我们采取的去中心化的梯度协商 方式,将大规模下梯度协商的复杂度降低了一个数量级。 (3)梯度压缩。将要传输的梯度从 FP32 压缩到 FP16,并建立了相应的数据缩放 机制,从而防止精度损失。 (4)分级通信优化。传统的环形通信方式是将所有节点上的 GPU 形成一个大环, 致使其整体性能在以太网的通信上受到限制。我们做了分级通信的优化,首先在节点 内部的 GPU 上做一级规约通信,每个节点都规约到一块 GPU 上,然后每个节点的这个 GPU 再做二级规约通信。这样一方面减少了以太网上传输的数据量,另一方面通过流水 线将节点内部的规约通信和节点之间的规约通信重叠起来,减少了整体通信时间。
《弹性计算:无处不在的算力》电子书可以通过以下链接下载:https://developer.aliyun.com/topic/download?id=7996"
版权声明:本文内容由阿里云实名注册用户自发贡献,版权归原作者所有,阿里云开发者社区不拥有其著作权,亦不承担相应法律责任。具体规则请查看《阿里云开发者社区用户服务协议》和《阿里云开发者社区知识产权保护指引》。如果您发现本社区中有涉嫌抄袭的内容,填写侵权投诉表单进行举报,一经查实,本社区将立刻删除涉嫌侵权内容。