【Hello AI】安装并使用Deepnccl-多GPU互联的AI通信加速库-阿里云开发者社区

【Hello AI】安装并使用Deepnccl-多GPU互联的AI通信加速库

2024-01-26 62539

版权

本文内容由阿里云实名注册用户自发贡献，版权归原作者所有，阿里云开发者社区不拥有其著作权，亦不承担相应法律责任。具体规则请查看《阿里云开发者社区用户服务协议》和《阿里云开发者社区知识产权保护指引》。如果您发现本社区中有涉嫌抄袭的内容，填写侵权投诉表单进行举报，一经查实，本社区将立刻删除涉嫌侵权内容。

简介： Deepnccl是为阿里云神龙异构产品开发的用于多GPU互联的AI通信加速库，能够无感地加速基于NCCL通信算子调用的分布式训练或多卡推理等任务。本文主要介绍在Ubuntu或CentOS操作系统的GPU实例上安装和使用Deepnccl的操作方法。

Deepnccl是为阿里云神龙异构产品开发的用于多GPU互联的AI通信加速库，能够无感地加速基于NCCL通信算子调用的分布式训练或多卡推理等任务。本文主要介绍在Ubuntu或CentOS操作系统的GPU实例上安装和使用Deepnccl的操作方法。

前提条件

已创建阿里云GPU实例，且GPU实例的操作系统为Ubuntu或CentOS。

根据GPU实例的不同操作系统，安装Deepnccl有所不同，具体操作如下所示：

说明：安装Deepnccl时，系统会自动同时安装aiacc-nccl-plugin，确保了Deepnccl的正常使用。

本步骤以下载Deepnccl 2.0.1版本为例。

wget https://aiacc.oss-accelerate.aliyuncs.com/nccl/deb/deep-nccl-2.0.1.deb

dpkg -i deep-nccl-2.0.1.deb

ldconfig -p | grep nccl

如果回显结果中如下图所示，显示libnccl.so表示Deepnccl已安装成功。

本步骤以下载Deepnccl 2.0.1版本为例。

wget https://aiacc.oss-accelerate.aliyuncs.com/nccl/rpm/deep-nccl-2.0.1.rpm

rpm -i deep-nccl-2.0.1.rpm

ldconfig -p | grep nccl

如果回显结果中如下图所示，显示libnccl.so表示Deepnccl已安装成功。

Deepnccl（包括aiacc-nccl-plugin）安装成功后，您可以直接使用Deepnccl的通信优化功能，无需再进行其他配置。

好啦！小弹的分享到此为止。我们更欢迎您分享您对阿里云产品的设想、对功能的建议或者各种吐槽，请扫描提交问卷并获得社区积分或精美礼品一份。https://survey.aliyun.com/apps/zhiliao/P4y44bm_8

【扫码填写上方调研问卷】

欢迎每位来到弹性计算的开发者们来反馈问题哦~