Deepnccl是为阿里云神龙异构产品开发的用于多GPU互联的AI通信加速库,能够无感地加速基于NCCL通信算子调用的分布式训练或多卡推理等任务。本文主要介绍在Ubuntu或CentOS操作系统的GPU实例上安装和使用Deepnccl的操作方法。
前提条件
已创建阿里云GPU实例,且GPU实例的操作系统为Ubuntu或CentOS。
安装Deepnccl
根据GPU实例的不同操作系统,安装Deepnccl有所不同,具体操作如下所示:
说明:安装Deepnccl时,系统会自动同时安装aiacc-nccl-plugin,确保了Deepnccl的正常使用。
- Ubuntu操作系统
- 执行以下命令,下载Deepnccl的.deb安装包。
本步骤以下载Deepnccl 2.0.1版本为例。
wget https://aiacc.oss-accelerate.aliyuncs.com/nccl/deb/deep-nccl-2.0.1.deb
- 执行以下命令,安装Deepnccl。
dpkg -i deep-nccl-2.0.1.deb
- 执行以下命令,查看Deepnccl是否安装成功。
ldconfig -p | grep nccl
如果回显结果中如下图所示,显示libnccl.so表示Deepnccl已安装成功。
- CentOS操作系统
- 执行以下命令,下载Deepnccl的.rpm安装包。
本步骤以下载Deepnccl 2.0.1版本为例。
wget https://aiacc.oss-accelerate.aliyuncs.com/nccl/rpm/deep-nccl-2.0.1.rpm
- 执行以下命令,安装Deepnccl。
rpm -i deep-nccl-2.0.1.rpm
- 执行以下命令,查看Deepnccl是否安装成功。
ldconfig -p | grep nccl
如果回显结果中如下图所示,显示libnccl.so表示Deepnccl已安装成功。
使用Deepnccl
Deepnccl(包括aiacc-nccl-plugin)安装成功后,您可以直接使用Deepnccl的通信优化功能,无需再进行其他配置。
好啦!小弹的分享到此为止。我们更欢迎您分享您对阿里云产品的设想、对功能的建议或者各种吐槽,请扫描提交问卷并获得社区积分或精美礼品一份。https://survey.aliyun.com/apps/zhiliao/P4y44bm_8
【扫码填写上方调研问卷】
欢迎每位来到弹性计算的开发者们来反馈问题哦~