MXNet GluonTS使用报错:OSError: libnccl.so.2: cannot open shared object file: No such file or directory

简介: libnccl.so.2: cannot open shared object file: No such file or directory

一、问题描述


在使用 GPU 服务器安装 GluonTS 做时间序列预测有关的项目时,报错如下(吐槽,用 MXNet 的时候,经常遇到报错emmm):



二、解决方法


这是因为装mxnet-cu112(GPU版本)默认会是 1.9.0 的高版本,如下所示:



网上很多方法主要说的就是移除后安装低版本的mxnet,如:pip install mxnet-cu101(cuda版本)==1.7.0。但我用的服务器显卡是RTX 3080,只能安装 cuda>=11.0,可是都是对应 1.8.0 以上的mxnet。在一篇 CSDN 文章的评论区找到有效解决方法,如下所示(必须点个大大的赞):



核心思路就是去 NVIDIA 官网下载跟你 CUDA 版本和操作系统(我的是Ubuntu20.04)适配的 NCCL 文件,然后配置一下。



整个过程用到的命令如下:


!nvidia-smi!nvcc--version!sudolsb_release-a!find/usr/-name"libnvrtc*"# 安装GPU版本的mxnet和gluonts!pipinstallmxnet-cu112-ihttp://pypi.douban.com/simple--trusted-hostpypi.douban.com!pipinstallpydantic-ihttp://pypi.douban.com/simple--trusted-hostpypi.douban.com!pipinstallgluonts-ihttp://pypi.douban.com/simple--trusted-hostpypi.douban.com# 配置之前下载的东西!sudodpkg-inccl-local-repo-ubuntu2004-2.8.4-cuda11.2_1.0-1_amd64.deb!sudoaptupdate!sudoaptinstalllibnccl2=2.8.4-1+cuda11.2libnccl-dev=2.8.4-1+cuda11.2


然后就解决了,可以利用 GPU 跑 MXNet GluonTS 的深度学习模型做时间序列预测项目。


参考了:




相关实践学习
部署Stable Diffusion玩转AI绘画(GPU云服务器)
本实验通过在ECS上从零开始部署Stable Diffusion来进行AI绘画创作,开启AIGC盲盒。
目录
相关文章
|
5月前
|
应用服务中间件 Shell 网络安全
nginx安装提示 libssl.so.3: cannot open shared object file: No
【8月更文挑战第1天】### 原因 未将安装的ssl中的`libssl.so.3`链接到`/usr/lib`导致缺失。 ### 解决方案 1. 检查openssl是否已安装,若为低版本则需重装。 ```sh whereis openssl
2424 6
|
5月前
|
Ubuntu
Ubuntu22.04,AOSP编译报错: libncurses.so.5: cannot open shared object file: No such file
本文描述了在Ubuntu 22.04系统上编译AOSP时遇到的`libncurses.so.5`缺失错误,并提供了通过安装相应库解决该问题的步骤。
611 0
|
6月前
|
并行计算 Serverless API
函数计算操作报错合集之出现 "AttributeError: 'NoneType' object has no attribute 'pop'" 错误,是什么原因
在使用函数计算服务(如阿里云函数计算)时,用户可能会遇到多种错误场景。以下是一些常见的操作报错及其可能的原因和解决方法,包括但不限于:1. 函数部署失败、2. 函数执行超时、3. 资源不足错误、4. 权限与访问错误、5. 依赖问题、6. 网络配置错误、7. 触发器配置错误、8. 日志与监控问题。
184 1
|
6月前
|
关系型数据库 MySQL
mysql: error while loading shared libraries: libncurses.so.5: cannot open shared object file
mysql: error while loading shared libraries: libncurses.so.5: cannot open shared object file
529 2
|
11天前
|
JSON Java Apache
Java基础-常用API-Object类
继承是面向对象编程的重要特性,允许从已有类派生新类。Java采用单继承机制,默认所有类继承自Object类。Object类提供了多个常用方法,如`clone()`用于复制对象,`equals()`判断对象是否相等,`hashCode()`计算哈希码,`toString()`返回对象的字符串表示,`wait()`、`notify()`和`notifyAll()`用于线程同步,`finalize()`在对象被垃圾回收时调用。掌握这些方法有助于更好地理解和使用Java中的对象行为。
|
2月前
|
存储 Java 程序员
Java基础的灵魂——Object类方法详解(社招面试不踩坑)
本文介绍了Java中`Object`类的几个重要方法,包括`toString`、`equals`、`hashCode`、`finalize`、`clone`、`getClass`、`notify`和`wait`。这些方法是面试中的常考点,掌握它们有助于理解Java对象的行为和实现多线程编程。作者通过具体示例和应用场景,详细解析了每个方法的作用和重写技巧,帮助读者更好地应对面试和技术开发。
137 4
|
3月前
|
Java
Java Object 类详解
在 Java 中,`Object` 类是所有类的根类,每个 Java 类都直接或间接继承自 `Object`。作为所有类的超类,`Object` 定义了若干基本方法,如 `equals`、`hashCode`、`toString` 等,这些方法在所有对象中均可使用。通过重写这些方法,可以实现基于内容的比较、生成有意义的字符串表示以及确保哈希码的一致性。此外,`Object` 还提供了 `clone`、`getClass`、`notify`、`notifyAll` 和 `wait` 等方法,支持对象克隆、反射机制及线程同步。理解和重写这些方法有助于提升 Java 代码的可读性和可维护性。
123 20
|
5月前
|
Java
【Java基础面试二十】、介绍一下Object类中的方法
这篇文章介绍了Java中Object类的常用方法,包括`getClass()`、`equals()`、`hashCode()`、`toString()`、`wait()`、`notify()`、`notifyAll()`和`clone()`,并提到了不推荐使用的`finalize()`方法。
【Java基础面试二十】、介绍一下Object类中的方法
|
4月前
|
Python
类与面向对象编程(Object-Oriented Programming, OOP)
类与面向对象编程(Object-Oriented Programming, OOP)
27 0
|
5月前
|
前端开发 Java 编译器
【前端学java】java中的Object类和前端中的Object有什么区别(9)
【8月更文挑战第10天】java中的Object类和前端中的Object有什么区别
52 0
【前端学java】java中的Object类和前端中的Object有什么区别(9)