开发者社区 > ModelScope模型即服务 > 计算机视觉 > 正文

ModelScope我想挂载GPU 加了参数--gpus all 就报错了?

ModelScope运行容器docker run -it registry.cn-beijing.aliyuncs.com/modelscope-repo/modelscope:ubuntu20.04-cuda11.8.0-py38-torch2.0.1-tf2.13.0-1.9.3 /bin/bash,没问题,我想挂载GPU 加了参数--gpus all 就报错了?image.png

展开
收起
真的很搞笑 2023-11-01 20:40:15 240 0
5 条回答
写回答
取消 提交回答
  • 说的都是错的 这个Unknown报错是因为库的名字的问题,正解再这里https://zhuanlan.zhihu.com/p/641458849拉到后面看so文件的操作就行了

    2024-02-06 19:33:52
    赞同 展开评论 打赏
  • 尝试一下方法:

    1. 确保你的系统支持CUDA和cuDNN,并且已经正确安装和配置了这些组件。
    2. 确保你正在使用的Docker镜像是包含了CUDA和cuDNN的版本。如果不是,请尝试更换为包含这些组件的镜像。
    3. 在运行Docker容器时,确保你已经指定了正确的设备映射参数,例如--device=/dev/nvidiactl:/dev/nvidiactl和--device=/dev/nvidia-uvm:/dev/nvidia-uvm等。
    4. 如果以上步骤都不能解决问题,可以尝试在Docker容器内部安装NVIDIA驱动程序和CUDA/cuDNN。
    2023-11-02 21:59:57
    赞同 展开评论 打赏
  • 面对过去,不要迷离;面对未来,不必彷徨;活在今天,你只要把自己完全展示给别人看。

    这个问题很可能是由于您在运行 Docker 容器时缺少必要的 NVIDIA 显卡驱动程序而导致的。因为 --gpus 参数是用来指定要使用的显卡数量,并且需要正确的驱动程序才能正常工作。
    为了解决这个问题,您可以尝试以下操作:

    • 更新您的 NVIDIA 显卡驱动程序到最新版本。
    • 在启动容器时添加 --runtime=nvidia 来启用 NVIDIA 显卡支持。
    • 检查您的容器镜像是否包含必要的 NVIDIA CUDA 和 cuDNN 版本,如果没有,可以在 Dockerfile 中添加它们。
    2023-11-02 13:25:25
    赞同 展开评论 打赏
  • 从你提供的错误信息来看,问题可能是由于Docker没有正确的权限访问GPU设备。以下是一些可能的解决方案:

    1. 检查GPU驱动:确保你的GPU驱动是最新的,并且已经正确安装。你可以使用nvidia-smi命令来检查。

    2. 检查CUDA和cuDNN:确保你的CUDA和cuDNN版本与你的PyTorch和TensorFlow版本兼容。你可以查阅PyTorch和TensorFlow的官方文档,了解具体的兼容性信息。

    3. 检查Docker权限:确保Docker有权限访问GPU设备。你可以使用以下命令来检查:

    nvidia-smi -L
    

    如果Docker没有被添加到nvidia-smi的组中,你需要手动添加。你可以参考NVIDIA的官方文档,了解如何操作。

    1. 检查Docker配置:确保你的Docker配置正确,特别是GPU的资源分配。你可以使用以下命令来检查:
    nvidia-smi -q
    

    如果Docker没有正确分配GPU资源,你需要在Dockerfile中重新配置。

    2023-11-02 09:52:11
    赞同 展开评论 打赏
  • 您参考一下这条命令,以前跑成功的。
    docker run --gpus all -p 8000:8000 -it -d --name ms registry.cn-hangzhou.aliyuncs.com/modelscope-repo/modelscope:ubuntu20.04-cuda11.8.0-py38-torch2.0.1-tf2.13.0-1.9.3 /bin/bash,此回答整理自钉群“魔搭ModelScope开发者联盟群 ①”

    2023-11-01 22:07:17
    赞同 展开评论 打赏

包含图像分类、图像生成、人体人脸识别、动作识别、目标分割、视频生成、卡通画、视觉评价、三维视觉等多个领域

相关电子书

更多
DeepStream: GPU加速海量视频数据智能处理 立即下载
阿里巴巴高性能GPU架构与应用 立即下载
GPU在超大规模深度学习中的发展和应用 立即下载