RuntimeError: CUDA error (10): invalid device ordinal

简介: 造成这个错误的原因主要是本地只有一个 GPU (GPU:0),而程序中使用 GPUs:1。

一、Python Error


在 Pytorch 读取参数时,报错 RuntimeError: cuda runtime error (10) : invalid device ordinal。


二、解决方法


造成这个错误的原因主要是本地只有一个 GPU (GPU:0),而程序中使用 GPUs:1。


因此,在程序中找到定义 device 的地方,我的如下:


0ae3a85f0bd64e2682f24041241f52d7.png


将其中 "cuda:1" 修改为 "cuda:0",程序将不在报错。


或者


你的配置信息在yaml中:修改对应部分即可


20181130143250933.png

目录
相关文章
|
机器学习/深度学习 人工智能 自然语言处理
视觉 注意力机制——通道注意力、空间注意力、自注意力
本文介绍注意力机制的概念和基本原理,并站在计算机视觉CV角度,进一步介绍通道注意力、空间注意力、混合注意力、自注意力等。
15091 58
|
人工智能 JSON API
使用 Qwen 生成数据模型和进行结构化输出
本教程展示如何使用CAMEL框架和Qwen模型生成结构化数据。CAMEL是一个强大的多智能体框架,支持复杂的AI任务;Qwen由阿里云开发,具备自然语言处理等先进能力。教程涵盖安装、API密钥设置、定义Pydantic模型,并演示了通过Qwen生成JSON格式的学生信息。最后,介绍了如何利用Qwen生成多个随机学生信息的JSON格式数据。欢迎在[CAMEL GitHub](https://github.com/camel-ai/camel)上为项目点星支持。
4185 70
|
机器学习/深度学习 并行计算 PyTorch
【已解决】RuntimeError: CUDA error: device-side assert triggeredCUDA kernel errors might be asynchronous
【已解决】RuntimeError: CUDA error: device-side assert triggeredCUDA kernel errors might be asynchronous
11432 2
|
搜索推荐 物联网 PyTorch
Qwen2.5-7B-Instruct Lora 微调
本教程介绍如何基于Transformers和PEFT框架对Qwen2.5-7B-Instruct模型进行LoRA微调。
13845 34
Qwen2.5-7B-Instruct Lora 微调
|
机器学习/深度学习 人工智能 编解码
《深度剖析:生成对抗网络中生成器与判别器的高效协作之道》
生成对抗网络(GAN)通过生成器与判别器的对抗学习,实现了数据生成和处理的革命性变革。生成器从噪声中创造逼真样本,判别器则判断数据真假。两者在训练中不断优化,最终达到纳什均衡。影响协作效率的关键因素包括网络架构设计、损失函数选择和超参数设置。采用先进的架构如DCGAN、优化损失函数如WGAN,并动态调整训练策略,可显著提升生成器与判别器的协作效果,推动GAN在图像生成、风格迁移等领域的应用发展。
604 5
|
运维 网络安全
解决ssh: connect to host IP port 22: Connection timed out报错(scp传文件指定端口)
通过这些步骤和方法,您可以有效解决“ssh: connect to host IP port 22: Connection timed out”问题,并顺利使用 `scp`命令传输文件。
14186 7