备案控制台

开发者社区人工智能文章正文

【已解决】RuntimeError: CuDA error: no kernel image is available for execution on the device

2024-05-15 1824

版权

版权声明：

本文内容由阿里云实名注册用户自发贡献，版权归原作者所有，阿里云开发者社区不拥有其著作权，亦不承担相应法律责任。具体规则请查看《阿里云开发者社区用户服务协议》和《阿里云开发者社区知识产权保护指引》。如果您发现本社区中有涉嫌抄袭的内容，填写侵权投诉表单进行举报，一经查实，本社区将立刻删除涉嫌侵权内容。

简介： 【已解决】RuntimeError: CuDA error: no kernel image is available for execution on the device

问题：根本原因是之前装的cuda和torch版本和显卡不适配（开始以为4090可以兼容很多版本就没管）

解决方法：卸载之前的cuda和torch，找到适配的cuda和troch版本，安装--然后就没问题了。

我的配置

GPU 10张4090

CUDA 11.8（4090最低能跑的版本说是）

python 3.12

问题分析

其实就是4090算力和cuda不兼容，pytorch所依赖的cuda只支持比他小的，所以尽量装新一点的cuda版本。

装好后可以测试cuda是否能用

torch.cuda.is_available()
True

这样就算可以了。

查看cuda version nvidia-smi

解决办法

1.查看显卡算力

CUDA GPUs - Compute Capability | NVIDIA Developer

找到你的显卡对应算力，如4090对应8.9

2.算力对应的cuda版本

NVIDIA Datacenter Drivers :: NVIDIA Data Center GPU Driver Documentation

对应8.9是cuda11.8，只能高不能低。

文章标签：

并行计算

异构计算

Python

算法框架/工具

PyTorch

程序员行者孙

目录

相关文章

诸神缄默不语

|

并行计算 Linux PyTorch

RuntimeError: CUDA error: device-side assert triggered

我在运行PyG和transformers代码时两次遇到了这一问题，在此加以记录。

诸神缄默不语

3034 0 0

zzy的aly

|

1月前

|

并行计算 Python

Python错误笔记(一)：CUDA initialization: CUDA unknown error - this may be due to an incorrectly set up env

这篇文章讨论了CUDA初始化时出现的未知错误及其解决方案，包括重启系统和安装nvidia-modprobe。

zzy的aly

117 0 0

真的很搞笑

|

5月前

|

并行计算监控前端开发

函数计算操作报错合集之如何解决报错：RuntimeError: Expected all tensors to be on the same device, but found at least two devices, cpu and cuda:0!

在使用函数计算服务（如阿里云函数计算）时，用户可能会遇到多种错误场景。以下是一些常见的操作报错及其可能的原因和解决方法，包括但不限于：1. 函数部署失败、2. 函数执行超时、3. 资源不足错误、4. 权限与访问错误、5. 依赖问题、6. 网络配置错误、7. 触发器配置错误、8. 日志与监控问题。

真的很搞笑

202 2 2

程序员行者孙

|

6月前

|

机器学习/深度学习并行计算 PyTorch

【已解决】RuntimeError: CUDA error: device-side assert triggeredCUDA kernel errors might be asynchronous

【已解决】RuntimeError: CUDA error: device-side assert triggeredCUDA kernel errors might be asynchronous

程序员行者孙

1745 2 2

前方一片光明

|

虚拟化

成功解决Failed to execute stage ‘Setup validation’: Hardware does not support virtualization.

成功解决Failed to execute stage ‘Setup validation’: Hardware does not support virtualization.

前方一片光明

136 0 0

root8042965

|

6月前

|

Ubuntu iOS开发 MacOS

Could not enumerate video devices (or none found).解决办法

Could not enumerate video devices (or none found).解决办法

root8042965

92 0 0

AiCharm

|

机器学习/深度学习 PyTorch 算法框架/工具

解决RuntimeError: Expected all tensors to be on the same device, but found at least two devices, cp

对应两种保存模型的方式，pytorch也有两种加载模型的方式。对应第一种保存方式，加载模型时通过torch.load(‘.pth’)直接初始化新的神经网络对象；对应第二种保存方式，需要首先导入对应的网络，再通过net.load_state_dict(torch.load(‘.pth’))完成模型参数的加载。

AiCharm

1627 0 0

LiBiGo

|

并行计算 PyTorch 算法框架/工具

RuntimeError: CUDA error (10): invalid device ordinal

造成这个错误的原因主要是本地只有一个 GPU (GPU:0)，而程序中使用 GPUs:1。

LiBiGo

721 0 0

LiBiGo

解决 RuntimeError: cuDNN error: CUDNN_STATUS_INTERNAL_ERROR

解决 RuntimeError: cuDNN error: CUDNN_STATUS_INTERNAL_ERROR

LiBiGo

423 0 0

杋木

|

异构计算

GPU报错：RuntimeError: cuDNN error: CUDNN_STATUS_EXECUTION_FAILED

RuntimeError: cuDNN error: CUDNN_STATUS_EXECUTION_FAILED

杋木

861 0 1

热门文章

最新文章

weex-html5 组件进阶

会声会影2023视频编辑软件免费序列号永久

苹果电脑 Mac OS X 系统上防止误按 command+Q 退出软件

SSH连接远程服务器，本地known_hosts文件记录了什么

saltstack的探索-改善管理用户的sls文件

marathon小知识点分享之如何远程调试marathon

Myeclipse 操作数据库

光伏发电或能控制城市天气

ROS机器视觉入门：从基础到人脸识别与目标检测

鸿蒙开发：自定义一个简单的标题栏

鸿蒙开发：切换至基于rcp的网络请求

【MyBatisPlus·最新教程】包含多个改造案例，常用注解、条件构造器、代码生成、静态工具、类型处理器、分页插件、自动填充字段

《C++跨平台编译：打破系统边界，释放代码潜能》

电路板设计中射频反馈线的优化

《C++20 图形界面程序：速度与渲染效率的双重优化秘籍》

图解 Spring 循环依赖，一文吃透！

关于 Kafka 高性能架构，这篇说得最全面，建议收藏！

微服务和 SOA 的 6 大核心区别，你都知道吗？

相关电子书

更多

Bochspwn-Reloaded-Detecting-Kernel-Memory-Disclosure-With-X86-Emulation-And-Taint-Tracking

SPEED MATTERS:HOW TO PROCESS B

AVPASS-Leaking-And-Bypassing-Anitvirus-Detection-Model-Automatically

下一篇

阿里云OSS设置跨域访问