问题:根本原因是之前装的cuda和torch版本和显卡不适配(开始以为4090可以兼容很多版本就没管)
解决方法:卸载之前的cuda和torch,找到适配的cuda和troch版本,安装--然后就没问题了。
我的配置
GPU 10张4090
CUDA 11.8(4090最低能跑的版本说是)
python 3.12
问题分析
其实就是4090算力和cuda不兼容,pytorch所依赖的cuda只支持比他小的,所以尽量装新一点的cuda版本。
装好后可以测试cuda是否能用
torch.cuda.is_available() True
这样就算可以了。
查看cuda version nvidia-smi
解决办法
1.查看显卡算力
CUDA GPUs - Compute Capability | NVIDIA Developer
找到你的显卡对应算力,如4090对应8.9
2.算力对应的cuda版本
NVIDIA Datacenter Drivers :: NVIDIA Data Center GPU Driver Documentation
对应8.9是cuda11.8,只能高不能低。