一、基础知识
我们平时直接pip install pytorch/tensorflow==版本号 - i 源,默认下载的都是CPU版本的,训练数据时可以看到你的CPU占用很高,GPU动都不动。
python的版本不同,允许你下载的pytorch/tensorflow版本也许会有一些小小的不同。
下载GPU版本的pytorch/tensorflow,需要下载CUDA和cuDNN,三者不需要担心下载顺序,可以不用知道CUDA和cuDNN是干什么的,跟着下载步骤安装完就好。
我们下载的pytorch/tensorflow、CUDA、cuDNN 都要严格按照版本来下载,以免出错。
有个东西叫环境变量,很多初学者学一门语言时跟着教程点点,就把环境变量配了,那些教程里也没说是干什么的,这里建议看下我的这篇文章: python与anaconda区别及先后安装的问题,当然不明白也没什么问题。
这里看到的是支持的cuda的最高版本,应该下载这以下的:
我本人显卡是3070,下载了11.0的cuda和8.0的cuDNN----2.4 的 tensorflow 和 1.71的torch:
30系显卡使用11版本以下的cuda会出现程序运行很慢的问题,不大兼容,以下显卡忽略这条。
很难找到一个合适的cuda版本,同时兼容自己满意的tensorflow和pytorch版本,虽然cuda可以下载多个版本懂哥可以配合版本随便用,但对于初学者来说工作量太大了。
我下载11.0的cuda,刚好满足了一个cuda兼容不太老也不太新版本的tensorflow,且以后用到的YOLOv5的torch>=1.70的要求。
当你成为懂哥后,你就能下载多个cuda、开多个虚拟环境配置不同版本的深度学习框架了。
二、下载安装pytorch/tensorflow
记得把你之前下载的CPU版本的卸载了,先把conda退了再卸载好点,报错了自己找文件位置删除。
- pip uninstall temsorflow
- pip uninstall pytorch
ytorch:
我们不理会最新版本,点开历史版本,我们就能看到各种各样pytorch:
这是tensorflow的:
GPU支持CUDA列表:https://www.tensorflow.org/install/source_windows?hl=zh-cn
这张图哪都有,因为来自官网,现在是2022-09-20,tensorflow版本都到2.9了,但这张图还没更新,也别自做主张下载这之外的版本了,选一个图里面有的,看好cuda版本,和pytorch对比一下,下载吧:
以我本人为例:
你要做的步骤就是:
1、看tensorflow,选个版本,看下需要的cuda版本,然后点开pytorch页面ctrl+f输入cuda版本,找自己满意的pytorch版本,切记是pip install的,在conda install下面,conda install下载太慢了。
比如我选的:
pip install tensorflow_gpu==2.4.0 -i https://pypi.doubanio.com/simple
pip install torch==1.7.1+cu110 torchvision==0.8.2+cu110 torchaudio==0.7.2 -f https://download.pytorch.org/whl/torch_stable.html
2、下载cuda,链接:CUDA Toolkit Archive | NVIDIA Developer,比如我选择11.0版本,那11.0.1或者11.0.2也行。下载完成后,安装路径什么的也不用管,就点击下一步就行。下载完成后,你的C:\Program Files\ 里就多了个 NVIDIA GPU Computing Toolkit 文件夹了。
3、下载上面tensorflow那里截图中,你选择的cuda对应的的版本的cuDNN。
比如我下载11.0.1的cuda,那就配8.0的cuDNN。
cudnn官网:CUDA 深度神经网络库 (cuDNN) | NVIDIA Developer
第一次进这个网站好像要登录注册一下,无伤大雅~
4、下载完成后,解压,把里面那一堆文件粘贴到:C:\Program Files\NVIDIA GPU Computing Toolkit\CUDA\v11.0 这里面,然后你下载来的cuDNN文件就删掉吧没用了。
完成之后是这样的:
5、配置环境变量意思一下:
这样就能用了,或许需要重启下电脑,但我没有。