安装GPU版本tensorflow、pytorch

简介: 安装GPU版本tensorflow、pytorch

一、基础知识

我们平时直接pip install pytorch/tensorflow==版本号 - i 源,默认下载的都是CPU版本的,训练数据时可以看到你的CPU占用很高,GPU动都不动。

python的版本不同,允许你下载的pytorch/tensorflow版本也许会有一些小小的不同。

下载GPU版本的pytorch/tensorflow,需要下载CUDA和cuDNN,三者不需要担心下载顺序,可以不用知道CUDA和cuDNN是干什么的,跟着下载步骤安装完就好。

我们下载的pytorch/tensorflow、CUDA、cuDNN 都要严格按照版本来下载,以免出错。

有个东西叫环境变量,很多初学者学一门语言时跟着教程点点,就把环境变量配了,那些教程里也没说是干什么的,这里建议看下我的这篇文章: python与anaconda区别及先后安装的问题,当然不明白也没什么问题。

这里看到的是支持的cuda的最高版本,应该下载这以下的:

我本人显卡是3070,下载了11.0的cuda和8.0的cuDNN----2.4 的 tensorflow 和 1.71的torch:


30系显卡使用11版本以下的cuda会出现程序运行很慢的问题,不大兼容,以下显卡忽略这条。

很难找到一个合适的cuda版本,同时兼容自己满意的tensorflow和pytorch版本,虽然cuda可以下载多个版本懂哥可以配合版本随便用,但对于初学者来说工作量太大了。

我下载11.0的cuda,刚好满足了一个cuda兼容不太老也不太新版本的tensorflow,且以后用到的YOLOv5的torch>=1.70的要求。

当你成为懂哥后,你就能下载多个cuda、开多个虚拟环境配置不同版本的深度学习框架了。

二、下载安装pytorch/tensorflow

记得把你之前下载的CPU版本的卸载了,先把conda退了再卸载好点,报错了自己找文件位置删除。

  • pip uninstall temsorflow
  • pip uninstall pytorch

ytorch:

我们不理会最新版本,点开历史版本,我们就能看到各种各样pytorch:

这是tensorflow的:

GPU支持CUDA列表:https://www.tensorflow.org/install/source_windows?hl=zh-cn

这张图哪都有,因为来自官网,现在是2022-09-20tensorflow版本都到2.9了,但这张图还没更新,也别自做主张下载这之外的版本了,选一个图里面有的,看好cuda版本,和pytorch对比一下,下载吧:

以我本人为例:

你要做的步骤就是

1、看tensorflow,选个版本,看下需要的cuda版本,然后点开pytorch页面ctrl+f输入cuda版本,找自己满意的pytorch版本,切记是pip install的,在conda install下面,conda install下载太慢了。


比如我选的:


pip install tensorflow_gpu==2.4.0 -i https://pypi.doubanio.com/simple

pip install torch==1.7.1+cu110 torchvision==0.8.2+cu110 torchaudio==0.7.2 -f https://download.pytorch.org/whl/torch_stable.html

2、下载cuda,链接:CUDA Toolkit Archive | NVIDIA Developer,比如我选择11.0版本,那11.0.1或者11.0.2也行。下载完成后,安装路径什么的也不用管,就点击下一步就行。下载完成后,你的C:\Program Files\ 里就多了个 NVIDIA GPU Computing Toolkit 文件夹了。

3、下载上面tensorflow那里截图中,你选择的cuda对应的的版本的cuDNN。


比如我下载11.0.1的cuda,那就配8.0的cuDNN。


cudnn官网:CUDA 深度神经网络库 (cuDNN) | NVIDIA Developer

第一次进这个网站好像要登录注册一下,无伤大雅~  

4、下载完成后,解压,把里面那一堆文件粘贴到:C:\Program Files\NVIDIA GPU Computing Toolkit\CUDA\v11.0  这里面,然后你下载来的cuDNN文件就删掉吧没用了。

完成之后是这样的:

5、配置环境变量意思一下:

这样就能用了,或许需要重启下电脑,但我没有。


相关实践学习
在云上部署ChatGLM2-6B大模型(GPU版)
ChatGLM2-6B是由智谱AI及清华KEG实验室于2023年6月发布的中英双语对话开源大模型。通过本实验,可以学习如何配置AIGC开发环境,如何部署ChatGLM2-6B大模型。
相关文章
|
6月前
|
缓存 并行计算 PyTorch
PyTorch CUDA内存管理优化:深度理解GPU资源分配与缓存机制
本文深入探讨了PyTorch中GPU内存管理的核心机制,特别是CUDA缓存分配器的作用与优化策略。文章分析了常见的“CUDA out of memory”问题及其成因,并通过实际案例(如Llama 1B模型训练)展示了内存分配模式。PyTorch的缓存分配器通过内存池化、延迟释放和碎片化优化等技术,显著提升了内存使用效率,减少了系统调用开销。此外,文章还介绍了高级优化方法,包括混合精度训练、梯度检查点技术及自定义内存分配器配置。这些策略有助于开发者在有限硬件资源下实现更高性能的深度学习模型训练与推理。
1032 0
|
6月前
|
机器学习/深度学习 并行计算 PyTorch
英伟达新一代GPU架构(50系列显卡)PyTorch兼容性解决方案
本文记录了在RTX 5070 Ti上运行PyTorch时遇到的CUDA兼容性问题,分析其根源为预编译二进制文件不支持sm_120架构,并提出解决方案:使用PyTorch Nightly版本、更新CUDA工具包至12.8。通过清理环境并安装支持新架构的组件,成功解决兼容性问题。文章总结了深度学习环境中硬件与框架兼容性的关键策略,强调Nightly构建版本和环境一致性的重要性,为开发者提供参考。
2860 64
英伟达新一代GPU架构(50系列显卡)PyTorch兼容性解决方案
|
12月前
|
PyTorch Linux 算法框架/工具
pytorch学习一:Anaconda下载、安装、配置环境变量。anaconda创建多版本python环境。安装 pytorch。
这篇文章是关于如何使用Anaconda进行Python环境管理,包括下载、安装、配置环境变量、创建多版本Python环境、安装PyTorch以及使用Jupyter Notebook的详细指南。
1394 1
pytorch学习一:Anaconda下载、安装、配置环境变量。anaconda创建多版本python环境。安装 pytorch。
|
8月前
|
存储 机器学习/深度学习 PyTorch
PyTorch Profiler 性能优化示例:定位 TorchMetrics 收集瓶颈,提高 GPU 利用率
本文探讨了机器学习项目中指标收集对训练性能的影响,特别是如何通过简单实现引入不必要的CPU-GPU同步事件,导致训练时间增加约10%。使用TorchMetrics库和PyTorch Profiler工具,文章详细分析了性能瓶颈的根源,并提出了多项优化措施
329 1
PyTorch Profiler 性能优化示例:定位 TorchMetrics 收集瓶颈,提高 GPU 利用率
|
12月前
|
机器学习/深度学习 缓存 PyTorch
pytorch学习一(扩展篇):miniconda下载、安装、配置环境变量。miniconda创建多版本python环境。整理常用命令(亲测ok)
这篇文章是关于如何下载、安装和配置Miniconda,以及如何使用Miniconda创建和管理Python环境的详细指南。
3811 0
pytorch学习一(扩展篇):miniconda下载、安装、配置环境变量。miniconda创建多版本python环境。整理常用命令(亲测ok)
|
机器学习/深度学习 并行计算 PyTorch
GPU 加速与 PyTorch:最大化硬件性能提升训练速度
【8月更文第29天】GPU(图形处理单元)因其并行计算能力而成为深度学习领域的重要组成部分。本文将介绍如何利用PyTorch来高效地利用GPU进行深度学习模型的训练,从而最大化训练速度。我们将讨论如何配置环境、选择合适的硬件、编写高效的代码以及利用高级特性来提高性能。
2051 1
|
12月前
|
并行计算 Ubuntu 算法
Ubuntu18 服务器 更新升级CUDA版本 pyenv nvidia ubuntu1804 原11.2升级到PyTorch要求12.1 全过程详细记录 apt update
Ubuntu18 服务器 更新升级CUDA版本 pyenv nvidia ubuntu1804 原11.2升级到PyTorch要求12.1 全过程详细记录 apt update
362 0
|
并行计算 开发工具 异构计算
在Windows平台使用源码编译和安装PyTorch3D指定版本
【10月更文挑战第6天】在 Windows 平台上,编译和安装指定版本的 PyTorch3D 需要先安装 Python、Visual Studio Build Tools 和 CUDA(如有需要),然后通过 Git 获取源码。建议创建虚拟环境以隔离依赖,并使用 `pip` 安装所需库。最后,在源码目录下运行 `python setup.py install` 进行编译和安装。完成后即可在 Python 中导入 PyTorch3D 使用。
1123 0
|
并行计算 TensorFlow 算法框架/工具
Windows11+CUDA12.0+RTX4090如何配置安装Tensorflow2-GPU环境?
本文介绍了如何在Windows 11操作系统上,配合CUDA 12.0和RTX4090显卡,通过创建conda环境、安装特定版本的CUDA、cuDNN和TensorFlow 2.10来配置TensorFlow GPU环境,并提供了解决可能遇到的cudnn库文件找不到错误的具体步骤。
1949 3
|
持续交付 测试技术 jenkins
JSF 邂逅持续集成,紧跟技术热点潮流,开启高效开发之旅,引发开发者强烈情感共鸣
【8月更文挑战第31天】在快速发展的软件开发领域,JavaServer Faces(JSF)这一强大的Java Web应用框架与持续集成(CI)结合,可显著提升开发效率及软件质量。持续集成通过频繁的代码集成及自动化构建测试,实现快速反馈、高质量代码、加强团队协作及简化部署流程。以Jenkins为例,配合Maven或Gradle,可轻松搭建JSF项目的CI环境,通过JUnit和Selenium编写自动化测试,确保每次构建的稳定性和正确性。
164 0

热门文章

最新文章

推荐镜像

更多