在Win10上安装支持GPU训练的Tensorflow

简介: 本文作者通过他的实际经历手把手教授如何在win10操作系统上安装支持GPU训练的tensorflow。

前面的文章中,我展示了如何测试你的Linux系统,看看你是否有支持TensorFlow的GPU,并在当时承诺接下来介绍Windows和MacOS的相关知识。因此,在本文中,我讲介绍如何测试支持GPU的Windows系统,如果你有这方面的需求,可以在获得TensorFlow的构建并确保其正常工作,本文会介绍安装和配置所需的驱动程序。


但在你进一步研究学习之前,你还需要了解一下Python pip,而这些通常不会在Windows的机器上出现。

1.获取Python和Pip

有很多方法可以安装Windows版的Python和pip,但是我发现最简单的方法是到Python站点下载可执行文件安装程序

一旦你下载了它,启动它,并确保选择安装的自定义选项。这会将你带入一个配置对话框,你可以选择pip该对话框作为安装选项。


我建议你只选择他们。

完成安装后,你可以打开命令提示符并键入python以查看你正在使用的版本,从上面我可以看到,我下载了3.6.4,并且我的Python命令与此匹配。


你可以退出Python解释器:exit()。

然后测试你pip install的:pip -V。

你应该看到这样的东西:


你现在可以适用你windows对应版本的Python和pip安装程序。你将使用它们来安装TensorFlow,但首先,我们需要检查你的GPU是否支持。

2.检查你的Windows GPU版本:

在命令指示符下,你可以使用以下命令启动设备管理器:

control /name Microsoft.DeviceManager

然后查找“显示适配器”设置,将其打开,然后阅读适配器的名称。你应该看到这样的东西:


正如你所看到的,我的系统有一个GTX980 Ti。你需要查看你的,并了解下支持CUDA的GPU NVIDIA,网站在这里如果你的GPU正好是GTX980 Ti,那么你知道了TensorFlow可以在你的机器上支持GPU的操作。但是在安装和运行TensorFlow之前,你需要为你的机器安装CUDA驱动,CUDNN更新它。

3.安装CUDA驱动程序:

在写这篇文章的时候,TensorFlow已经建立对CUDA9.0的支持,并且发布版本支持8.0。如果你在此处访CUDA下载网站,你会注意到它会将你带到最新版本(现在是9.1),因此请确保通过选择下面的Legacy Resources链接来下载正确版本的驱动程序在下载界面


当然,随着CUDA和TensorFlow的安装,它也会提醒你(本文稍后介绍),你将不得不返还本网站以获取正确版本。下载系统的驱动程序并使用默认值进行安装。这需要一点点时间,还有几次重启。

在运行TensorFlow之前,你还需要一个与你的CUDA版本相匹配的CuDNN版本,但是我个人觉得它更容易不安装,因为首先你必须确保你拥有正确版本的CUDA,其次你应该先安装TensorFlow并成功让它运行。在安装CuDNN的过程中,有两件事情可能会发生:

1. 它将在CUDA驱动程序上失败,因此你需要重复此步骤。

2. 它会在CuDNN驱动程序上失败,所以你知道你的CUDA驱动程序是好的,你需要得到一个正确的CuDNN版本。

接下来我们介绍如何安装TensorFlow。

4.安装TensorFlow Nightly:

我假设你在使用TensorFlow和GPU,所以要从命令提示符下安装它,只需要输入:

sudo pip install tf-nightly-gpu

然后,一旦完成,在命令提示符窗口中输入:

python

...打开Python编辑器,在其中输入:

import tensorflow as tf

如果你使用的是GPU版本,则应该会出现错误。

如果你有错误的CUPA驱动程序,它可能会显示cudart64_XX.dll失败,其中XX是版本号。在撰写本文时,它cudart_90.dll告诉我,我需要CUDA驱动程序的9.0版本。仔细检查此版本,并重复上一步(下载并安装驱动程序),直到此错误消失。一定要关闭命令提示符窗口,并打开一个新的测试安装,以便你的路径是最新的。

当你有正确的CUDA驱动程序,但错误或缺少CuDNN驱动程序,你会看到一个错误,说cudnn64-X.dll缺少什么东西,在哪里X是一个版本号。记下这一点,你会在下一步中使用它。在继续之前,退出Python并关闭命令提示符窗口。就我而言,它告诉我cudnn64_7.dll缺少了,所以我知道我需要版本7.dll.

5.安装CuDNN库:

CuDNN库是针对深度神经网络的CUDA更新,是tensoeFlow用于加速NVidia GPU上的深度学习库,你可以从这里下载。你必须首先注册一个NVidia开发者账号,这很快就会完成,并且这是免费的。登陆后,你会看到各种CuDNN下载。以下是你必须与上一节中下载的CUDA版本相匹配的位置。所以,我使用了CUDA9.0,


所以我确定我使用了一个CuDNN来匹配这个和你在最后一步看到的版本(在我的例子中是版本7)—我为CUDA9.0选择了CuDNN v7.0.5。

6.测试TensorFlow:

如果一切顺利,现在可以打开命令提示符窗口,然后输入“python”打开Python解释器。然后输入:

import tensorflow as tf

如果你有正确版本的,你应该看到没有错误,像这样


如果你看到错误cudart64_xx.dllcudnn64_x.dll,回到前面的步骤,并确保你已经下载并安装了导致这些错误的驱动程序的正确版本。我恐怕需要一点反复试验。

然后,您可以输入以下内容来检查您的TensorFlow版本:


请注意,前后有两个下划线versionTensorFlow出其版本号,如下所示:

print(tf.__version__)


在有一个完整的TensorFlow运行时环境,在Windows上支持GPU

本文由阿里云云栖社区组织翻译。

文章原标题《installing-tensorflow-with-gpu-on-windows-10》,

作者: Laurence Moroney,译者:乌拉乌拉,审阅:袁虎。

文章为简译,更为详细的内容,请查看原文

相关实践学习
在云上部署ChatGLM2-6B大模型(GPU版)
ChatGLM2-6B是由智谱AI及清华KEG实验室于2023年6月发布的中英双语对话开源大模型。通过本实验,可以学习如何配置AIGC开发环境,如何部署ChatGLM2-6B大模型。
相关文章
|
并行计算 Shell TensorFlow
Tensorflow-GPU训练MTCNN出现错误-Could not create cudnn handle: CUDNN_STATUS_NOT_INITIALIZED
在使用TensorFlow-GPU训练MTCNN时,如果遇到“Could not create cudnn handle: CUDNN_STATUS_NOT_INITIALIZED”错误,通常是由于TensorFlow、CUDA和cuDNN版本不兼容或显存分配问题导致的,可以通过安装匹配的版本或在代码中设置动态显存分配来解决。
245 1
Tensorflow-GPU训练MTCNN出现错误-Could not create cudnn handle: CUDNN_STATUS_NOT_INITIALIZED
|
并行计算 PyTorch TensorFlow
Ubuntu安装笔记(一):安装显卡驱动、cuda/cudnn、Anaconda、Pytorch、Tensorflow、Opencv、Visdom、FFMPEG、卸载一些不必要的预装软件
这篇文章是关于如何在Ubuntu操作系统上安装显卡驱动、CUDA、CUDNN、Anaconda、PyTorch、TensorFlow、OpenCV、FFMPEG以及卸载不必要的预装软件的详细指南。
11425 4
|
9月前
|
并行计算 PyTorch 算法框架/工具
融合AMD与NVIDIA GPU集群的MLOps:异构计算环境中的分布式训练架构实践
本文探讨了如何通过技术手段混合使用AMD与NVIDIA GPU集群以支持PyTorch分布式训练。面对CUDA与ROCm框架互操作性不足的问题,文章提出利用UCC和UCX等统一通信框架实现高效数据传输,并在异构Kubernetes集群中部署任务。通过解决轻度与强度异构环境下的挑战,如计算能力不平衡、内存容量差异及通信性能优化,文章展示了如何无需重构代码即可充分利用异构硬件资源。尽管存在RDMA验证不足、通信性能次优等局限性,但该方案为最大化GPU资源利用率、降低供应商锁定提供了可行路径。源代码已公开,供读者参考实践。
795 3
融合AMD与NVIDIA GPU集群的MLOps:异构计算环境中的分布式训练架构实践
|
9月前
|
机器学习/深度学习 人工智能 物联网
MiniMind:2小时训练出你的专属AI!开源轻量级语言模型,个人GPU轻松搞定
MiniMind 是一个开源的超小型语言模型项目,帮助开发者以极低成本从零开始训练自己的语言模型,最小版本仅需25.8M参数,适合在普通个人GPU上快速训练。
1794 10
MiniMind:2小时训练出你的专属AI!开源轻量级语言模型,个人GPU轻松搞定
|
9月前
|
人工智能 负载均衡 调度
COMET:字节跳动开源MoE训练加速神器,单层1.96倍性能提升,节省百万GPU小时
COMET是字节跳动推出的针对Mixture-of-Experts(MoE)模型的优化系统,通过细粒度的计算-通信重叠技术,显著提升分布式训练效率,支持多种并行策略和大规模集群部署。
507 9
|
9月前
|
Ubuntu TensorFlow 算法框架/工具
如何在Ubuntu上安装TensorFlow 24.04
如何在Ubuntu上安装TensorFlow 24.04
|
PyTorch TensorFlow 算法框架/工具
Jetson环境安装(一):Ubuntu18.04安装pytorch、opencv、onnx、tensorflow、setuptools、pycuda....
本文提供了在Ubuntu 18.04操作系统的NVIDIA Jetson平台上安装深度学习和计算机视觉相关库的详细步骤,包括PyTorch、OpenCV、ONNX、TensorFlow等。
1219 1
Jetson环境安装(一):Ubuntu18.04安装pytorch、opencv、onnx、tensorflow、setuptools、pycuda....
|
人工智能 语音技术 UED
仅用4块GPU、不到3天训练出开源版GPT-4o,这是国内团队最新研究
【10月更文挑战第19天】中国科学院计算技术研究所提出了一种名为LLaMA-Omni的新型模型架构,实现与大型语言模型(LLMs)的低延迟、高质量语音交互。该模型集成了预训练的语音编码器、语音适配器、LLM和流式语音解码器,能够在不进行语音转录的情况下直接生成文本和语音响应,显著提升了用户体验。实验结果显示,LLaMA-Omni的响应延迟低至226ms,具有创新性和实用性。
475 1
|
并行计算 TensorFlow 算法框架/工具
tensorflow安装
tensorflow安装——GPU版
384 2
|
并行计算 PyTorch TensorFlow
环境安装(一):Anaconda3+pytorch1.6.0+cuda10.0+cudnn7.6.4+tensorflow1.15+pycocotools+pydensecrf
这篇文章详细介绍了如何在Anaconda环境下安装和配置深度学习所需的库和工具,包括PyTorch 1.6.0、CUDA 10.0、cuDNN 7.6.4、TensorFlow 1.15、pycocotools和pydensecrf,并提供了pip国内镜像源信息以及Jupyter Notebook和Anaconda的基本操作。
1826 0
环境安装(一):Anaconda3+pytorch1.6.0+cuda10.0+cudnn7.6.4+tensorflow1.15+pycocotools+pydensecrf