在Win10上安装支持GPU训练的Tensorflow

简介: 本文作者通过他的实际经历手把手教授如何在win10操作系统上安装支持GPU训练的tensorflow。

前面的文章中,我展示了如何测试你的Linux系统,看看你是否有支持TensorFlow的GPU,并在当时承诺接下来介绍Windows和MacOS的相关知识。因此,在本文中,我讲介绍如何测试支持GPU的Windows系统,如果你有这方面的需求,可以在获得TensorFlow的构建并确保其正常工作,本文会介绍安装和配置所需的驱动程序。

a222c71e0a5fd28deb81345a8dde21f2db6514cf

但在你进一步研究学习之前,你还需要了解一下Python pip,而这些通常不会在Windows的机器上出现。

1.获取Python和Pip

有很多方法可以安装Windows版的Python和pip,但是我发现最简单的方法是到Python站点下载可执行文件安装程序

一旦你下载了它,启动它,并确保选择安装的自定义选项。这会将你带入一个配置对话框,你可以选择pip该对话框作为安装选项。

44f0e34fc004036e4c32fdeee647f8b0fc331edc

我建议你只选择他们。

完成安装后,你可以打开命令提示符并键入python以查看你正在使用的版本,从上面我可以看到,我下载了3.6.4,并且我的Python命令与此匹配。

af2b0efdf834bd058a99f9559ea5bc13ee90b594

你可以退出Python解释器:exit()。

然后测试你pip install的:pip -V。

你应该看到这样的东西:

9f6c08dbb1fe7af245a0df66970089a61bb2377d

你现在可以适用你windows对应版本的Python和pip安装程序。你将使用它们来安装TensorFlow,但首先,我们需要检查你的GPU是否支持。

2.检查你的Windows GPU版本:

在命令指示符下,你可以使用以下命令启动设备管理器:

control /name Microsoft.DeviceManager

然后查找“显示适配器”设置,将其打开,然后阅读适配器的名称。你应该看到这样的东西:

8f284d861919e4925278627897b411b6a0d66859

正如你所看到的,我的系统有一个GTX980 Ti。你需要查看你的,并了解下支持CUDA的GPU NVIDIA,网站在这里如果你的GPU正好是GTX980 Ti,那么你知道了TensorFlow可以在你的机器上支持GPU的操作。但是在安装和运行TensorFlow之前,你需要为你的机器安装CUDA驱动,CUDNN更新它。

3.安装CUDA驱动程序:

在写这篇文章的时候,TensorFlow已经建立对CUDA9.0的支持,并且发布版本支持8.0。如果你在此处访CUDA下载网站,你会注意到它会将你带到最新版本(现在是9.1),因此请确保通过选择下面的Legacy Resources链接来下载正确版本的驱动程序在下载界面

f190df8e32cdeb75f164238795d9c06bd6f94be9

当然,随着CUDA和TensorFlow的安装,它也会提醒你(本文稍后介绍),你将不得不返还本网站以获取正确版本。下载系统的驱动程序并使用默认值进行安装。这需要一点点时间,还有几次重启。

在运行TensorFlow之前,你还需要一个与你的CUDA版本相匹配的CuDNN版本,但是我个人觉得它更容易不安装,因为首先你必须确保你拥有正确版本的CUDA,其次你应该先安装TensorFlow并成功让它运行。在安装CuDNN的过程中,有两件事情可能会发生:

1. 它将在CUDA驱动程序上失败,因此你需要重复此步骤。

2. 它会在CuDNN驱动程序上失败,所以你知道你的CUDA驱动程序是好的,你需要得到一个正确的CuDNN版本。

接下来我们介绍如何安装TensorFlow。

4.安装TensorFlow Nightly:

我假设你在使用TensorFlow和GPU,所以要从命令提示符下安装它,只需要输入:

sudo pip install tf-nightly-gpu

然后,一旦完成,在命令提示符窗口中输入:

python

...打开Python编辑器,在其中输入:

import tensorflow as tf

如果你使用的是GPU版本,则应该会出现错误。

如果你有错误的CUPA驱动程序,它可能会显示cudart64_XX.dll失败,其中XX是版本号。在撰写本文时,它cudart_90.dll告诉我,我需要CUDA驱动程序的9.0版本。仔细检查此版本,并重复上一步(下载并安装驱动程序),直到此错误消失。一定要关闭命令提示符窗口,并打开一个新的测试安装,以便你的路径是最新的。

当你有正确的CUDA驱动程序,但错误或缺少CuDNN驱动程序,你会看到一个错误,说cudnn64-X.dll缺少什么东西,在哪里X是一个版本号。记下这一点,你会在下一步中使用它。在继续之前,退出Python并关闭命令提示符窗口。就我而言,它告诉我cudnn64_7.dll缺少了,所以我知道我需要版本7.dll.

5.安装CuDNN库:

CuDNN库是针对深度神经网络的CUDA更新,是tensoeFlow用于加速NVidia GPU上的深度学习库,你可以从这里下载。你必须首先注册一个NVidia开发者账号,这很快就会完成,并且这是免费的。登陆后,你会看到各种CuDNN下载。以下是你必须与上一节中下载的CUDA版本相匹配的位置。所以,我使用了CUDA9.0,

559b5de177049a9c4d40333c7385ff2dc6d2a3a2

所以我确定我使用了一个CuDNN来匹配这个和你在最后一步看到的版本(在我的例子中是版本7)—我为CUDA9.0选择了CuDNN v7.0.5。

6.测试TensorFlow:

如果一切顺利,现在可以打开命令提示符窗口,然后输入“python”打开Python解释器。然后输入:

import tensorflow as tf

如果你有正确版本的,你应该看到没有错误,像这样

6c28906134da7a532a0209451e3ca153a4d77dbe

如果你看到错误cudart64_xx.dllcudnn64_x.dll,回到前面的步骤,并确保你已经下载并安装了导致这些错误的驱动程序的正确版本。我恐怕需要一点反复试验。

然后,您可以输入以下内容来检查您的TensorFlow版本:

c1ce3c5724b8874356952fb09be3281b23dad594

请注意,前后有两个下划线versionTensorFlow出其版本号,如下所示:

print(tf.__version__)

9f6c08dbb1fe7af245a0df66970089a61bb2377d

在有一个完整的TensorFlow运行时环境,在Windows上支持GPU

本文由阿里云云栖社区组织翻译。

文章原标题《installing-tensorflow-with-gpu-on-windows-10》,

作者: Laurence Moroney,译者:乌拉乌拉,审阅:袁虎。

文章为简译,更为详细的内容,请查看原文

相关实践学习
基于阿里云DeepGPU实例,用AI画唯美国风少女
本实验基于阿里云DeepGPU实例,使用aiacctorch加速stable-diffusion-webui,用AI画唯美国风少女,可提升性能至高至原性能的2.6倍。
相关文章
|
17天前
|
机器学习/深度学习 自然语言处理 异构计算
单GPU训练一天,Transformer在100位数字加法上就达能到99%准确率
【6月更文挑战第11天】Transformer模型在算术任务上取得重大突破,通过引入Abacus Embeddings,一天内在100位数字加法上达到99%准确率。该嵌入方法帮助模型跟踪数字位置,提升处理长序列的能力。实验还显示,Abacus Embeddings可与其他嵌入方法结合,提升乘法任务性能。然而,模型在更长序列的扩展性和其他类型任务的效果仍有待探究,具体训练技术的影响也需要进一步研究。论文链接:https://arxiv.org/pdf/2405.17399
29 1
|
30天前
|
机器学习/深度学习 弹性计算 自然语言处理
【阿里云弹性计算】深度学习训练平台搭建:阿里云 ECS 与 GPU 实例的高效利用
【5月更文挑战第28天】阿里云ECS结合GPU实例为深度学习提供高效解决方案。通过弹性计算服务满足大量计算需求,GPU加速训练。用户可按需选择实例规格,配置深度学习框架,实现快速搭建训练平台。示例代码展示了在GPU实例上使用TensorFlow进行训练。优化包括合理分配GPU资源和使用混合精度技术,应用涵盖图像识别和自然语言处理。注意成本控制及数据安全,借助阿里云推动深度学习发展。
151 2
|
1月前
|
机器学习/深度学习 人工智能 算法
为什么大模型训练需要GPU,以及适合训练大模型的GPU介绍
为什么大模型训练需要GPU,以及适合训练大模型的GPU介绍
82 1
|
1月前
|
TensorFlow 算法框架/工具 异构计算
TensorFlow检测GPU是否可用
TensorFlow检测GPU是否可用
33 0
|
1月前
|
TensorFlow 算法框架/工具 C++
在有GPU的windows上安装TensorFlow
在有GPU的windows上安装TensorFlow
44 0
|
1月前
|
Ubuntu Shell Docker
GPU_nvidia-container-toolkit安装和配置
GPU_nvidia-container-toolkit安装和配置
343 0
|
1月前
|
机器学习/深度学习 并行计算 TensorFlow
TensorFlow与GPU加速:提升深度学习性能
【4月更文挑战第17天】本文介绍了TensorFlow如何利用GPU加速深度学习, GPU的并行处理能力适合处理深度学习中的矩阵运算,显著提升性能。TensorFlow通过CUDA和cuDNN库支持GPU,启用GPU只需简单代码。GPU加速能减少训练时间,使训练更大、更复杂的模型成为可能,但也需注意成本、内存限制和编程复杂性。随着技术发展,GPU将继续在深度学习中发挥关键作用,而更高效的硬件解决方案也将备受期待。
|
1月前
|
机器学习/深度学习 运维 监控
TensorFlow分布式训练:加速深度学习模型训练
【4月更文挑战第17天】TensorFlow分布式训练加速深度学习模型训练,通过数据并行和模型并行利用多机器资源,减少训练时间。优化策略包括配置计算资源、优化数据划分和减少通信开销。实际应用需关注调试监控、系统稳定性和容错性,以应对分布式训练挑战。
|
1月前
|
人工智能 机器人 Serverless
魔搭大模型一键部署到阿里云函数计算,GPU 闲置计费功能可大幅降低开销
魔搭大模型一键部署到阿里云函数计算,GPU 闲置计费功能可大幅降低开销
638 2
|
1月前
|
存储 人工智能 编解码
阿里云gpu云服务器最新收费标准、活动价格与实例规格选择参考
随着人工智能、高性能计算等领域的快速发展,GPU云服务器因其强大的计算能力和灵活的资源分配方式,成为越来越多企业和个人用户的首选。2024年,阿里云针对GPU云服务器推出了新的收费标准及活动,gn6v、gn7i、gn6i等实例的gpu云服务器有优惠,本文为大家介绍2024年,阿里云gpu云服务器最新收费标准、活动价格与实例规格选择参考。
阿里云gpu云服务器最新收费标准、活动价格与实例规格选择参考