Windows部署TensorFlow后识别GPU失败,原因是啥?

简介: Windows部署TensorFlow后识别GPU失败,原因是啥?


前面买GPU主要是为了接触一下深度学习HPE服务器通过显卡直通安装Tesla M4,这算亮机成功了吗?,经过了解,深度学习除了支持Linux系统之外,还支持Windows和macOS系统,那这么看,我完全可以在安装好了驱动的Windows系统上试一下切换到WDDM模式,Tesla M4可以用于本地显示输出了!

而且,为了测试显卡的算力,我打算用比较流行的机器学习库TensorFlow来做个简单测试,TensorFlow提供了一些基准测试脚本,我们可以用它们来比较不同硬件平台上的模型训练速度,并且可以通过设置不同的参数来测试CPU和GPU的性能。

一般来讲,深度学习中广泛使用Python编程语言,跑深度学习就要安装Python,我们可以参考之前的案例自行安装PythonPython办公自动化—环境搭建,并确保安装了常用的科学计算库,如NumPy、Pandas和Matplotlib。当然,我们也可以使用Anaconda等Python发行版来简化库的管理,然后再使用Anaconda来安装深度学习框架TensorFlow,或者PyTorch、Keras等框架。

首先,我们打开Anaconda官网(https://www.anaconda.com/),点击右上角的“Free Download”进入到下载页面。

或者直接打开下载页面(https://www.anaconda.com/download),选择适合自己电脑版本的Anaconda进行下载安装,比如我就选择默认的Windows版本。

安装包比较大,有1 GB多点,可能会下载比较慢,自己想想办法,比如用迅雷下载。下载完成后就可以开始安装了。

首屏直接点击“Next”继续安装。

点击“I Agree”同意用户协议。

确认安装可用的用户,默认选择为所有用户。

软件的占用空间还是比较大的,大约是5.7 GB,实际安装下来,空间大概要8 GB左右。

确认安装选项,点击“Install”开始安装。

然后就是比较漫长的安装过程,静待安装结束。

最后,点击“Finish”完成安装。

安装完成之后,打开Anaconda Navigator,进入“Environment”查看环境配置。

我们可以看到,Anaconda已经自动安装了包括Python在内的519个软件包,其中Python的版本为3.11.5,提示有可用更新,目前的最新版本应该是3.12.0,我们查看一下Python的版本确认一下。

然后我们点击页面下方的“Create”来创建一个新环境,指定名称,并选择已经安装的Python版本,点击“Create”完成创建。

可以看到,新的环境创建完成之后,仅仅包含了15个软件包。

然后点击新环境后面的启动按钮,选择“Open Terminal”打开命令行终端。

然后输入以下命令来激活testtensorflow环境:

activate testtensorflow

安装TensorFlow Benchmarks需要先安装TensorFlow,接下来,在激活的testtensorflow环境下,使用以下命令来安装TensorFlow。

pip install tensorflow

软件包比较大,可能需要比较长的时间。

安装完成后,还是点击新环境后面的启动按钮,这次选择“Open with Python”进入Python视图,输入以下命令检测GPU状态。

import tensorflow as tf
tf.test.is_gpu_available()

完蛋,应该就是之前修改GPU的工作模式为WDDM导致的切换到WDDM模式,Tesla M4可以用于本地显示输出了!

这下好了,遗留两个问题,一是pip安装的下载速度太慢,二是要修改GPU的工作模式为TCC,或者说是不修改工作模式为WDDM,我们下次再试一下。


相关实践学习
基于阿里云DeepGPU实例,用AI画唯美国风少女
本实验基于阿里云DeepGPU实例,使用aiacctorch加速stable-diffusion-webui,用AI画唯美国风少女,可提升性能至高至原性能的2.6倍。
相关文章
|
3月前
|
并行计算 TensorFlow 算法框架/工具
win10上使用gpu版的tensorflow
win10上使用gpu版的tensorflow
|
3月前
|
编译器 TensorFlow 算法框架/工具
windows部署tensorflow serving
windows部署tensorflow serving
|
3月前
|
人工智能 机器人 Serverless
魔搭大模型一键部署到阿里云函数计算,GPU 闲置计费功能可大幅降低开销
魔搭大模型一键部署到阿里云函数计算,GPU 闲置计费功能可大幅降低开销
583 2
|
4月前
|
并行计算 TensorFlow 算法框架/工具
TensorFlow识别GPU难道就这么难吗?还是我的GPU有问题?
TensorFlow识别GPU难道就这么难吗?还是我的GPU有问题?
|
1月前
|
运维 监控 Serverless
一键开启 GPU 闲置模式,基于函数计算低成本部署 Google Gemma 模型服务
本文介绍如何使用函数计算 GPU 实例闲置模式低成本、快速的部署 Google Gemma 模型服务。
164782 57
|
3月前
|
TensorFlow 算法框架/工具 数据安全/隐私保护
如何在云服务器使用docker快速部署jupyter web服务器(Nginx+docker+jupyter+tensorflow)
如何在云服务器使用docker快速部署jupyter web服务器(Nginx+docker+jupyter+tensorflow)
89 0
|
3月前
|
TensorFlow 网络安全 算法框架/工具
tensorflow的模型使用flask制作windows系统服务
tensorflow的模型使用flask制作windows系统服务
|
3月前
|
负载均衡 算法 调度
龚大视频学习笔记:上帝视角看GPU(3):部署到硬件
龚大视频学习笔记:上帝视角看GPU(3):部署到硬件
84 0
|
4月前
|
机器学习/深度学习 存储 弹性计算
阿里云GPU云服务器有哪些版本
阿里云GPU云服务器有哪些版本
|
4月前
|
机器学习/深度学习 人工智能 弹性计算
阿里云GPU云服务器有哪些方案
阿里云GPU云服务器有哪些方案

热门文章

最新文章