前面买GPU主要是为了接触一下深度学习(HPE服务器通过显卡直通安装Tesla M4,这算亮机成功了吗?),经过了解,深度学习除了支持Linux系统之外,还支持Windows和macOS系统,那这么看,我完全可以在安装好了驱动的Windows系统上试一下(切换到WDDM模式,Tesla M4可以用于本地显示输出了!)。
而且,为了测试显卡的算力,我打算用比较流行的机器学习库TensorFlow来做个简单测试,TensorFlow提供了一些基准测试脚本,我们可以用它们来比较不同硬件平台上的模型训练速度,并且可以通过设置不同的参数来测试CPU和GPU的性能。
一般来讲,深度学习中广泛使用Python编程语言,跑深度学习就要安装Python,我们可以参考之前的案例自行安装Python(Python办公自动化—环境搭建),并确保安装了常用的科学计算库,如NumPy、Pandas和Matplotlib。当然,我们也可以使用Anaconda等Python发行版来简化库的管理,然后再使用Anaconda来安装深度学习框架TensorFlow,或者PyTorch、Keras等框架。
首先,我们打开Anaconda官网(https://www.anaconda.com/),点击右上角的“Free Download”进入到下载页面。
或者直接打开下载页面(https://www.anaconda.com/download),选择适合自己电脑版本的Anaconda进行下载安装,比如我就选择默认的Windows版本。
安装包比较大,有1 GB多点,可能会下载比较慢,自己想想办法,比如用迅雷下载。下载完成后就可以开始安装了。
首屏直接点击“Next”继续安装。
点击“I Agree”同意用户协议。
确认安装可用的用户,默认选择为所有用户。
软件的占用空间还是比较大的,大约是5.7 GB,实际安装下来,空间大概要8 GB左右。
确认安装选项,点击“Install”开始安装。
然后就是比较漫长的安装过程,静待安装结束。
最后,点击“Finish”完成安装。
安装完成之后,打开Anaconda Navigator,进入“Environment”查看环境配置。
我们可以看到,Anaconda已经自动安装了包括Python在内的519个软件包,其中Python的版本为3.11.5,提示有可用更新,目前的最新版本应该是3.12.0,我们查看一下Python的版本确认一下。
然后我们点击页面下方的“Create”来创建一个新环境,指定名称,并选择已经安装的Python版本,点击“Create”完成创建。
可以看到,新的环境创建完成之后,仅仅包含了15个软件包。
然后点击新环境后面的启动按钮,选择“Open Terminal”打开命令行终端。
然后输入以下命令来激活testtensorflow环境:
activate testtensorflow
安装TensorFlow Benchmarks需要先安装TensorFlow,接下来,在激活的testtensorflow环境下,使用以下命令来安装TensorFlow。
pip install tensorflow
软件包比较大,可能需要比较长的时间。
安装完成后,还是点击新环境后面的启动按钮,这次选择“Open with Python”进入Python视图,输入以下命令检测GPU状态。
import tensorflow as tf tf.test.is_gpu_available()
完蛋,应该就是之前修改GPU的工作模式为WDDM导致的(切换到WDDM模式,Tesla M4可以用于本地显示输出了!)。
这下好了,遗留两个问题,一是pip安装的下载速度太慢,二是要修改GPU的工作模式为TCC,或者说是不修改工作模式为WDDM,我们下次再试一下。