10个深度学习软件的安装指南(附代码)

简介:

由于近期论文的需要,我搭建了一个基于 Ubuntu 和英伟达的深度学习环境。尽管已经有很多非常棒的关于英伟达驱动和 CUDA 的安装指南, 但依然没有详尽的深度学习环境搭建指南。另外,我需要查阅很多文档来熟悉细节,其中一些细节还有待完善,甚至还有一些包含语法错误。因此我决定把我这段时间查阅的文档(见参考链接)做个总结。

该指南会安装如下内容

  • 操作系统(Ubuntu)
  • 4 个驱动和库
  • 5 个 Python DL 库(TensorFlow,Theano,CNTK,Keras 和 PyTorch)

下面显示了每个包的依赖项。Python 深度学习库只需安装一个,你可以选择一个喜欢的进行安装。

下面是更为详细的组件清单:

  1. Ubuntu(v16.04.3)- 操作系统,进程管理。
  2. 英伟达显卡驱动(v375)- 允许操作系统操作显卡。
  3. CUDA(v8.0)- 显卡 c 语言库。提供了统一不同架构的标准。
  4. cuDNN(v6.0.21)- 基于 CUDA 的深度神经网络库。
  5. pip(v9.0.1)- Python 包管理工具。
  6. TensorFlow(v1.3)- 谷歌开发的深度学习库。
  7. Theano(v0.9.0)- 运行于 GPU 的数学基础库。
  8. CNTK(v2.2)- 微软搜索开发的深度学习框架。
  9. Keras(v2.0.8)- 深度学习库包装层(对外提供统一调用,内部可使用不同的深度学习框架),支持 TensorFlow,Theano 和 CNTK。
  10. PyTorch(v0.2.0)- GPU 加速运算的动态深度学习库。

1. 安装 Ubuntu 16.04.3

下面介绍纯净安装(会覆盖以前的分区和系统)。

v 16.04.3 是最新的 LTS(长期支持)版本,因此我们选择从 USB 启动盘安装。当按下电源键后进入启动菜单选择从 USB 启动。

我的设备包含两块硬盘,1TB 的机械硬盘和 256GB 的固态硬盘。我把系统安装在了机械硬盘上,固态硬盘用于数据存储,这样能提高模型训练速度。安装过程中我选择了创建 3 个分区。

启动分区(128GB):包含系统文件,程序设置和文档。

交换分区(2 倍内存大小):对于我该分区大小 128GB。交换分区是用于扩展内存的虚拟内存。

用户分区(剩余):剩余的 744GB 为用户分区。

安装完成后,运行以下命令升级内核。

086697f996e5d997ddb574aed5346d3b68635a4c

2. 英伟达显卡驱动

Ubuntu 安装完成后会发现无法修改屏幕分辨率。这是因为视频屏幕数据源 GPU 没有驱动和没有被正确的配置。

有从 Ubuntu 仓库和 source 两种方式安装驱动。第一种方式更简单,但经常需要重新安装。调用 sudo apt-get update 和 sudo apt-get upgrade 两个命令会升级内核。这不会升级显卡驱动并会造成 GUI 加载失败。从 source 进行安装避免了这个问题。

从包安装 v375(更简单)

下面命令列出了与你系统兼容的所有驱动版本。输出会打印两个版本数字:最新和长期支持的发行版本号。打印的版本号在输出的最前面,向上滑动查看。

39a05408e29ccaf90d58a24283d64b637da7b800

添加并安装仓库源。使用下面命令修改想要安装的驱动版本号。建议修改为最新的长期支持版本 -375。

609269b2103d0bd0c703354cd39c053fa7c3e004

重启电脑重新配置屏幕输出源。

035827a280d545c5ab11cff1219f873345cfe42a

安装完成后,显示器应该可以识别你使用的监视器,可通过修改显示器配置,分辨率和方向来检测驱动是否安装成功。

从英伟达源安装 v384.90(困难)

从英伟达官网下载最新驱动。我选择的是:

GeForce -> GeForce 10 Series -> GeForce GTX 1080 -> Linux 64 bit -> English (UK)

以下命令为可选项,可允许编译为 32 位架构和 GUI 开发者版本。

dfd78107994f91e5b1bc3763a8f393eaf53a7a3f

按下 CTRL+ALT+F1 并登陆会从 GUI 切换到终端。为了重新构建屏幕输出源,必须暂停用户界面。

c48a1cb402751236ad7275645e2801069a81c0d8

要是上面命令不起作用,新版 Ubuntu 可使用 systemctl 替代 lightdm。然后修改 runfile 为可执行并执行。

e33ab177cca0a845b15242c3f0044e949ff1b95b

运行时有可能会遇到 pre-install script failed 的错误信息。这是因为 pre-install 包含了 exit 1 命令因此该错误信息可以直接忽略。该命令的作用是为了确保你真的想要安装驱动。

--dkms 选项(默认打开)用于防止内核通过安装驱动到模块进行更新时,该驱动会重新安装。内核更新时,dkms 会触发驱动重新编译到新内核模块栈。

如果 BIOS 没有禁用安全启动会导致安装失败。重启电脑进入 BIOS,禁用安全启动。

如果安装成功,重启 GUI。

42b959f805c651f11621f91a35c31f1b51b08115

卸载:shell sudo ./NVIDIA-Linux-x86_64-384.90.run --uninstall

认证


确保下面命令能够识别正确的 GPU 版本

fa6a73edd3412d8e479ecb610dd6453d43153554

nvidia-smi确保驱动版本号正确

70f93f2bf05eb150069d4925429ffd029fc35ac8

3. 安装 CUDA8.0


从英伟达官网下载 CUDA 的运行文件。如下选择:

Linux -> x86_64 -> Ubuntu -> 16.04 -> .deb(network)

切换目录到.deb 文件,使用以下命令解包、更新包列表并安装 CUDA。

d340d02378997fe3b126c729c52d8cd0ecc4b3a1

添加该库到 bash 路径以便其他应用也能找到。

765433efc7627bb0ca170338d4a0a185a402529f

输入 nvcc -V 命令确保英伟达 c 编译器版本和 CUDA 版本匹配。

输入 sudo shutdown -r now 重启电脑完成安装。


可选:检测 CUDA 安装


可通过运行例子来检测安装是否成功。下面命令创建一个 test_CUDA 文件夹用于存储示例。

e92d9ce155bc787f814d815d8c77d7a0c1c0cf3b

在子文件夹 NVIDIA_CUDA-8.0_Samples/3_Imaging/cudaDecodeGL 下包含一个 findgllib.mk 文件。文件的第 61 行,30 列是硬编码的英伟达驱动版本号 367,该版本号需要修改为之前安装的版本号。

编译示例

cd ../.. && make

现在可以在 NVIDIA_CUDA-8.0_Samples 中运行你的核心内容。NVIDIA_CUDA-8.0_Samples/bin/x86_64/linux/release 路径下有两个非常有用的脚本。./deviceQuery 可打印出 GPU 信息,./bandwidthTest 可打印出带宽。

参考链接:英伟达 CUDA 安装手册

4. 安装 cuDNN6.0.21

在英伟达官网,选中同意条款注册成为开发者。为匹配 CUDA8.0,在 cuDNN v6.0.21 下拉菜单中下载:

  1. 针对 Ubuntu16.04 的 cuDNN v6.0 运行时库(Deb)

  2. 针对 Ubuntu16.04 的 cuDNN v6.0 开发者库(Deb)

  3. 针对 Ubuntu16.04 的 cuDNN v6.0 代码示例和用户指南(Deb)

.deb 可以纯净安装,相较.tar 来说是更好的选择。使用下面命令会安装三个包:

00e4476b59da7bdcfb9ce7dcd54ad7b82c5266a9

测试 cuDNN

拷贝已安装的示例代码到可读文件夹下,编译并运行 mnistCNN。

8dcaea25eac25f07441f7ccdae8e0c174ff0c056

运行正常脚本会返回 Test passed!

卸载 cudnn

下面命令可以卸载安装好的三个包。另外,如果创建过示例,记得运行 rm -r ~/cudnn_samples_v6。

129ee4de205f42034ced8ecc9fd12025d7babcdd

参考链接:cuDNN 安装指南

5. 安装 pip9.0.1

Pip 更新非常频繁,基本每两周就会更新一次。建议使用最新版本。

下面命令用来安装 pip 和更新到最新版本。

af497b53903d1c145b0519c75570b58bcc1bf9d8

为确保是最新版本,运行 pip -V 来检查版本号。

6. 安装 Tensorflow1.3.0

pip install tensorflow-gpu

为验证是否安装成功,使用 $python 开启 python,运行以下脚本确保输出打印 Hello, TensorFlow!

209f13f7aeac528a90016c5ac44db4a8f4d6d254

参考链接:Ubuntu 上如何安装 tensorflow

7. 安装 Theano 0.10

Theano 需要下面系统依赖

2a41f48a3295c7d6e458797d534e64e0b31a8fe9

和 Python 依赖。

d4928f319a998acc37027498f00178df7ced011a

libgpuarray 允许 Theano 使用 GPU,libgpuarray 只能从源码编译。首先 下载源码

2342d193684272533779cef090a89b90136fbd2e

编译到指定文件夹 Build 下。

9e467620a05f00750449fd3dfc7a5c2b884f2cad

然后编译到 python 包中

d536225a4874a3f0e1f2e229ef7b6ed7dbb1a49d

添加下面命令到~/.bashrc 中以便 python 能够找到该库。

e34f9a8399bac1c15324fa23f106ae4f502576a1

最后安装 Theano

5cef84575e572c93939cbbcd0fab1a2f85ab165d

验证是否安装成功,创建一个 test_theano.py 文件,将内容拷贝至该文件。确保 THEANO_FLAGS=device=cuda0 python test_theano.py 命令运行成功并输出 Used the gpu。

参考链接:Theano 0.9.0 文档

8. 安装 CNTK2.2

054a77dcd45f11a35fd090a4c3c44c1329bd3544

验证是否安装成功,运行 python -c "import cntk; print(cntk.version)"查看是否打印 2.2。

参考链接:如何配置 CNTK

9. 安装 Keras2.0.8

sudo pip install keras

从 $python 环境运行 import keras 验证是否安装成功。

参考链接:Keras 安装

10. 安装RyTorch0.2.0

PyTorch 依赖两个库 torchvision 和 torch。

3f4b83e24d196645d151e99f22506e68df1cb4c4

安装成功后下面脚本应该打印出一个随机的浮点数。

84198dd9589adaf751cbff00517c25523efcda00

参考链接:PyTorch 主页


总结

整个安装过程最困难的部分是找出英伟达驱动和深度学习库之间的依赖项和找到最有效的长期支持安装教程。最简单的部分是安装文档更新活跃且详细的 Python 包。

尽管阅读文档浏览源码很费时间,但了解每个包的作用和如何构建对了解整个 Ubuntu 生态是很有帮助的。


原文发布时间为:2017-11-18

本文来自云栖社区合作伙伴“数据派THU”,了解相关信息可以关注“数据派THU”微信公众号

相关实践学习
部署Stable Diffusion玩转AI绘画(GPU云服务器)
本实验通过在ECS上从零开始部署Stable Diffusion来进行AI绘画创作,开启AIGC盲盒。
相关文章
|
2月前
|
机器学习/深度学习 算法 测试技术
深度学习环境搭建笔记(二):mmdetection-CPU安装和训练
本文是关于如何搭建深度学习环境,特别是使用mmdetection进行CPU安装和训练的详细指南。包括安装Anaconda、创建虚拟环境、安装PyTorch、mmcv-full和mmdetection,以及测试环境和训练目标检测模型的步骤。还提供了数据集准备、检查和网络训练的详细说明。
125 5
深度学习环境搭建笔记(二):mmdetection-CPU安装和训练
|
2月前
|
机器学习/深度学习 并行计算 PyTorch
深度学习环境搭建笔记(一):detectron2安装过程
这篇博客文章详细介绍了在Windows环境下,使用CUDA 10.2配置深度学习环境,并安装detectron2库的步骤,包括安装Python、pycocotools、Torch和Torchvision、fvcore,以及对Detectron2和PyTorch代码的修改。
321 1
深度学习环境搭建笔记(一):detectron2安装过程
|
3月前
|
机器学习/深度学习 人工智能 自然语言处理
软件工程师,入门下深度学习吧
软件工程师,入门下深度学习吧
63 9
|
4月前
|
机器学习/深度学习 人工智能 PyTorch
【Deepin 20深度探索】一键解锁Linux深度学习潜能:从零开始安装Pytorch,驾驭AI未来从Deepin出发!
【8月更文挑战第2天】随着人工智能的迅猛发展,深度学习框架Pytorch已成为科研与工业界的必备工具。Deepin 20作为优秀的国产Linux发行版,凭借其流畅的用户体验和丰富的软件生态,为深度学习爱好者提供理想开发平台。本文引导您在Deepin 20上安装Pytorch,享受Linux下的深度学习之旅。
96 12
|
6月前
|
机器学习/深度学习 存储 监控
基于YOLOv8的多目标检测与自动标注软件【python源码+PyqtUI界面+exe文件】【深度学习】
基于YOLOv8的多目标检测与自动标注软件【python源码+PyqtUI界面+exe文件】【深度学习】
|
6月前
|
机器学习/深度学习 算法 数据可视化
【深度学习实战】基于深度学习的图片风格快速迁移软件(Python源码+UI界面)
【深度学习实战】基于深度学习的图片风格快速迁移软件(Python源码+UI界面)
|
7月前
|
机器学习/深度学习 TensorFlow API
Python安装TensorFlow 2、tf.keras和深度学习模型的定义
Python安装TensorFlow 2、tf.keras和深度学习模型的定义
|
7月前
|
机器学习/深度学习 人工智能 PyTorch
【Hello AI】安装和使用AIACC-AGSpeed(优化PyTorch深度学习模型)
AIACC-AGSpeed(简称AGSpeed)专注于优化PyTorch深度学习模型在阿里云GPU异构计算实例上的计算性能,相比原始的神龙AI加速引擎AIACC,可以实现无感的计算优化性能。本文为您介绍安装和使用AGSpeed的方法。
|
7月前
|
机器学习/深度学习 Shell 数据安全/隐私保护
深度学习-虚拟机当服务器的安装环境
深度学习-虚拟机当服务器的安装环境
|
机器学习/深度学习 监控 算法
利用BP算法优化企业电脑监控软件:一览深度学习在安全防护中的崭新应用
不知道大家有没有听说过BP(Backpropagation)神经网络算法,听上去比较高级,但其实也是挺酷的!而且BP算法还可以在企业电脑监控软件方面大显身手哦。想知道怎么玩转它吗?别担心,接下来咱们就用通俗易懂的语言来了解一下BP算法在企业电脑监控软件中的作用——
116 0

热门文章

最新文章