Ubuntu 18.04 LTS+GTX1080Ti+CUDA10.0 深度学习主机环境搭建

简介: 前言由于之前的主机存在运行docker自动重启的问题,跑模型没问题,排查之后没有发现问题所在,所以最后决定升级技嘉主板的bios并重新安装系统和环境。1 硬件环境显卡:GTX1080Ti内存:32G硬盘:256G SSD+1T机械2 安装Ubuntu 18.

前言

由于之前的主机存在运行docker自动重启的问题,跑模型没问题,排查之后没有发现问题所在,所以最后决定升级技嘉主板的bios并重新安装系统和环境。

1 硬件环境

显卡:GTX1080Ti
内存:32G
硬盘:256G SSD+1T机械

2 安装Ubuntu 18.04 LTS

2.1 下载官方镜像

下载地址:https://link.zhihu.com/?target=https%3A//ubuntu.com/download/desktop

2.2 制作USB启动盘

使用Refus烧录镜像到U盘,Refus下载地址:Refus
image

2.3 安装系统

安装系统的步骤不在这里赘述,其他的博客[1]写的很好了,在这里提几个关键点,我的磁盘分区方案是:

  1. 2G的EFI分区
  2. 32G的swap分区(和内存大小一样)
  3. 剩下的ssd存储空间分给根目录
  4. home挂载在机械硬盘下

之后按照步骤直到完成系统的安装。

3 安装显卡驱动

在这一步花费了大量时间,根据网上搜索的结果,大部分博客都是总结了显卡驱动安装的三种方法:

1.使用标准Ubuntu仓库进行自动化安装
2.使用PPA仓库进行自动化安装
3.使用官方的NVIDIA驱动进行手动安装

在尝试这三种方法之后,使用nvidia-smi显示连接不到显卡,重启机器也是直接进入命令行模式。

所以,换了另外一种方法,具体过程如下:

首先,在系统安装完成之后不要换源,执行下面的命令去检查软件的更新

sudo apt-get update

之后在应用列表中打开Software & Updates,点击Additional Drivers,这个时候,官方推荐的列表就会显示了,其实这个跟执行

ubuntu-drivers devices

是一样的显示效果,但是在Software & Updates中操作会更稳妥一些。

image
点击 Apply Changes,等待进度条走完重启机器就安装完成了。执行nvidia-smi,显示如图,表示成功安装显卡驱动。

image

4 安装CUDA10.0

下载地址:https://developer.nvidia.com/cuda-toolkit-archive
选择CUDA 10.0
image
image
建议下载runfile,安装命令如下:

sudo sh cuda_<version>_linux.run

在安装过程中,

  • 选择是否安装显卡驱动时选择否
  • 是否构建/usr/local/cuda软链接时选择是
  • 其他选项按需选择
    安装完成后,需要在~/.bashrc(/home/用户名/.bashrc,.表示隐藏文件,直接用vi打开这个文件就行)文件中添加如下语句
export PATH=/usr/local/cuda-10.0/bin${PATH:+:${PATH}}
export LD_LIBRARY_PATH=/usr/local/cuda-10.0/lib64${LD_LIBRARY_PATH:+:${LD_LIBRARY_PATH}}

5 安装cuDNN

cuDNN的下载需要匹配CUDA的版本,也需要适配接下来需要安装的TensorFlow的版本。
image
cuDNN的下载地址:https://link.zhihu.com/?target=https%3A//developer.nvidia.com/rdp/cudnn-download

6 安装深度学习套件

6.1 安装anaconda

官方下载地址:
https://link.zhihu.com/?target=https%3A//www.anaconda.com/distribution/%23linux
安装命令:

bash Anaconda3-5.3.0-Linux-x86_64.sh

安装过程中询问是否将anaconda的安装位置写入.bashrc选择是。
image
为conda换源:

conda config --add channels https://mirrors.tuna.tsinghua.edu.cn/anaconda/pkgs/free/
conda config --add channels https://mirrors.tuna.tsinghua.edu.cn/anaconda/pkgs/main/
conda config --set show_channel_urls yes

6.2 安装TensorFlow.

官方教程:https://link.zhihu.com/?target=https%3A//tensorflow.google.cn/install/pip
首先,下载TensorFlow的离线镜像
image
新建虚拟环境

conda create -n keras pip python=3.6

激活虚拟环境

source activate keras

安装TensorFlow

pip install --ignore-installed --upgrade packageURL

测试

import tensorflow as tf
hello = tf.constant('first tensorflow')
sess = tf.Session()
print sess.run(hello)

参考链接
[1]LotusPanda:[Ubuntu18+RTX2080Ti]从0开始搭建深度学习环境TensorFlow+PyTorch

目录
相关文章
|
8月前
|
Kubernetes Ubuntu 应用服务中间件
在Ubuntu22.04 LTS上搭建Kubernetes集群
在Ubuntu22.04.4上安装Kubernetes v1.28.7,步骤超详细
2803 3
在Ubuntu22.04 LTS上搭建Kubernetes集群
|
8月前
|
Ubuntu
永久修改Ubuntu的主机名称
永久修改Ubuntu的主机名称
58 2
|
3月前
|
机器学习/深度学习 算法 测试技术
深度学习环境搭建笔记(二):mmdetection-CPU安装和训练
本文是关于如何搭建深度学习环境,特别是使用mmdetection进行CPU安装和训练的详细指南。包括安装Anaconda、创建虚拟环境、安装PyTorch、mmcv-full和mmdetection,以及测试环境和训练目标检测模型的步骤。还提供了数据集准备、检查和网络训练的详细说明。
203 5
深度学习环境搭建笔记(二):mmdetection-CPU安装和训练
|
5月前
|
Ubuntu 网络安全 数据安全/隐私保护
如何在 Ubuntu 上创建一个 SSH CA 以验证主机和客户端
如何在 Ubuntu 上创建一个 SSH CA 以验证主机和客户端
110 0
|
2月前
|
Ubuntu 网络协议 关系型数据库
超聚变服务器2288H V6使用 iBMC 安装 Ubuntu Server 24.04 LTS及后续系统配置
【11月更文挑战第15天】本文档详细介绍了如何使用iBMC在超聚变服务器2288H V6上安装Ubuntu Server 24.04 LTS,包括连接iBMC管理口、登录iBMC管理界面、配置RAID、安装系统以及后续系统配置等步骤。
312 4
|
2月前
|
Ubuntu Linux 网络安全
Ubuntu 22.04 LTS有哪些新特性
Ubuntu 22.04 LTS有哪些新特性
|
3月前
|
机器学习/深度学习 并行计算 PyTorch
深度学习环境搭建笔记(一):detectron2安装过程
这篇博客文章详细介绍了在Windows环境下,使用CUDA 10.2配置深度学习环境,并安装detectron2库的步骤,包括安装Python、pycocotools、Torch和Torchvision、fvcore,以及对Detectron2和PyTorch代码的修改。
721 1
深度学习环境搭建笔记(一):detectron2安装过程
|
3月前
|
Web App开发 Ubuntu 前端开发
【踩坑记】Ubuntu 20.04.6 LTS下编译安装gcc 4.4.0
【踩坑记】Ubuntu 20.04.6 LTS下编译安装gcc 4.4.0
|
5月前
|
Ubuntu 开发者 Python
|
5月前
|
Ubuntu 安全 Linux
Windows——安装Ubuntu 18.04 LTS
Windows——安装Ubuntu 18.04 LTS
102 1
Windows——安装Ubuntu 18.04 LTS