Ubuntu配置pytorch gpu环境(含Cuda+Cudnn+pytorch-gpu+卸载)(上)

简介: Ubuntu配置pytorch gpu环境(含Cuda+Cudnn+pytorch-gpu+卸载)(上)

概述


步骤如下:


  • 安装NVIDIA 驱动
  • 安装NVIDIA Cuda
  • 安装NVIDIA CuDNN
  • 安装GPU版本的PyTorch
  • 卸载NVIDIA Cuda


零.安装NVIDIA 驱动


1、查看自己机器上的显卡型号 lspci -vnn | grep VGA -A 12


2、下载显卡驱动 https://www.geforce.cn/drivers,或者https://www.nvidia.cn/Download/index.aspx?lang=cn


20200712222419313.png


3、安装显卡驱动


1)卸载之前安装的NVIDIA驱动,$sudo apt-get --purge remove nvidia-*


2)修改配置文件blackconf,


$sudo gedit /etc/modprobe.d/blacklist.conf


在最后添加几行:


blacklist vga16fb
blacklist nouveau
blacklist rivafb
blacklist nvidiafb
blacklist rivatv
options nouveau modeset=0


保存退出。


3)更新系统,$sudo update-initramfs -u


重启系统。(必须要)


4)验证nouveau是否被禁用,$lsmod | grep nouveau


如果没有任何输出,则表示禁用成功。


20200712222657278.png


5)按ctrl+alt+F1进入命令行界面。


6)关闭图形界面,$sudo service lightdm stop


7)cd指令进入到.run文件目录,


给.run文件赋予执行权限, $sudo chmod a+x NVIDIA-Linux-x86_64-410.93.run


进行安装,$sudo ./NVIDIA-Linux-x86_64-410.93.run -no-x-check -no-nouveau -no-opengl-files


-no-x-check 安装驱动时关闭X服务,


-no-nouveau 安装驱动时禁用nouveau


-no-opengl-files 只安装驱动,不安装opengl文件。


如果报错:the distribution-provided pre-install script failed! 不用理会,继续安装。


安装过程中的选项:


The distribution-provided pre-install script failed! Are you sure you want to continue? 选择 yes 继续。


Would you like to register the kernel module souces with DKMS? This will allow DKMS to automatically build a new module, if you install a different kernel later? 选择 No 继续。


问题没记住,选项是:install without signing


问题大概是:Nvidia’s 32-bit compatibility libraries? 选择 No 继续。


Would you like to run the nvidia-xconfigutility to automatically update your x configuration so that the NVIDIA x driver will be used when you restart x? Any pre-existing x confile will be backed up. 选择 Yes 继续


这些选项如果选择错误可能会导致安装失败,没关系,只要前面不出错,多尝试几次就好。


8)切换到图形界面,$sudo service lightdm start


9)验证驱动是否安装成功, $nvidia-smi


20200712222959413.png


一.安装NVIDIA Cuda


安装cuda10.0


1.官网下载cuda安装文件


<1>.进入cuda官网下载,选择10.0版本:


20200705174950471.png


<2>.选择这里下载,可使用win下迅雷工具下载,速度快。


20200705175001643.png


2.开始安装cuda10.0


<1>.拷贝完成.run文件后,进入所在目录,对文件添加可执行权限:

sudo chmod a+x cuda_10.0.130_410.48_linux.run


<2>.执行安装: sudo sh cuda_10.0.130_410.48_linux.run


<3>.提示阅读协议,直接Ctrl+C跳过。跳出协议,输入accept。


20200705175107588.png


<4>.提示安装NVIDIA驱动,选择n,其他都选择y。


20200705175116742.png


<5>.安装成功


2020070517512382.png


安装完成后请跳到 三、配置环境变量。


二、安装cuda10.1


1.官网下载cuda安装文件


<1>.首先进入NVIDIA官网cuda下载所需安装文件,这里选择.run文件,以cuda10.1版本为例。


20200705175248915.png20200705175254778.png


<2>.如图中,官方提供了命令行下载和安装方式:


wget http://developer.download.nvidia.com/compute/cuda/10.1/Prod/local_installers/cuda_10.1.243_418.87.00_linux.run
sudo sh cuda_10.1.243_418.87.00_linux.run


注:在命令行下下载速度非常慢,我这2.4G的文件下完需要8h,所以另一个办法,找一台windows电脑用迅雷,复制wget后面的网址用迅雷下载,拷贝文件到ubuntu中。


2.开始安装cuda10.1


<1>.拷贝完成.run文件后,进入所在目录,对文件添加可执行权限:

sudo chmod a+x cuda_10.1.243_418.87.00_linux.run


<2>.执行安装: sudo sh cuda_10.1.243_418.87.00_linux.run


<3>.跳出协议,输入accept。


20200705175439934.png


注意,这里不要选择安装Nvidia显卡驱动,将第一项用空格键取消X号,再选择install:


20200705175508351.png


安装完成后请跳到 三、配置环境变量。


相关实践学习
部署Stable Diffusion玩转AI绘画(GPU云服务器)
本实验通过在ECS上从零开始部署Stable Diffusion来进行AI绘画创作,开启AIGC盲盒。
相关文章
|
2月前
|
并行计算 Ubuntu Linux
Ubuntu学习笔记(五):18.04安装多版本CUDA
这篇博客文章介绍了在Ubuntu 18.04系统上如何安装和切换不同版本的CUDA,以及如何安装不同版本的cuDNN。
231 2
|
2月前
|
PyTorch Linux 算法框架/工具
pytorch学习一:Anaconda下载、安装、配置环境变量。anaconda创建多版本python环境。安装 pytorch。
这篇文章是关于如何使用Anaconda进行Python环境管理,包括下载、安装、配置环境变量、创建多版本Python环境、安装PyTorch以及使用Jupyter Notebook的详细指南。
300 1
pytorch学习一:Anaconda下载、安装、配置环境变量。anaconda创建多版本python环境。安装 pytorch。
|
2月前
|
并行计算 PyTorch TensorFlow
Ubuntu安装笔记(一):安装显卡驱动、cuda/cudnn、Anaconda、Pytorch、Tensorflow、Opencv、Visdom、FFMPEG、卸载一些不必要的预装软件
这篇文章是关于如何在Ubuntu操作系统上安装显卡驱动、CUDA、CUDNN、Anaconda、PyTorch、TensorFlow、OpenCV、FFMPEG以及卸载不必要的预装软件的详细指南。
4564 3
|
16天前
|
Ubuntu
ubuntu和debian 的安装包dpkg管理命令对安装包进行安装,查询,卸载
Ubuntu dpkg 软件包管理命令概览:安装、卸载、查看和配置软件包。包括解决依赖、强制卸载、列出及过滤已安装包、查看包详情等操作。
49 10
|
2月前
|
PyTorch TensorFlow 算法框架/工具
Jetson环境安装(一):Ubuntu18.04安装pytorch、opencv、onnx、tensorflow、setuptools、pycuda....
本文提供了在Ubuntu 18.04操作系统的NVIDIA Jetson平台上安装深度学习和计算机视觉相关库的详细步骤,包括PyTorch、OpenCV、ONNX、TensorFlow等。
80 1
Jetson环境安装(一):Ubuntu18.04安装pytorch、opencv、onnx、tensorflow、setuptools、pycuda....
|
2月前
|
机器学习/深度学习 缓存 PyTorch
pytorch学习一(扩展篇):miniconda下载、安装、配置环境变量。miniconda创建多版本python环境。整理常用命令(亲测ok)
这篇文章是关于如何下载、安装和配置Miniconda,以及如何使用Miniconda创建和管理Python环境的详细指南。
447 0
pytorch学习一(扩展篇):miniconda下载、安装、配置环境变量。miniconda创建多版本python环境。整理常用命令(亲测ok)
|
2月前
|
Python
Jetson环境安装(二):ubuntu18.0卸载和安装python3
在Jetson Nano上如何卸载Python 3.7并重新安装Python 3.7.0版本的详细步骤,包括卸载命令、安装依赖库、下载和编译Python源码以及建立软链接等。
68 2
|
2月前
|
并行计算 Ubuntu 算法
Ubuntu18 服务器 更新升级CUDA版本 pyenv nvidia ubuntu1804 原11.2升级到PyTorch要求12.1 全过程详细记录 apt update
Ubuntu18 服务器 更新升级CUDA版本 pyenv nvidia ubuntu1804 原11.2升级到PyTorch要求12.1 全过程详细记录 apt update
112 0
|
4月前
|
并行计算 Ubuntu PyTorch
Ubuntu下CUDA、Conda、Pytorch联合教程
本文是一份Ubuntu系统下安装和配置CUDA、Conda和Pytorch的教程,涵盖了查看显卡驱动、下载安装CUDA、添加环境变量、卸载CUDA、Anaconda的下载安装、环境管理以及Pytorch的安装和验证等步骤。
735 1
Ubuntu下CUDA、Conda、Pytorch联合教程
|
4月前
|
PyTorch 算法框架/工具 Python
安装anaconda配置pytorch虚拟环境遇到的问题及解决办法
本文介绍了在配置Anaconda时遇到`PackagesNotFoundError`的问题,并提供了通过添加`conda-forge`通道和创建指定Python版本的PyTorch虚拟环境来解决这个问题的方法。