概述
步骤如下:
- 安装NVIDIA 驱动
- 安装NVIDIA Cuda
- 安装NVIDIA CuDNN
- 安装GPU版本的PyTorch
- 卸载NVIDIA Cuda
零.安装NVIDIA 驱动
1、查看自己机器上的显卡型号 lspci -vnn | grep VGA -A 12
2、下载显卡驱动 https://www.geforce.cn/drivers,或者https://www.nvidia.cn/Download/index.aspx?lang=cn
3、安装显卡驱动
1)卸载之前安装的NVIDIA驱动,$sudo apt-get --purge remove nvidia-*
2)修改配置文件blackconf,
$sudo gedit /etc/modprobe.d/blacklist.conf
在最后添加几行:
blacklist vga16fb blacklist nouveau blacklist rivafb blacklist nvidiafb blacklist rivatv options nouveau modeset=0
保存退出。
3)更新系统,$sudo update-initramfs -u
重启系统。(必须要)
4)验证nouveau是否被禁用,$lsmod | grep nouveau
如果没有任何输出,则表示禁用成功。
5)按ctrl+alt+F1进入命令行界面。
6)关闭图形界面,$sudo service lightdm stop
7)cd指令进入到.run文件目录,
给.run文件赋予执行权限, $sudo chmod a+x NVIDIA-Linux-x86_64-410.93.run
进行安装,$sudo ./NVIDIA-Linux-x86_64-410.93.run -no-x-check -no-nouveau -no-opengl-files
-no-x-check 安装驱动时关闭X服务,
-no-nouveau 安装驱动时禁用nouveau
-no-opengl-files 只安装驱动,不安装opengl文件。
如果报错:the distribution-provided pre-install script failed! 不用理会,继续安装。
安装过程中的选项:
The distribution-provided pre-install script failed! Are you sure you want to continue? 选择 yes 继续。
Would you like to register the kernel module souces with DKMS? This will allow DKMS to automatically build a new module, if you install a different kernel later? 选择 No 继续。
问题没记住,选项是:install without signing
问题大概是:Nvidia’s 32-bit compatibility libraries? 选择 No 继续。
Would you like to run the nvidia-xconfigutility to automatically update your x configuration so that the NVIDIA x driver will be used when you restart x? Any pre-existing x confile will be backed up. 选择 Yes 继续
这些选项如果选择错误可能会导致安装失败,没关系,只要前面不出错,多尝试几次就好。
8)切换到图形界面,$sudo service lightdm start
9)验证驱动是否安装成功, $nvidia-smi
一.安装NVIDIA Cuda
安装cuda10.0
1.官网下载cuda安装文件
<1>.进入cuda官网下载,选择10.0版本:
<2>.选择这里下载,可使用win下迅雷工具下载,速度快。
2.开始安装cuda10.0
<1>.拷贝完成.run文件后,进入所在目录,对文件添加可执行权限:
sudo chmod a+x cuda_10.0.130_410.48_linux.run
<2>.执行安装: sudo sh cuda_10.0.130_410.48_linux.run
<3>.提示阅读协议,直接Ctrl+C跳过。跳出协议,输入accept。
<4>.提示安装NVIDIA驱动,选择n,其他都选择y。
<5>.安装成功
安装完成后请跳到 三、配置环境变量。
二、安装cuda10.1
1.官网下载cuda安装文件
<1>.首先进入NVIDIA官网cuda下载所需安装文件,这里选择.run文件,以cuda10.1版本为例。
<2>.如图中,官方提供了命令行下载和安装方式:
wget http://developer.download.nvidia.com/compute/cuda/10.1/Prod/local_installers/cuda_10.1.243_418.87.00_linux.run sudo sh cuda_10.1.243_418.87.00_linux.run
注:在命令行下下载速度非常慢,我这2.4G的文件下完需要8h,所以另一个办法,找一台windows电脑用迅雷,复制wget后面的网址用迅雷下载,拷贝文件到ubuntu中。
2.开始安装cuda10.1
<1>.拷贝完成.run文件后,进入所在目录,对文件添加可执行权限:
sudo chmod a+x cuda_10.1.243_418.87.00_linux.run
<2>.执行安装: sudo sh cuda_10.1.243_418.87.00_linux.run
<3>.跳出协议,输入accept。
注意,这里不要选择安装Nvidia显卡驱动,将第一项用空格键取消X号,再选择install:
安装完成后请跳到 三、配置环境变量。