Ubuntu配置pytorch gpu环境(含Cuda+Cudnn+pytorch-gpu+卸载)(上)

简介: Ubuntu配置pytorch gpu环境(含Cuda+Cudnn+pytorch-gpu+卸载)(上)

概述


步骤如下:


  • 安装NVIDIA 驱动
  • 安装NVIDIA Cuda
  • 安装NVIDIA CuDNN
  • 安装GPU版本的PyTorch
  • 卸载NVIDIA Cuda


零.安装NVIDIA 驱动


1、查看自己机器上的显卡型号 lspci -vnn | grep VGA -A 12


2、下载显卡驱动 https://www.geforce.cn/drivers,或者https://www.nvidia.cn/Download/index.aspx?lang=cn


20200712222419313.png


3、安装显卡驱动


1)卸载之前安装的NVIDIA驱动,$sudo apt-get --purge remove nvidia-*


2)修改配置文件blackconf,


$sudo gedit /etc/modprobe.d/blacklist.conf


在最后添加几行:


blacklist vga16fb
blacklist nouveau
blacklist rivafb
blacklist nvidiafb
blacklist rivatv
options nouveau modeset=0


保存退出。


3)更新系统,$sudo update-initramfs -u


重启系统。(必须要)


4)验证nouveau是否被禁用,$lsmod | grep nouveau


如果没有任何输出,则表示禁用成功。


20200712222657278.png


5)按ctrl+alt+F1进入命令行界面。


6)关闭图形界面,$sudo service lightdm stop


7)cd指令进入到.run文件目录,


给.run文件赋予执行权限, $sudo chmod a+x NVIDIA-Linux-x86_64-410.93.run


进行安装,$sudo ./NVIDIA-Linux-x86_64-410.93.run -no-x-check -no-nouveau -no-opengl-files


-no-x-check 安装驱动时关闭X服务,


-no-nouveau 安装驱动时禁用nouveau


-no-opengl-files 只安装驱动,不安装opengl文件。


如果报错:the distribution-provided pre-install script failed! 不用理会,继续安装。


安装过程中的选项:


The distribution-provided pre-install script failed! Are you sure you want to continue? 选择 yes 继续。


Would you like to register the kernel module souces with DKMS? This will allow DKMS to automatically build a new module, if you install a different kernel later? 选择 No 继续。


问题没记住,选项是:install without signing


问题大概是:Nvidia’s 32-bit compatibility libraries? 选择 No 继续。


Would you like to run the nvidia-xconfigutility to automatically update your x configuration so that the NVIDIA x driver will be used when you restart x? Any pre-existing x confile will be backed up. 选择 Yes 继续


这些选项如果选择错误可能会导致安装失败,没关系,只要前面不出错,多尝试几次就好。


8)切换到图形界面,$sudo service lightdm start


9)验证驱动是否安装成功, $nvidia-smi


20200712222959413.png


一.安装NVIDIA Cuda


安装cuda10.0


1.官网下载cuda安装文件


<1>.进入cuda官网下载,选择10.0版本:


20200705174950471.png


<2>.选择这里下载,可使用win下迅雷工具下载,速度快。


20200705175001643.png


2.开始安装cuda10.0


<1>.拷贝完成.run文件后,进入所在目录,对文件添加可执行权限:

sudo chmod a+x cuda_10.0.130_410.48_linux.run


<2>.执行安装: sudo sh cuda_10.0.130_410.48_linux.run


<3>.提示阅读协议,直接Ctrl+C跳过。跳出协议,输入accept。


20200705175107588.png


<4>.提示安装NVIDIA驱动,选择n,其他都选择y。


20200705175116742.png


<5>.安装成功


2020070517512382.png


安装完成后请跳到 三、配置环境变量。


二、安装cuda10.1


1.官网下载cuda安装文件


<1>.首先进入NVIDIA官网cuda下载所需安装文件,这里选择.run文件,以cuda10.1版本为例。


20200705175248915.png20200705175254778.png


<2>.如图中,官方提供了命令行下载和安装方式:


wget http://developer.download.nvidia.com/compute/cuda/10.1/Prod/local_installers/cuda_10.1.243_418.87.00_linux.run
sudo sh cuda_10.1.243_418.87.00_linux.run


注:在命令行下下载速度非常慢,我这2.4G的文件下完需要8h,所以另一个办法,找一台windows电脑用迅雷,复制wget后面的网址用迅雷下载,拷贝文件到ubuntu中。


2.开始安装cuda10.1


<1>.拷贝完成.run文件后,进入所在目录,对文件添加可执行权限:

sudo chmod a+x cuda_10.1.243_418.87.00_linux.run


<2>.执行安装: sudo sh cuda_10.1.243_418.87.00_linux.run


<3>.跳出协议,输入accept。


20200705175439934.png


注意,这里不要选择安装Nvidia显卡驱动,将第一项用空格键取消X号,再选择install:


20200705175508351.png


安装完成后请跳到 三、配置环境变量。


相关实践学习
部署Stable Diffusion玩转AI绘画(GPU云服务器)
本实验通过在ECS上从零开始部署Stable Diffusion来进行AI绘画创作,开启AIGC盲盒。
相关文章
|
2月前
|
JSON Ubuntu 开发者
ubuntu 22安装lua环境&&编译lua cjson模块
通过上述步骤,可以在 Ubuntu 22.04 系统上成功安装 Lua 环境,并使用 LuaRocks 或手动编译的方式安装 lua-cjson 模块。本文详细介绍了每一步的命令和操作,确保每一步都能顺利完成,适合需要在 Ubuntu 系统上配置 Lua 开发环境的开发者参考和使用。
190 13
|
3月前
|
Ubuntu Shell 开发工具
ubuntu/debian shell 脚本自动配置 gitea git 仓库
这是一个自动配置 Gitea Git 仓库的 Shell 脚本,支持 Ubuntu 20+ 和 Debian 12+ 系统。脚本会创建必要的目录、下载并安装 Gitea,创建 Gitea 用户和服务,确保 Gitea 在系统启动时自动运行。用户可以选择从官方或小绿叶技术博客下载安装包。
129 2
|
4月前
|
网络协议 Ubuntu 网络安全
|
4月前
|
Ubuntu
Ubuntu学习笔记(七):ubuntu下jupyter指定虚拟环境
本文介绍了如何在Ubuntu系统下使用Anaconda和Jupyter Notebook指定并切换不同的虚拟环境。
141 0
Ubuntu学习笔记(七):ubuntu下jupyter指定虚拟环境
|
4月前
|
Ubuntu Linux 编译器
Linux/Ubuntu下使用VS Code配置C/C++项目环境调用OpenCV
通过以上步骤,您已经成功在Ubuntu系统下的VS Code中配置了C/C++项目环境,并能够调用OpenCV库进行开发。请确保每一步都按照您的系统实际情况进行适当调整。
1025 3
|
4月前
|
并行计算 PyTorch TensorFlow
Ubuntu安装笔记(一):安装显卡驱动、cuda/cudnn、Anaconda、Pytorch、Tensorflow、Opencv、Visdom、FFMPEG、卸载一些不必要的预装软件
这篇文章是关于如何在Ubuntu操作系统上安装显卡驱动、CUDA、CUDNN、Anaconda、PyTorch、TensorFlow、OpenCV、FFMPEG以及卸载不必要的预装软件的详细指南。
6550 3
|
4月前
|
消息中间件 监控 Ubuntu
大数据-54 Kafka 安装配置 环境变量配置 启动服务 Ubuntu配置 ZooKeeper
大数据-54 Kafka 安装配置 环境变量配置 启动服务 Ubuntu配置 ZooKeeper
140 3
大数据-54 Kafka 安装配置 环境变量配置 启动服务 Ubuntu配置 ZooKeeper
|
4天前
|
机器学习/深度学习 存储 弹性计算
阿里云gpu云服务器租用价格:最新收费标准及活动价格参考
阿里云gpu云服务器多少钱?A10卡GN7i GPU云服务器32核188G3213.99/1个月起,V100卡GN6v GPU云服务器8核32G3830.00/1个月起,阿里云GPU云服务器是基于GPU应用的计算服务,多适用于视频解码,图形渲染,深度学习,科学计算等应用场景,该产品具有超强计算能力、网络性能出色、购买方式灵活、高性能实例存储( GA1和GN5特有)等特点。下面小编来介绍下阿里云gpu云服务器最新的收费标准及活动价格。
|
4天前
|
存储 机器学习/深度学习 人工智能
2025年阿里云GPU服务器租用价格、选型策略与应用场景详解
随着AI与高性能计算需求的增长,阿里云提供了多种GPU实例,如NVIDIA V100、A10、T4等,适配不同场景。2025年重点实例中,V100实例GN6v单月3830元起,适合大规模训练;A10实例GN7i单月3213.99元起,适用于混合负载。计费模式有按量付费和包年包月,后者成本更低。针对AI训练、图形渲染及轻量级推理等场景,推荐不同配置以优化成本和性能。阿里云还提供抢占式实例、ESSD云盘等资源优化策略,支持eRDMA网络加速和倚天ARM架构,助力企业在2025年实现智能计算的效率与成本最优平衡。 (该简介为原文内容的高度概括,符合要求的字符限制。)
|
4天前
|
机器学习/深度学习 存储 人工智能
2025年阿里云GPU服务器的租赁价格与选型指南
随着AI、深度学习等领域的发展,GPU服务器成为企业及科研机构的核心算力选择。阿里云提供多种GPU实例类型(如NVIDIA V100、A100等),涵盖计算型、共享型和弹性裸金属等,满足不同场景需求。本文详解2025年阿里云GPU服务器的核心配置、价格策略及适用场景,帮助用户优化选型与成本控制,实现高效智能计算。

热门文章

最新文章