Ubuntu配置pytorch gpu环境(含Cuda+Cudnn+pytorch-gpu+卸载)(上)

在线体验各类最新模型,更有模型 免费Token 额度领取!
立即体验
简介: Ubuntu配置pytorch gpu环境(含Cuda+Cudnn+pytorch-gpu+卸载)(上)

概述


步骤如下:


  • 安装NVIDIA 驱动
  • 安装NVIDIA Cuda
  • 安装NVIDIA CuDNN
  • 安装GPU版本的PyTorch
  • 卸载NVIDIA Cuda


零.安装NVIDIA 驱动


1、查看自己机器上的显卡型号 lspci -vnn | grep VGA -A 12


2、下载显卡驱动 https://www.geforce.cn/drivers,或者https://www.nvidia.cn/Download/index.aspx?lang=cn


20200712222419313.png


3、安装显卡驱动


1)卸载之前安装的NVIDIA驱动,$sudo apt-get --purge remove nvidia-*


2)修改配置文件blackconf,


$sudo gedit /etc/modprobe.d/blacklist.conf


在最后添加几行:


blacklist vga16fb
blacklist nouveau
blacklist rivafb
blacklist nvidiafb
blacklist rivatv
options nouveau modeset=0


保存退出。


3)更新系统,$sudo update-initramfs -u


重启系统。(必须要)


4)验证nouveau是否被禁用,$lsmod | grep nouveau


如果没有任何输出,则表示禁用成功。


20200712222657278.png


5)按ctrl+alt+F1进入命令行界面。


6)关闭图形界面,$sudo service lightdm stop


7)cd指令进入到.run文件目录,


给.run文件赋予执行权限, $sudo chmod a+x NVIDIA-Linux-x86_64-410.93.run


进行安装,$sudo ./NVIDIA-Linux-x86_64-410.93.run -no-x-check -no-nouveau -no-opengl-files


-no-x-check 安装驱动时关闭X服务,


-no-nouveau 安装驱动时禁用nouveau


-no-opengl-files 只安装驱动,不安装opengl文件。


如果报错:the distribution-provided pre-install script failed! 不用理会,继续安装。


安装过程中的选项:


The distribution-provided pre-install script failed! Are you sure you want to continue? 选择 yes 继续。


Would you like to register the kernel module souces with DKMS? This will allow DKMS to automatically build a new module, if you install a different kernel later? 选择 No 继续。


问题没记住,选项是:install without signing


问题大概是:Nvidia’s 32-bit compatibility libraries? 选择 No 继续。


Would you like to run the nvidia-xconfigutility to automatically update your x configuration so that the NVIDIA x driver will be used when you restart x? Any pre-existing x confile will be backed up. 选择 Yes 继续


这些选项如果选择错误可能会导致安装失败,没关系,只要前面不出错,多尝试几次就好。


8)切换到图形界面,$sudo service lightdm start


9)验证驱动是否安装成功, $nvidia-smi


20200712222959413.png


一.安装NVIDIA Cuda


安装cuda10.0


1.官网下载cuda安装文件


<1>.进入cuda官网下载,选择10.0版本:


20200705174950471.png


<2>.选择这里下载,可使用win下迅雷工具下载,速度快。


20200705175001643.png


2.开始安装cuda10.0


<1>.拷贝完成.run文件后,进入所在目录,对文件添加可执行权限:

sudo chmod a+x cuda_10.0.130_410.48_linux.run


<2>.执行安装: sudo sh cuda_10.0.130_410.48_linux.run


<3>.提示阅读协议,直接Ctrl+C跳过。跳出协议,输入accept。


20200705175107588.png


<4>.提示安装NVIDIA驱动,选择n,其他都选择y。


20200705175116742.png


<5>.安装成功


2020070517512382.png


安装完成后请跳到 三、配置环境变量。


二、安装cuda10.1


1.官网下载cuda安装文件


<1>.首先进入NVIDIA官网cuda下载所需安装文件,这里选择.run文件,以cuda10.1版本为例。


20200705175248915.png20200705175254778.png


<2>.如图中,官方提供了命令行下载和安装方式:


wget http://developer.download.nvidia.com/compute/cuda/10.1/Prod/local_installers/cuda_10.1.243_418.87.00_linux.run
sudo sh cuda_10.1.243_418.87.00_linux.run


注:在命令行下下载速度非常慢,我这2.4G的文件下完需要8h,所以另一个办法,找一台windows电脑用迅雷,复制wget后面的网址用迅雷下载,拷贝文件到ubuntu中。


2.开始安装cuda10.1


<1>.拷贝完成.run文件后,进入所在目录,对文件添加可执行权限:

sudo chmod a+x cuda_10.1.243_418.87.00_linux.run


<2>.执行安装: sudo sh cuda_10.1.243_418.87.00_linux.run


<3>.跳出协议,输入accept。


20200705175439934.png


注意,这里不要选择安装Nvidia显卡驱动,将第一项用空格键取消X号,再选择install:


20200705175508351.png


安装完成后请跳到 三、配置环境变量。


相关实践学习
在云上部署ChatGLM2-6B大模型(GPU版)
ChatGLM2-6B是由智谱AI及清华KEG实验室于2023年6月发布的中英双语对话开源大模型。通过本实验,可以学习如何配置AIGC开发环境,如何部署ChatGLM2-6B大模型。
相关文章
|
10月前
|
人工智能 Ubuntu 前端开发
Dify部署全栈指南:AI从Ubuntu配置到HTTPS自动化的10倍秘籍
本文档介绍如何部署Dify后端服务及前端界面,涵盖系统环境要求、依赖安装、代码拉取、环境变量配置、服务启动、数据库管理及常见问题解决方案,适用于开发与生产环境部署。
1811 1
|
10月前
|
Ubuntu 安全 应用服务中间件
详细指南:配置Nginx服务器在Ubuntu平台上
以上步骤涵盖了基本流程:从软件包管理器获取 Ngnix, 设置系统服务, 调整UFW规则, 创建并激活服务器块(也称作虚拟主机), 并进行了初步优化与加固措施。这些操作都是建立在命令行界面上,并假设用户具有必要权限(通常是root用户)来执行这些命令。每个操作都有其特定原因:例如,设置开机启动确保了即使重启后也能自动运行 Ngnix;而编辑server block则定义了如何处理进入特定域名请求等等。
520 18
|
10月前
|
Ubuntu 安全 应用服务中间件
详细指南:配置Nginx服务器在Ubuntu平台上
以上步骤涵盖了基本流程:从软件包管理器获取 Ngnix, 设置系统服务, 调整UFW规则, 创建并激活服务器块(也称作虚拟主机), 并进行了初步优化与加固措施。这些操作都是建立在命令行界面上,并假设用户具有必要权限(通常是root用户)来执行这些命令。每个操作都有其特定原因:例如,设置开机启动确保了即使重启后也能自动运行 Ngnix;而编辑server block则定义了如何处理进入特定域名请求等等。
873 17
|
10月前
|
Ubuntu 安全 关系型数据库
安装与配置MySQL 8 on Ubuntu,包括权限授予、数据库备份及远程连接指南
以上步骤提供了在Ubuntu上从头开始设置、配置、授权、备份及恢复一个基础但完整的MySQL环境所需知识点。
1101 7
|
10月前
|
消息中间件 人工智能 运维
Ubuntu环境下的 RabbitMQ 安装与配置详细教程
本文聚焦在Ubuntu下RabbitMQ安装与配置教程,旨在帮助读者快速构建稳定可用的消息队列服务。
1631 6
|
机器学习/深度学习 JavaScript PyTorch
9个主流GAN损失函数的数学原理和Pytorch代码实现:从经典模型到现代变体
生成对抗网络(GAN)的训练效果高度依赖于损失函数的选择。本文介绍了经典GAN损失函数理论,并用PyTorch实现多种变体,包括原始GAN、LS-GAN、WGAN及WGAN-GP等。通过分析其原理与优劣,如LS-GAN提升训练稳定性、WGAN-GP改善图像质量,展示了不同场景下损失函数的设计思路。代码实现覆盖生成器与判别器的核心逻辑,为实际应用提供了重要参考。未来可探索组合优化与自适应设计以提升性能。
1232 7
9个主流GAN损失函数的数学原理和Pytorch代码实现:从经典模型到现代变体
|
10月前
|
机器学习/深度学习 存储 PyTorch
Neural ODE原理与PyTorch实现:深度学习模型的自适应深度调节
Neural ODE将神经网络与微分方程结合,用连续思维建模数据演化,突破传统离散层的限制,实现自适应深度与高效连续学习。
907 3
Neural ODE原理与PyTorch实现:深度学习模型的自适应深度调节
|
9月前
|
边缘计算 人工智能 PyTorch
130_知识蒸馏技术:温度参数与损失函数设计 - 教师-学生模型的优化策略与PyTorch实现
随着大型语言模型(LLM)的规模不断增长,部署这些模型面临着巨大的计算和资源挑战。以DeepSeek-R1为例,其671B参数的规模即使经过INT4量化后,仍需要至少6张高端GPU才能运行,这对于大多数中小型企业和研究机构来说成本过高。知识蒸馏作为一种有效的模型压缩技术,通过将大型教师模型的知识迁移到小型学生模型中,在显著降低模型复杂度的同时保留核心性能,成为解决这一问题的关键技术之一。
726 6
|
11月前
|
PyTorch 算法框架/工具 异构计算
PyTorch 2.0性能优化实战:4种常见代码错误严重拖慢模型
我们将深入探讨图中断(graph breaks)和多图问题对性能的负面影响,并分析PyTorch模型开发中应当避免的常见错误模式。
559 9