Ubuntu下CUDA、Conda、Pytorch联合教程

简介: 本文是一份Ubuntu系统下安装和配置CUDA、Conda和Pytorch的教程,涵盖了查看显卡驱动、下载安装CUDA、添加环境变量、卸载CUDA、Anaconda的下载安装、环境管理以及Pytorch的安装和验证等步骤。

CUDA

前往Nvidia CUDA Tools官网选择对应的架构和版本下载CUDA

以如下架构和版本为例:
在这里插入图片描述

查看显卡驱动

nvidia-smi

如果显卡驱动已经装了(例如此处提示的Driver Version: 535.54.03),那么在CUDA安装过程中选择需要安装的组件时,不用再勾选安装driver。
在这里插入图片描述

下载并安装CUDA

根据刚才选择的的操作系统、架构等对应的下载安装命令来下载并安装CUDA

wget https://developer.download.nvidia.com/compute/cuda/11.8.0/local_installers/cuda_11.8.0_520.61.05_linux.run
sudo sh cuda_11.8.0_520.61.05_linux.run

添加环境变量

sudo nano ~/.bashrc
# Add
export PATH=/usr/local/cuda-11.8/bin:$PATH
export LD_LIBRARY_PATH=/usr/local/cuda-11.8/lib64:$LD_LIBRARY_PATH
export CUDA_HOME=/usr/local/cuda

卸载CUDA

常见的情况是,在使用Pytorch时对CUDA版本有要求,即使在Conda环境下也偶尔会有问题,因此降级到Pytorch2.0.1对应的CUDA11.8,假设此时cuda版本为12.1

cd /usr/local/cuda-12.1/bin/
sudo ./cuda-uninstaller
sudo rm -rf /usr/local/cuda-12.1

Conda

下载Anaconda

前往Anaconda官方下载页下载安装脚本。

对于Nvidia Orin AGX:

wget https://repo.anaconda.com/archive/Anaconda3-2023.09-0-Linux-aarch64.sh
bash Anaconda3-2023.09-0-Linux-aarch64.sh

安装Anaconda

赋权

sudo chmod +x Anaconda3-2023.07-2-Linux-x86_64.sh

执行脚本

./Anaconda3-2023.07-2-Linux-x86_64.sh

注意: 如果不希望启动命令行终端自动打开conda base,记得不要在安装时设置base环境自动激活
如果不慎设置了自动激活base
可以输入以下指令

conda config --set auto_activate_base false

检查安装是否完成

conda --version

创建环境

conda create -n <env_name> python=3.7 -y

删除环境

conda remove -n <env_name> --all

激活环境

conda activate <env_name>

退出环境

conda deactivate <env_name>

安装软件

在对应的虚拟环境内使用安装

conda install <app_name>

指定channel安装

conda install -c conda-forge package-name

查看conda信息

conda info

查看conda的环境变量设置

conda env config vars list
conda env config vars set

卸载软件

在对应的虚拟环境内使用卸载

conda uninstall <app_name>

Pytorch

前往Pytorch官方网站选择合适的Pytorch版本并下载

conda install pytorch torchvision torchaudio pytorch-cuda=11.8 -c pytorch -c nvidia

检查安装是否成功

conda list | grep pytorch
(base) hermanye@hermanye:~$ python
Python 3.11.4 (main, Jul  5 2023, 14:15:25) [GCC 11.2.0] on linux
Type "help", "copyright", "credits" or "license" for more information.
>>> import torch
>>> x = torch.rand(5, 3)
>>> print(x)
tensor([[0.5421, 0.5950, 0.3337],
        [0.8443, 0.2287, 0.5316],
        [0.0301, 0.0151, 0.3522],
        [0.3456, 0.5901, 0.5970],
        [0.6271, 0.8065, 0.7645]])
>>> 

>>> torch.cuda.is_available()
True
>>> torch.cuda.current_device()
0
>>> torch.cuda.device(0)
<torch.cuda.device object at 0x7f2bb0556700>
>>> torch.cuda.get_device_name(0)
'NVIDIA GeForce RTX 4070 Ti'

>>> print(torch.__version__)
1.8.2+cu111
>>> print(torch.version.cuda)
11.1
目录
相关文章
|
16天前
|
机器学习/深度学习 PyTorch TensorFlow
conda、anaconda、pip、pytorch、tensorflow有什么关联?
conda、anaconda、pip、pytorch、tensorflow有什么关联?
|
18天前
|
机器学习/深度学习 并行计算 PyTorch
PyTorch与CUDA:加速深度学习模型训练的最佳实践
【8月更文第27天】随着深度学习应用的广泛普及,高效利用GPU硬件成为提升模型训练速度的关键。PyTorch 是一个强大的深度学习框架,它支持动态计算图,易于使用且高度灵活。CUDA (Compute Unified Device Architecture) 则是 NVIDIA 开发的一种并行计算平台和编程模型,允许开发者直接访问 GPU 的并行计算能力。本文将详细介绍如何利用 PyTorch 与 CUDA 的集成来加速深度学习模型的训练过程,并提供具体的代码示例。
36 1
|
1月前
|
Ubuntu 网络协议
怎么在Ubuntu系统云服务器搭建自己的幻兽帕鲁服务器?幻兽帕鲁搭建教程
《幻兽帕鲁》是热门开放世界生存游戏,玩家收集并利用“帕鲁”进行多样活动。为享受多人模式,需自建服务器:选云主机(推荐4C/16G/5M起)、装Steamcmd及游戏环境。登录Steam购游戏后,输入服务器地址即可联机畅玩。
94 1
怎么在Ubuntu系统云服务器搭建自己的幻兽帕鲁服务器?幻兽帕鲁搭建教程
|
24天前
|
Ubuntu 网络安全 数据安全/隐私保护
ubuntu server连接wifi教程
本文提供了一个简化Ubuntu Server在Raspberry Pi系统上配置过程的脚本"config_ubuntu_server",包括自动和手动两种方法来设置root权限、SSH配置,并连接WiFi,同时支持无密码SSH访问,适合初学者和高级用户。
45 3
|
2月前
|
Ubuntu Java Linux
玩转Ubuntu零基础教程,让你成为Ubuntu高手。
本教程将介绍Ubuntu操作系统的各个方面。它探讨了Ubuntu桌面版的各种功能,风格和工作。比较我们通常会在Windows操作系统上找到的软件。有一些专注于Ubuntu服务器版本的章节。本教程还包括有兴趣了解Ubuntu的虚拟机和云端的人员的独立章节。
52 1
玩转Ubuntu零基础教程,让你成为Ubuntu高手。
|
24天前
|
Ubuntu Linux Shell
树莓派ubuntu镜像备份详细教程
本文是关于树莓派Ubuntu镜像备份的详细教程,包括如何获取镜像、使用PiShrink工具减小镜像体积的步骤和命令,以及相关参数的说明。
45 0
|
2月前
|
Ubuntu 网络协议
【ubuntu】DNS设置工具resolvectl安装教程
请注意,这些步骤可能会根据你的Ubuntu版本和配置有所不同。如果你在安装过程中遇到问题,可能需要查阅更具体的文档或者寻求专业的技术支持。
128 0
|
18天前
|
机器学习/深度学习 PyTorch 编译器
PyTorch 与 TorchScript:模型的序列化与加速
【8月更文第27天】PyTorch 是一个非常流行的深度学习框架,它以其灵活性和易用性而著称。然而,当涉及到模型的部署和性能优化时,PyTorch 的动态计算图可能会带来一些挑战。为了解决这些问题,PyTorch 引入了 TorchScript,这是一个用于序列化和优化 PyTorch 模型的工具。本文将详细介绍如何使用 TorchScript 来序列化 PyTorch 模型以及如何加速模型的执行。
33 4
|
16天前
|
机器学习/深度学习 边缘计算 PyTorch
PyTorch 与边缘计算:将深度学习模型部署到嵌入式设备
【8月更文第29天】随着物联网技术的发展,越来越多的数据处理任务开始在边缘设备上执行,以减少网络延迟、降低带宽成本并提高隐私保护水平。PyTorch 是一个广泛使用的深度学习框架,它不仅支持高效的模型训练,还提供了多种工具帮助开发者将模型部署到边缘设备。本文将探讨如何将PyTorch模型高效地部署到嵌入式设备上,并通过一个具体的示例来展示整个流程。
62 1
|
18天前
|
机器学习/深度学习 自然语言处理 PyTorch
PyTorch与Hugging Face Transformers:快速构建先进的NLP模型
【8月更文第27天】随着自然语言处理(NLP)技术的快速发展,深度学习模型已经成为了构建高质量NLP应用程序的关键。PyTorch 作为一种强大的深度学习框架,提供了灵活的 API 和高效的性能,非常适合于构建复杂的 NLP 模型。Hugging Face Transformers 库则是目前最流行的预训练模型库之一,它为 PyTorch 提供了大量的预训练模型和工具,极大地简化了模型训练和部署的过程。
45 2