linux搭建miniconda+cuda+pytoch深度学习环境

本文涉及的产品
模型在线服务 PAI-EAS,A10/V100等 500元 1个月
模型训练 PAI-DLC,100CU*H 3个月
交互式建模 PAI-DSW,每月250计算时 3个月
简介: 本文以图文结合的方式,详细记录了linux操作系统搭建miniconda+cuda+pytoch深度学习环境的步骤,供大家参考学习。

本文以图文结合的方式,详细记录了linux操作系统搭建miniconda+cuda+pytoch深度学习环境的步骤,供大家参考学习。
一、gpu服务器准备
首先注册九天毕昇人工智能平台,注册之后有免费的gpu服务器可以使用,注册后点击右上角的控制台,然后点击单机训练-->新建实例
image.png
image.png
然后对实例名称进行命名,选择资源套餐。
image.png
新建实例之后,点击启动,然后点击jupyter,然后在other选项中选择以terminal。
image.png
二、miniconda安装
进入官网miniconda官网
按照官网的命令进行安装
image.png
1、运行以下命令,创建miniconda3目录,和下载miniconda3
mkdir -p ~/miniconda3
wget https://repo.anaconda.com/miniconda/Miniconda3-latest-Linux-x86_64.sh -O ~/miniconda3/miniconda.sh
image.png
2、运行以下命令,安装miniconda3
bash ~/miniconda3/miniconda.sh -b -u -p ~/miniconda3

image.png
3、运行以下命令,删除miniconda3包
rm -rf ~/miniconda3/miniconda.sh
image.png

4、安装完成后,运行以下命令,初始化终端Shell,以便我们可以直接运行conda。
~/miniconda3/bin/conda init bash
~/miniconda3/bin/conda init zsh
image.png
5、验证
关闭终端,重新打开终端,输入python查看安装的python版本号。
image.png
6、Conda源查看
查看conda下载源,可以看到为阿里云镜像。如果是国外的anaconda地址,建议为国内的源。
运行conda info,查看目前的源
image.png
三、cuda配置
1、运行nvcc --version命令,查看服务器默认的cuda版本
image.png
2、运行echo $PATH命令,查看当前服务器的默认路径,可以看到cuda的默认路径为/usr/local/cuda/bin
image.png
3、运行ls -l /usr/local查看local目录中的详细信息。
image.png
可以看到cuda -> /usr/local/cuda-10.1,这是一个软连接,指向cuda10.1这个目录。
从上面可以看出,服务器中有两个cuda版本(10.1和11.7),服务器默认是10.1,由于10.1相对比较低。
4、下面修改服务器默认cuda版本,更改为cuda-11.7
(1)运行cd /usr/local/命令,进入/usr/local/目录下
(2)运行sudo rm -rf /usr/local/cuda命令,删除原来的软链接
(3)运行sudo ln -s /usr/local/cuda-11.7 /usr/local/cuda命令,生成新的软链接
(4)运行nvcc --version,再次查看cuda版本
image.png
四、pytorch下载安装
1、创建虚拟环境
运行conda create --name d2l python=3.9 -y命令,创建一个新的conda环境,名称叫d2l,虚拟环境安装在目录(/root/.local/conda/envs/ailearn)下
image.png
image.png
2、查看系统中刚才创建的虚拟环境d2l
运行conda info --envs命令可以查看创建的虚拟环境d2l
image.png
3、激活虚拟环境d2l
运行conda activate d2l,激活虚拟环境,准备安装pytorch
image.png
4、安装pytorch1.13.1版本
运行pip install torch==1.13.1 torchvision==0.14.1 torchaudio==0.13.1命令,安装pytorch、torchvision、torchaudio三个包

image.png
5、运行pip list查看虚拟环境中已安装的包
image.png
6、验证pytorch是GPU版本还是cpu版本
image.png
print(torch.cuda.is_available())为true,表示为gpu版本,
print(torch.cuda.device_count())表示查看gpu的数量。
7、查看gpu显存占用和总大小
运行nvidia-smi,可以看到目前显存占用为0,总大小为8000M
image.png

至此,深度学习环境准备完毕。

相关实践学习
部署Stable Diffusion玩转AI绘画(GPU云服务器)
本实验通过在ECS上从零开始部署Stable Diffusion来进行AI绘画创作,开启AIGC盲盒。
目录
打赏
0
1
1
0
9
分享
相关文章
零基础保姆级教程!手把手教你免费玩转Linux CentOS安装+学习环境搭建(附避坑指南)
本文详细介绍了在VMware虚拟机中安装CentOS 6.8的全过程。首先,需确保已安装VMware并开启V-CPU虚拟化功能,可通过BIOS设置或使用LeoMoon CPU-V工具检测。接着,下载CentOS镜像文件,并在VMware中新建虚拟机,配置CPU、内存、硬盘等参数。最后,加载ISO镜像启动虚拟机,按照提示完成CentOS的安装,包括语言、键盘、存储方式、地区、密码设置及硬盘分区等步骤。安装完成后,以root用户登录即可进入系统桌面,开始学习Linux命令和操作。
35 12
零基础保姆级教程!手把手教你免费玩转Linux CentOS安装+学习环境搭建(附避坑指南)
|
24天前
|
【linux】Shell脚本中basename和dirname的详细用法教程
本文详细介绍了Linux Shell脚本中 `basename`和 `dirname`命令的用法,包括去除路径信息、去除后缀、批量处理文件名和路径等。同时,通过文件备份和日志文件分离的实践应用,展示了这两个命令在实际脚本中的应用场景。希望本文能帮助您更好地理解和应用 `basename`和 `dirname`命令,提高Shell脚本编写的效率和灵活性。
85 32
|
1月前
|
【Linux】 Linux makefile 教程
本文详细介绍了 Linux 环境下 Makefile 的基本结构、语法和使用方法,并通过一个简单的 C++ 项目示例演示了 Makefile 的实际应用。Makefile 是一个强大而灵活的工具,通过合理配置,可以极大地简化项目的编译和管理过程,提高开发效率。希望本文能帮助您更好地理解和应用 Makefile,在实际项目中高效管理代码的编译和构建。
55 20
|
27天前
|
【Linux】 Linux makefile 教程
本文详细介绍了 Linux 环境下 Makefile 的基本结构、语法和使用方法,并通过一个简单的 C++ 项目示例演示了 Makefile 的实际应用。Makefile 是一个强大而灵活的工具,通过合理配置,可以极大地简化项目的编译和管理过程,提高开发效率。希望本文能帮助您更好地理解和应用 Makefile,在实际项目中高效管理代码的编译和构建。
60 16
Linux磁盘挂接教程
Linux磁盘挂接教程
72 14
【手把手教你Linux环境下快速搭建Kafka集群】内含脚本分发教程,实现一键部署多个Kafka节点
本文介绍了Kafka集群的搭建过程,涵盖从虚拟机安装到集群测试的详细步骤。首先规划了集群架构,包括三台Kafka Broker节点,并说明了分布式环境下的服务进程配置。接着,通过VMware导入模板机并克隆出三台虚拟机(kafka-broker1、kafka-broker2、kafka-broker3),分别设置IP地址和主机名。随后,依次安装JDK、ZooKeeper和Kafka,并配置相应的环境变量与启动脚本,确保各组件能正常运行。最后,通过编写启停脚本简化集群的操作流程,并对集群进行测试,验证其功能完整性。整个过程强调了自动化脚本的应用,提高了部署效率。
【手把手教你Linux环境下快速搭建Kafka集群】内含脚本分发教程,实现一键部署多个Kafka节点
|
4月前
|
Linux 中某个目录中的文件数如何查看?这篇教程分分钟教会你!
在 Linux 系统中,了解目录下文件数量是常见的需求。本文介绍了四种方法:使用 `ls` 和 `wc` 组合、`find` 命令、`tree` 命令以及编程实现(如 Python)。每种方法都附有详细说明和示例,适合不同水平的用户学习和使用。掌握这些技巧,可以有效提升系统管理和日常使用的效率。
2152 6
|
3月前
|
Win10系统上直接使用linux子系统教程(仅需五步!超简单,快速上手)
本文介绍了如何在Windows 10上安装并使用Linux子系统。首先,通过应用商店安装Windows Terminal和Linux系统(如Ubuntu)。接着,在控制面板中启用“适用于Linux的Windows子系统”并重启电脑。最后,在Windows Terminal中选择安装的Linux系统即可开始使用。文中还提供了注意事项和进一步配置的链接。
93 0
|
4月前
|
Linux 中某个目录中的文件数如何查看?这篇教程分分钟教会你!
在 Linux 系统中,了解目录下的文件数量是常见的需求。本文介绍了多种方法,包括使用 `ls` 和 `wc` 命令组合、`find` 命令、`tree` 命令以及编程方式(如 Python)。无论你是新手还是有经验的用户,都能找到适合自己的方法。掌握这些技巧将提高你在 Linux 系统中的操作效率。
146 4
基于阿里云服务器Linux系统安装Docker完整图文教程(附部署开源项目)
基于阿里云服务器Linux系统安装Docker完整图文教程(附部署开源项目)
1035 3

热门文章

最新文章

AI助理

你好,我是AI助理

可以解答问题、推荐解决方案等