linux搭建miniconda+cuda+pytoch深度学习环境

简介: 本文以图文结合的方式,详细记录了linux操作系统搭建miniconda+cuda+pytoch深度学习环境的步骤,供大家参考学习。

本文以图文结合的方式,详细记录了linux操作系统搭建miniconda+cuda+pytoch深度学习环境的步骤,供大家参考学习。
一、gpu服务器准备
首先注册九天毕昇人工智能平台,注册之后有免费的gpu服务器可以使用,注册后点击右上角的控制台,然后点击单机训练-->新建实例
image.png
image.png
然后对实例名称进行命名,选择资源套餐。
image.png
新建实例之后,点击启动,然后点击jupyter,然后在other选项中选择以terminal。
image.png
二、miniconda安装
进入官网miniconda官网
按照官网的命令进行安装
image.png
1、运行以下命令,创建miniconda3目录,和下载miniconda3
mkdir -p ~/miniconda3
wget https://repo.anaconda.com/miniconda/Miniconda3-latest-Linux-x86_64.sh -O ~/miniconda3/miniconda.sh
image.png
2、运行以下命令,安装miniconda3
bash ~/miniconda3/miniconda.sh -b -u -p ~/miniconda3

image.png
3、运行以下命令,删除miniconda3包
rm -rf ~/miniconda3/miniconda.sh
image.png

4、安装完成后,运行以下命令,初始化终端Shell,以便我们可以直接运行conda。
~/miniconda3/bin/conda init bash
~/miniconda3/bin/conda init zsh
image.png
5、验证
关闭终端,重新打开终端,输入python查看安装的python版本号。
image.png
6、Conda源查看
查看conda下载源,可以看到为阿里云镜像。如果是国外的anaconda地址,建议为国内的源。
运行conda info,查看目前的源
image.png
三、cuda配置
1、运行nvcc --version命令,查看服务器默认的cuda版本
image.png
2、运行echo $PATH命令,查看当前服务器的默认路径,可以看到cuda的默认路径为/usr/local/cuda/bin
image.png
3、运行ls -l /usr/local查看local目录中的详细信息。
image.png
可以看到cuda -> /usr/local/cuda-10.1,这是一个软连接,指向cuda10.1这个目录。
从上面可以看出,服务器中有两个cuda版本(10.1和11.7),服务器默认是10.1,由于10.1相对比较低。
4、下面修改服务器默认cuda版本,更改为cuda-11.7
(1)运行cd /usr/local/命令,进入/usr/local/目录下
(2)运行sudo rm -rf /usr/local/cuda命令,删除原来的软链接
(3)运行sudo ln -s /usr/local/cuda-11.7 /usr/local/cuda命令,生成新的软链接
(4)运行nvcc --version,再次查看cuda版本
image.png
四、pytorch下载安装
1、创建虚拟环境
运行conda create --name d2l python=3.9 -y命令,创建一个新的conda环境,名称叫d2l,虚拟环境安装在目录(/root/.local/conda/envs/ailearn)下
image.png
image.png
2、查看系统中刚才创建的虚拟环境d2l
运行conda info --envs命令可以查看创建的虚拟环境d2l
image.png
3、激活虚拟环境d2l
运行conda activate d2l,激活虚拟环境,准备安装pytorch
image.png
4、安装pytorch1.13.1版本
运行pip install torch==1.13.1 torchvision==0.14.1 torchaudio==0.13.1命令,安装pytorch、torchvision、torchaudio三个包

image.png
5、运行pip list查看虚拟环境中已安装的包
image.png
6、验证pytorch是GPU版本还是cpu版本
image.png
print(torch.cuda.is_available())为true,表示为gpu版本,
print(torch.cuda.device_count())表示查看gpu的数量。
7、查看gpu显存占用和总大小
运行nvidia-smi,可以看到目前显存占用为0,总大小为8000M
image.png

至此,深度学习环境准备完毕。

相关实践学习
在云上部署ChatGLM2-6B大模型(GPU版)
ChatGLM2-6B是由智谱AI及清华KEG实验室于2023年6月发布的中英双语对话开源大模型。通过本实验,可以学习如何配置AIGC开发环境,如何部署ChatGLM2-6B大模型。
目录
相关文章
|
4月前
|
存储 Linux 开发工具
Linux环境下使用Buildroot配置软件包
使用Buildroot可以大大简化嵌入式Linux系统的开发和维护工作,但它需要对Linux系统和交叉编译有深入的理解。通过上述步骤,可以有效地配置和定制软件包,为特定的嵌入式应用构建高效、稳定的系统。
549 11
|
6月前
|
存储 监控 Linux
Linux环境锁定关键文件防止误删操作流程。
总结以上内容,在Linux环境下锁定重要文档避免误删涉及到多种技术手段与策略组合运作, 包括但不限于利用chatter指挥官固化文档状态至只读模式、运作ACL精准调整访问权利列表、编排自动化流程简
265 20
|
6月前
|
Linux
Linux环境下的UDEV机制及其与守护进程的关联
实际使用时管理员需要熟悉编写合适udev rules去满足特殊需求;同时也需要注意避免编写过度复杂导致无法预料结果rules.UDEVD虽然稳健但错误配置可能导致无法预料问题因此需谨慎处理相关配置工作.
238 16
|
6月前
|
存储 Linux
Linux环境下删除大文件后磁盘空间未释放问题诊断流程。
以上诊断流程涉及Linux底层机制与高级管理技能结合之处,并需要管理员根据实际环境灵活调整诊断策略与解决方案。
490 8
|
6月前
|
弹性计算 安全 Linux
阿里云服务器ECS安装宝塔Linux面板、安装网站(新手图文教程)
本教程详解如何在阿里云服务器上安装宝塔Linux面板,涵盖ECS服务器手动安装步骤,包括系统准备、远程连接、安装命令执行、端口开放及LNMP环境部署,手把手引导用户快速搭建网站环境。
|
6月前
|
Ubuntu 网络协议 Unix
Linux教程(Ubuntu为蓝本)之Linux介绍篇
SuSE嫁到了Novell,SCO继续顶着骂名四处强行“化缘”, Asianux, MandrakeSoft也在五年中首次宣布季度赢利。3月,SGI宣布成功实现了Linux操作系统支持256个Itanium 2处理器。[1-2]
|
6月前
|
Ubuntu Linux 数据安全/隐私保护
Win10安装Linux子系统教程!如何在Win10系统中安装Ubuntu!
登录系统后,输入cd /返回上一级,然后再输入“ls”查看一下系统文件目录,看看对不对!
|
6月前
|
Ubuntu 安全 Linux
Ubuntu 24.10 发行版登场:Linux 6.11 内核、GNOME 47 桌面环境
Ubuntu 24.10 还带来了 GNOME 47,增强了性能和稳定性,并引入了新功能。此版本的 Ubuntu 还默认在采用 Nvidia 显卡的硬件上切换到 Wayland,并在支持的硬件上默认使用开源的 Nvidia 560 内核模块。 另外需要注意的是,Ubuntu 24.10 是稳定版本,但作为非 LTS 版本,仅支持 9 个月。
|
6月前
|
安全 Linux 网络安全
Linux系统初步设置本地Git环境和生成SSH密钥的步骤。
现在您的Linux系统已经配置好了Git环境,并创建并添加了SSH密钥,可以安全地与远端仓库进行交互,无论是克隆、推送还是拉取操作。此过程确保了数据传输的安全并使版本控制流程更为顺畅。使用Git时应考虑定期更新并管理您的凭据,以确保安全性。
870 0

热门文章

最新文章