ubuntu18 安装 gpu 和 docker 驱动

简介: ubuntu18 安装 gpu 和 docker 驱动

创建 root

sudo passwd root
su root

参考博客

https://blog.csdn.net/weixin_38661447/article/details/106796349

华为镜像元 配置

sudo cp -a /etc/apt/sources.list /etc/apt/sources.list.bak
sudo sed -i "s@http://.*archive.ubuntu.com@http://repo.huaweicloud.com@g" /etc/apt/sources.list
sudo sed -i "s@http://.*security.ubuntu.com@http://repo.huaweicloud.com@g" /etc/apt/sources.list
apt-get update

更新 vim 防止 方向键 乱码

关闭 nouveau

vim /etc/modprobe.d/blacklist.conf
sudo echo " blacklist nouveau "  >> /etc/modprobe.d/blacklist.conf
blacklist nouveau
update-initramfs -u
检查
lsmod | grep nouveau
//无输出表示成功

安装 gpu 驱动

10.2 440

参考

https://blog.csdn.net/qq_43373608/article/details/103314435


添加驱动源

add-apt-repository ppa:graphics-drivers/ppa
apt-get update
apt install nvidia-driver-440 -y

安装 cuda10.2

wget http://developer.download.nvidia.com/compute/cuda/10.2/Prod/local_installers/cuda_10.2.89_440.33.01_linux.run
sh cuda_10.2.89_440.33.01_linux.run
配置环境变量
vi ~/.bashrc
export PATH="/usr/local/cuda-10.2/bin:$PATH"
export LD_LIBRARY_PATH="/usr/local/cuda-10.2/lib64:$LD_LIBRARY_PATH"
下载 https://developer.nvidia.com/cudnn



安装runtime库

dpkg -i '/home/zhao/下载/libcudnn8_8.0.3.33-1+cuda10.2_amd64.deb'


安装developer库

dpkg -i '/home/zhao/下载/libcudnn8-dev_8.0.3.33-1+cuda10.2_amd64.deb'


安装代码示例和《cuDNN库用户指南》

dpkg -i '/home/zhao/下载/libcudnn8-samples_8.0.3.33-1+cuda10.2_amd64.deb'

安装 docker nvidiaruntime

apt-get install apt-transport-https ca-certificates curl gnupg-agent software-properties-common -y
curl -fsSL https://download.docker.com/linux/ubuntu/gpg | sudo apt-key add -
apt-key fingerprint 0EBFCD88
add-apt-repository "deb [arch=amd64] https://download.docker.com/linux/ubuntu $(lsb_release -cs) stable"
apt-get update
apt-get install docker-ce -y
systemctl enable docker
systemctl start docker
docker run hello-world

取消 docker root 权限

sudo groupadd docker 
sudo gpasswd -a $USER docker     #将登陆用户加入到docker用户组中
newgrp docker     #更新用户组

安装 nvidia-container-toolkit

#Add the package repositories
distribution=$(. /etc/os-release;echo $ID$VERSION_ID)
curl -s -L https://nvidia.github.io/nvidia-docker/gpgkey | sudo apt-key add -
curl -s -L https://nvidia.github.io/nvidia-docker/$distribution/nvidia-docker.list | sudo tee /etc/apt/sources.list.d/nvidia-docker.list
apt-get update && sudo apt-get install -y nvidia-container-toolkit
systemctl restart docker

docker gpu 镜像

https://tensorflow.google.cn/install/docker
https://www.cnblogs.com/g2thend/p/12256018.html
docker pull tensorflow/tensorflow:latest-gpu-jupyter
docker run --gpus all --rm nvidia/cuda nvidia-smi
docker  run --gpus all  -p 8888:8888 tensorflow/tensorflow:latest-gpu-jupyter 
//挂载目录之前 先把 目录 权限打开
docker  run --gpus all  -p 8888:8888 --name user1 --privileged=true    -e PASSWORD=your_jupyter_passwd  -v 公共目录:/home/x -v 私有目录:/home/y     tensorflow/tensorflow:latest-gpu-jupyter 
docker  run --gpus all  -p 8888:8888 --name user1 --privileged=true    -e PASSWORD=your_jupyter_passwd -v 公共目录:/home/x -v 私有目录:/home/y     tensorflow/tensorflow:latest-gpu-jupyter 
docker  run --gpus all  -p 8888:8888 --name user1 --privileged=true    -e PASSWORD=your_jupyter_passwd -v 公共目录:/home/x -v 私有目录:/home/y     tensorflow/tensorflow:latest-gpu-jupyter 
docker run -d --gpus all  -p 18888:8888 --name llhtfgpu23  --privileged=true -v /home/zhao/students:/tf/public  -v /home/zhao/llh:/tf/myself    tensorflow/tensorflow:latest-gpu-jupyter 
docker logs llhtfgpu23

备份系统

sudo root
cd /
todayDate=$(date +'%Y%m%d')
tar -cvpzf backup${todayDate}.tgz --exclude=/proc --exclude=/lost+found --exclude=/backup${todayDate}.tgz --exclude=/mnt --exclude=/sys --exclude=/media /

还原系统

先从 u 盘 系统 启动

// 注意备份系统的时间

sudo tar xvpfz backup.tgz

创建被排除的目录

sudo mkdir proc lost+found mnt sys media
blkid /dev/sdb1
vi /etc/fstab
grub-install /dev/sdb
update-grub2
相关实践学习
部署Stable Diffusion玩转AI绘画(GPU云服务器)
本实验通过在ECS上从零开始部署Stable Diffusion来进行AI绘画创作,开启AIGC盲盒。
相关文章
|
21天前
|
弹性计算 Ubuntu Linux
阿里云服务器一键安装Docker社区版教程,基于系统运维管理OOS
阿里云服务器一键安装Docker社区版教程,基于系统运维管理OOS自动化部署。支持Ubuntu 22.04/20.04、CentOS 7.7-7.9及Alibaba Cloud Linux 3.2104 LTS。前提条件:ECS实例需运行中且有公网。步骤:选择Docker扩展并安装,验证成功通过命令`docker -v`查看版本号。
220 79
|
8天前
|
前端开发 应用服务中间件 nginx
docker安装nginx,前端项目运行
通过上述步骤,你可以轻松地在Docker中部署Nginx并运行前端项目。这种方法不仅简化了部署流程,还确保了环境的一致性,提高了开发和运维的效率。确保按步骤操作,并根据项目的具体需求进行相应的配置调整。
55 25
|
8天前
|
安全 数据安全/隐私保护 Docker
docker私有仓库harbor安装
通过以上步骤,您可以成功在企业内部安装和配置Harbor私有仓库,方便地管理和分发Docker镜像。Harbor不仅提供了基础的镜像管理功能,还增强了安全性、身份管理和审计功能,使其成为企业级容器镜像管理的理想选择。
60 22
|
2天前
|
弹性计算 Ubuntu Java
OS-Copilot-ubuntu镜像版本的具体测试使用(安装方式有单独注明)
作为一名个人开发者,我主要负责云资源的运维和管理。在使用OS Copilot的过程中,我遇到了一些配置问题,特别是在ECS实例中设置AccessKey时,但最终成功解决了。通过使用OS Copilot的-t/-f/管道功能,我大大提升了效率,减少了命令编写的工作量,特别是在搭建Java运行环境时效果显著。此外,| 功能帮助我快速理解文档,整体体验非常流畅,推荐给其他开发者使用。
21 6
|
25天前
|
NoSQL 关系型数据库 Redis
《docker高级篇(大厂进阶):1.Docker复杂安装详说》包括:安装mysql主从复制、安装redis集群
《docker高级篇(大厂进阶):1.Docker复杂安装详说》包括:安装mysql主从复制、安装redis集群
97 14
|
22天前
|
关系型数据库 MySQL 应用服务中间件
《docker基础篇:8.Docker常规安装简介》包括:docker常规安装总体步骤、安装tomcat、安装mysql、安装redis
《docker基础篇:8.Docker常规安装简介》包括:docker常规安装总体步骤、安装tomcat、安装mysql、安装redis
79 7
|
29天前
|
JSON Ubuntu 开发者
ubuntu 22安装lua环境&&编译lua cjson模块
通过上述步骤,可以在 Ubuntu 22.04 系统上成功安装 Lua 环境,并使用 LuaRocks 或手动编译的方式安装 lua-cjson 模块。本文详细介绍了每一步的命令和操作,确保每一步都能顺利完成,适合需要在 Ubuntu 系统上配置 Lua 开发环境的开发者参考和使用。
126 13
|
26天前
|
监控 关系型数据库 MySQL
Ubuntu24.04安装Librenms
此指南介绍了在Linux系统上安装和配置LibreNMS网络监控系统的步骤。主要内容包括:安装所需软件包、创建用户、克隆LibreNMS仓库、设置文件权限、安装PHP依赖、配置时区、设置MariaDB数据库、调整PHP-FPM与Nginx配置、配置SNMP及防火墙、启用命令补全、设置Cron任务和日志配置,最后通过网页完成安装。整个过程确保LibreNMS能稳定运行并提供有效的网络监控功能。
|
存储 Ubuntu Linux
【云原生 | 02】分别在CentOS、Ubuntu、macOS、win7、win8、win10等不同操作系统下安装Docker详细教程
Docker引擎是使用Docker容器的核心组件,可以在主流的操作系统和云平台上使用, 包括 Linux 操作系统(如 Ubuntu、Debian、CentOS、Redhat 等),macOS 和 Windows 操作系统, 以及IBM、亚马逊、微软等知名云平台.........
469 0
|
8月前
|
Ubuntu Docker 索引
ubuntu 20.04 安装docker教程和安装中遇到的问题解决方案(超详细 附加图文教程)
ubuntu 20.04 安装docker教程和安装中遇到的问题解决方案(超详细 附加图文教程)
1425 0

热门文章

最新文章