ubuntu18 安装 gpu 和 docker 驱动

简介: ubuntu18 安装 gpu 和 docker 驱动

创建 root

sudo passwd root
su root

参考博客

https://blog.csdn.net/weixin_38661447/article/details/106796349

华为镜像元 配置

sudo cp -a /etc/apt/sources.list /etc/apt/sources.list.bak
sudo sed -i "s@http://.*archive.ubuntu.com@http://repo.huaweicloud.com@g" /etc/apt/sources.list
sudo sed -i "s@http://.*security.ubuntu.com@http://repo.huaweicloud.com@g" /etc/apt/sources.list
apt-get update

更新 vim 防止 方向键 乱码

关闭 nouveau

vim /etc/modprobe.d/blacklist.conf
sudo echo " blacklist nouveau "  >> /etc/modprobe.d/blacklist.conf
blacklist nouveau
update-initramfs -u
检查
lsmod | grep nouveau
//无输出表示成功

安装 gpu 驱动

10.2 440

参考

https://blog.csdn.net/qq_43373608/article/details/103314435


添加驱动源

add-apt-repository ppa:graphics-drivers/ppa
apt-get update
apt install nvidia-driver-440 -y

安装 cuda10.2

wget http://developer.download.nvidia.com/compute/cuda/10.2/Prod/local_installers/cuda_10.2.89_440.33.01_linux.run
sh cuda_10.2.89_440.33.01_linux.run
配置环境变量
vi ~/.bashrc
export PATH="/usr/local/cuda-10.2/bin:$PATH"
export LD_LIBRARY_PATH="/usr/local/cuda-10.2/lib64:$LD_LIBRARY_PATH"
下载 https://developer.nvidia.com/cudnn



安装runtime库

dpkg -i '/home/zhao/下载/libcudnn8_8.0.3.33-1+cuda10.2_amd64.deb'


安装developer库

dpkg -i '/home/zhao/下载/libcudnn8-dev_8.0.3.33-1+cuda10.2_amd64.deb'


安装代码示例和《cuDNN库用户指南》

dpkg -i '/home/zhao/下载/libcudnn8-samples_8.0.3.33-1+cuda10.2_amd64.deb'

安装 docker nvidiaruntime

apt-get install apt-transport-https ca-certificates curl gnupg-agent software-properties-common -y
curl -fsSL https://download.docker.com/linux/ubuntu/gpg | sudo apt-key add -
apt-key fingerprint 0EBFCD88
add-apt-repository "deb [arch=amd64] https://download.docker.com/linux/ubuntu $(lsb_release -cs) stable"
apt-get update
apt-get install docker-ce -y
systemctl enable docker
systemctl start docker
docker run hello-world

取消 docker root 权限

sudo groupadd docker 
sudo gpasswd -a $USER docker     #将登陆用户加入到docker用户组中
newgrp docker     #更新用户组

安装 nvidia-container-toolkit

#Add the package repositories
distribution=$(. /etc/os-release;echo $ID$VERSION_ID)
curl -s -L https://nvidia.github.io/nvidia-docker/gpgkey | sudo apt-key add -
curl -s -L https://nvidia.github.io/nvidia-docker/$distribution/nvidia-docker.list | sudo tee /etc/apt/sources.list.d/nvidia-docker.list
apt-get update && sudo apt-get install -y nvidia-container-toolkit
systemctl restart docker

docker gpu 镜像

https://tensorflow.google.cn/install/docker
https://www.cnblogs.com/g2thend/p/12256018.html
docker pull tensorflow/tensorflow:latest-gpu-jupyter
docker run --gpus all --rm nvidia/cuda nvidia-smi
docker  run --gpus all  -p 8888:8888 tensorflow/tensorflow:latest-gpu-jupyter 
//挂载目录之前 先把 目录 权限打开
docker  run --gpus all  -p 8888:8888 --name user1 --privileged=true    -e PASSWORD=your_jupyter_passwd  -v 公共目录:/home/x -v 私有目录:/home/y     tensorflow/tensorflow:latest-gpu-jupyter 
docker  run --gpus all  -p 8888:8888 --name user1 --privileged=true    -e PASSWORD=your_jupyter_passwd -v 公共目录:/home/x -v 私有目录:/home/y     tensorflow/tensorflow:latest-gpu-jupyter 
docker  run --gpus all  -p 8888:8888 --name user1 --privileged=true    -e PASSWORD=your_jupyter_passwd -v 公共目录:/home/x -v 私有目录:/home/y     tensorflow/tensorflow:latest-gpu-jupyter 
docker run -d --gpus all  -p 18888:8888 --name llhtfgpu23  --privileged=true -v /home/zhao/students:/tf/public  -v /home/zhao/llh:/tf/myself    tensorflow/tensorflow:latest-gpu-jupyter 
docker logs llhtfgpu23

备份系统

sudo root
cd /
todayDate=$(date +'%Y%m%d')
tar -cvpzf backup${todayDate}.tgz --exclude=/proc --exclude=/lost+found --exclude=/backup${todayDate}.tgz --exclude=/mnt --exclude=/sys --exclude=/media /

还原系统

先从 u 盘 系统 启动

// 注意备份系统的时间

sudo tar xvpfz backup.tgz

创建被排除的目录

sudo mkdir proc lost+found mnt sys media
blkid /dev/sdb1
vi /etc/fstab
grub-install /dev/sdb
update-grub2
相关实践学习
在云上部署ChatGLM2-6B大模型(GPU版)
ChatGLM2-6B是由智谱AI及清华KEG实验室于2023年6月发布的中英双语对话开源大模型。通过本实验,可以学习如何配置AIGC开发环境,如何部署ChatGLM2-6B大模型。
相关文章
|
11月前
|
关系型数据库 应用服务中间件 nginx
Docker一键安装中间件(RocketMq、Nginx、MySql、Minio、Jenkins、Redis)
本系列脚本提供RocketMQ、Nginx、MySQL、MinIO、Jenkins和Redis的Docker一键安装与配置方案,适用于快速部署微服务基础环境。
|
9月前
|
关系型数据库 数据库 PostgreSQL
docker 安装 Postgres 17.6
本文介绍如何通过Docker安装和配置PostgreSQL 17.6。内容包括拉取镜像、导出配置文件、运行容器并挂载数据与配置文件目录,以及进入容器使用psql操作数据库的完整步骤,便于持久化管理和自定义配置。
1573 3
docker 安装 Postgres 17.6
|
8月前
|
NoSQL 算法 Redis
【Docker】(3)学习Docker中 镜像与容器数据卷、映射关系!手把手带你安装 MySql主从同步 和 Redis三主三从集群!并且进行主从切换与扩容操作,还有分析 哈希分区 等知识点!
Union文件系统(UnionFS)是一种**分层、轻量级并且高性能的文件系统**,它支持对文件系统的修改作为一次提交来一层层的叠加,同时可以将不同目录挂载到同一个虚拟文件系统下(unite several directories into a single virtual filesystem) Union 文件系统是 Docker 镜像的基础。 镜像可以通过分层来进行继承,基于基础镜像(没有父镜像),可以制作各种具体的应用镜像。
894 6
|
8月前
|
Java Linux 虚拟化
【Docker】(1)Docker的概述与架构,手把手带你安装Docker,云原生路上不可缺少的一门技术!
1. Docker简介 1.1 Docker是什么 为什么docker会出现? 假定您在开发一款平台项目,您的开发环境具有特定的配置。其他开发人员身处的环境配置也各有不同。 您正在开发的应用依赖于您当前的配置且还要依赖于某些配置文件。 您的企业还拥有标准化的测试和生产环境,且具有自身的配置和一系列支持文件。 **要求:**希望尽可能多在本地模拟这些环境而不产生重新创建服务器环境的开销 问题: 要如何确保应用能够在这些环境中运行和通过质量检测? 在部署过程中不出现令人头疼的版本、配置问题 无需重新编写代码和进行故障修复
719 2
|
9月前
|
关系型数据库 MySQL Linux
事项驱动的项目管理工具Dectask的Docker安装教程
Dectask是智能驱动的新一代项目协作工具,本人介绍其Docker安装教程。
247 2
|
数据可视化 开发工具 git
GitOps 驱动的 Docker Compose 可视工具化来了,图形化编辑器上玩转容器编排
Docker Compose 简化了多容器应用的部署,但随着应用复杂度上升,文本配置方式逐渐暴露出维护难、协作效率低等问题。基于 GitOps 的可视化 Docker Compose 工具应运而生,通过图形界面降低使用门槛,提升配置准确性和团队协作效率。结合 GitOps,实现配置变更的版本追踪、自动化部署与环境一致性,为多容器应用管理提供高效、安全的解决方案。
|
9月前
|
机器学习/深度学习 人工智能 容灾
硅谷GPU云托管:驱动AI革命的下一代计算基石
在人工智能与高性能计算席卷全球的今天,硅谷作为科技创新的心脏,正通过GPU云托管服务重新定义计算能力的边界。无论您是初创公司的机器学习工程师,还是跨国企业的研究团队,硅谷GPU云托管已成为实现突破性创新的关键基础设施。
|
12月前
|
存储 NoSQL MongoDB
Docker中安装MongoDB并配置数据、日志、配置文件持久化。
现在,你有了一个运行在Docker中的MongoDB,它拥有自己的小空间,对高楼大厦的崩塌视而不见(会话丢失和数据不持久化的问题)。这个MongoDB的数据、日志、配置文件都会妥妥地保存在你为它精心准备的地方,天旋地转,它也不会失去一丁点儿宝贵的记忆(即使在容器重启后)。
1589 4
|
11月前
|
Linux Docker Windows
windows docker安装报错适用于 Linux 的 Windows 子系统必须更新到最新版本才能继续。可通过运行 “wsl.exe --update” 进行更新。
适用于 Linux 的 Windows 子系统需更新至最新版本(如 wsl.2.4.11.0.x64.msi)以解决 2025 年 Windows 更新后可能出现的兼容性问题。用户可通过运行 “wsl.exe --update” 或访问提供的链接下载升级包进行更新。
4285 0