【linux】nvidia-smi 查看GPU使用率100%

简介: nvidia-smi 查看GPU使用率一直是100%解决办法

linux服务器下使用

nvidia-smi   
or nvidia-smi -l 1【数字表示输出间隔】
or watch -n 1 nvidia-smi  

命令查看GPU使用情况,三种情况

1、没有进程,GPU使用率为空
在这里插入图片描述
这种情况表示,没有进程占用GPU资源,属于为空的正常状态

2、有进程,GPU使用率在变化
在这里插入图片描述
我们如果想要终止进程

ps -ef|grep python

在这里插入图片描述

kill -9 58828  # 58828是该进程id

当然,也可以杀死所有python进程

killall -9 python

以前写的博客有以上教程,戳我进入

3、看不到进程,但是GPU使用率100%
在这里插入图片描述

博主今天就遇到了这种情况,这种情况是不正常的,因此需要将GPU释放掉,不然的话,我无法使用GPU训练模型。

我先用

kill -9 2001

命令后,查看GPU使用情况:
在这里插入图片描述
进程是杀死了,但是GPU占用率还是100%

从网上找到了以下方法:

方法1:
使用

nvidia-smi -pm 1

命令,将驱动模式设置为常驻内存。

但是好像不管用,不知道什么原因。。。只能另寻其他方法

方法2:

使用命令:

fuser -v /dev/nvidia*

在这里插入图片描述
使用命令杀死进程:

kill -9 65051 65052 65053 65054

在这里插入图片描述
GPU占用率都为0%,问题解决。

文章首发于:https://blog.csdn.net/AugustMe/article/details/121142575

参考:

https://blog.csdn.net/sinat_28750977/article/details/80117313

https://blog.csdn.net/gostman/article/details/107456597

相关实践学习
部署Stable Diffusion玩转AI绘画(GPU云服务器)
本实验通过在ECS上从零开始部署Stable Diffusion来进行AI绘画创作,开启AIGC盲盒。
相关文章
|
7月前
|
Linux Shell Perl
Linux脚本实现文件系统使用率大于90%报警
Linux脚本实现文件系统使用率大于90%报警
114 0
|
7月前
|
并行计算 Linux 测试技术
GPU实例使用--单实例上运行Linux桌面多开解决方案
客户前期使用的旧异构实例面临更新换代,新的推荐异构实例性能更强,客户的业务软件运行时,GPU使用率不高,需要探索多开方案,提高GPU使用率,提高实例性价比。
|
7月前
|
存储 Kubernetes Linux
解决Linux中/var/lib/docker/磁盘空间过大及k8s存储卷磁盘空间使用率过高的问题
解决Linux中/var/lib/docker/磁盘空间过大及k8s存储卷磁盘空间使用率过高的问题
938 0
|
Linux
模拟Linux服务器高cpu使用率
模拟Linux服务器高cpu使用率
|
6月前
|
openCL Linux 异构计算
Linux服务器如何查询GPU型号
【6月更文挑战第13天】Linux服务器如何查询GPU型号
1869 1
|
7月前
|
缓存 监控 前端开发
如何在 Linux 命令行中检查 CPU 使用率
【5月更文挑战第8天】
339 0
|
7月前
|
Linux
如何在Linux系统上查看CPU使用率?
以上命令可以帮助你监视和分析Linux系统中的CPU使用率,可以根据需要选择合适的命令进行查看。 买CN2云服务器,免备案服务器,高防服务器,就选蓝易云。百度搜索:蓝易云
164 0
|
7月前
|
并行计算 TensorFlow 算法框架/工具
Linux Ubuntu配置CPU与GPU版本tensorflow库的方法
Linux Ubuntu配置CPU与GPU版本tensorflow库的方法
171 1
|
7月前
|
Linux
linux内存使用率过高分析
linux内存使用率过高分析
64 0
|
7月前
|
弹性计算 Linux 数据安全/隐私保护
Linux【问题记录 01】阿里云CPU使用率 100% ECS 同时连接数峰值 25k+ 问题排查无果(附阿里云重新初始化云盘详细步骤)
Linux【问题记录 01】阿里云CPU使用率 100% ECS 同时连接数峰值 25k+ 问题排查无果(附阿里云重新初始化云盘详细步骤)
363 0