文档备案控制台

开发者社区人工智能文章正文

GPU 显存释放

2023-05-28 823

版权

版权声明：

本文内容由阿里云实名注册用户自发贡献，版权归原作者所有，阿里云开发者社区不拥有其著作权，亦不承担相应法律责任。具体规则请查看《阿里云开发者社区用户服务协议》和《阿里云开发者社区知识产权保护指引》。如果您发现本社区中有涉嫌抄袭的内容，填写侵权投诉表单进行举报，一经查实，本社区将立刻删除涉嫌侵权内容。

简介： GPU 显存释放

我们在使用tensorflow 的时候,　有时候会在控制台终止掉正在运行的程序，但是有时候程序已经结束了，nvidia-smi也看到没有程序了，但是ＧＰＵ的内存并没有释放，那么怎么解决该问题呢？

首先执行下面的命令：

fuser -v /dev/nvidia* #查找占用GPU资源的PID
1.

因为我们只有一块显卡，所以显示如下图所示:

可以看到我们的nvidia0上还有一个python 2.7的PID

然后我们执行：

kill -9 pid
1.

然后再执行nvidia-smi就可以看到内存已经被释放了

GPU 显存实施查看：

但是有时我们希望不仅知道那一固定时刻的GPU使用情况，我们希望一直掌握其动向，此时我们就希望周期性地输出，比如每 10s 就更新显示。

这时候就需要用到 watch命令，来周期性地执行nvidia-smi命令了。

了解一下watch的功能：

$ whatis watch

watch(1) - execute a program periodically, showing output fullscreen

作用：周期性执行某一命令，并将输出显示。

watch的基本用法是：

$ watch [options] command

最常用的参数是 -n，后面指定是每多少秒来执行一次命令。

监视显存：我们设置为每 10s 显示一次显存的情况：

$ watch -n 10 nvidia-smi

查看是否使用GPU计算：

import tensorflow as tf

sess = tf.Session(config=tf.ConfigProto(log_device_placement=True))

查看日志信息若包含gpu信息，就是使用了gpu。

其他方法：跑计算量大的代码，通过 nvidia-smi 命令查看gpu的内存使用量。

GPU 显存释放
https://blog.51cto.com/u_15127636/4138030

文章标签：

GPU云服务器

Python

算法框架/工具

异构计算

TensorFlow

关键词：

GPU云服务器显存

相关实践学习

在云上部署ChatGLM2-6B大模型（GPU版）

ChatGLM2-6B是由智谱AI及清华KEG实验室于2023年6月发布的中英双语对话开源大模型。通过本实验，可以学习如何配置AIGC开发环境，如何部署ChatGLM2-6B大模型。

linuszhang

目录

相关文章

蚝油菜花

|

人工智能并行计算 Linux

斯坦福黑科技让笔记本GPU也能玩转AI视频生成！FramePack：压缩输入帧上下文长度！仅需6GB显存即可生成高清动画

斯坦福大学推出的FramePack技术通过压缩输入帧上下文长度，解决视频生成中的"遗忘"和"漂移"问题，仅需6GB显存即可在普通笔记本上实时生成高清视频。

蚝油菜花

2856 19 19

斯坦福黑科技让笔记本GPU也能玩转AI视频生成！FramePack：压缩输入帧上下文长度！仅需6GB显存即可生成高清动画

CVHub

|

机器学习/深度学习人工智能 PyTorch

CVHub手把手帮你榨干GPU的显存

CVHub手把手帮你榨干GPU的显存

CVHub

393 0 0

余二五

|

异构计算算法框架/工具 TensorFlow

Ubuntu-Tensorflow 程序结束掉GPU显存没有释放的问题

余二五

3121 0 0

八进智

|

8月前

|

人工智能算法调度

阿里云ACK托管集群Pro版共享GPU调度操作指南

本文介绍在阿里云ACK托管集群Pro版中，如何通过共享GPU调度实现显存与算力的精细化分配，涵盖前提条件、使用限制、节点池配置及任务部署全流程，提升GPU资源利用率，适用于AI训练与推理场景。

八进智

676 1 1

专有云小编

|

8月前

|

人工智能城市大脑运维

喜讯！阿里云国产异构GPU云平台技术荣获“2025算力中国·年度重大成果”

2025年8月23日，在工业和信息化部新闻宣传中心、中国信息通信研究院主办的2025中国算力大会上，阿里云与浙江大学联合研发的“国产异构GPU云平台关键技术与系统”荣获「算力中国·年度重大成果」。该评选旨在选拔出算力产业具有全局性突破价值的重大成果，是业内公认的技术创新“风向标”。

专有云小编

851 0 0

弹性计算小冉

|

存储机器学习/深度学习数据库

阿里云服务器X86/ARM/GPU/裸金属/超算五大架构技术特点、场景适配参考

在云计算技术飞速发展的当下，云计算已经渗透到各个行业，成为企业数字化转型的关键驱动力。选择合适的云服务器架构对于提升业务效率、降低成本至关重要。阿里云提供了多样化的云服务器架构选择，包括X86计算、ARM计算、GPU/FPGA/ASIC、弹性裸金属服务器以及高性能计算等。本文将深入解析这些架构的特点、优势及适用场景，以供大家了解和选择参考。

弹性计算小冉

1592 61 61

阿里云运维工程师

|

存储机器学习/深度学习人工智能

2025年阿里云GPU服务器租用价格、选型策略与应用场景详解

随着AI与高性能计算需求的增长，阿里云提供了多种GPU实例，如NVIDIA V100、A10、T4等，适配不同场景。2025年重点实例中，V100实例GN6v单月3830元起，适合大规模训练；A10实例GN7i单月3213.99元起，适用于混合负载。计费模式有按量付费和包年包月，后者成本更低。针对AI训练、图形渲染及轻量级推理等场景，推荐不同配置以优化成本和性能。阿里云还提供抢占式实例、ESSD云盘等资源优化策略，支持eRDMA网络加速和倚天ARM架构，助力企业在2025年实现智能计算的效率与成本最优平衡。（该简介为原文内容的高度概括，符合要求的字符限制。）

阿里云运维工程师

6767 86 86

弹性计算小冉

|

存储机器学习/深度学习算法

阿里云X86/ARM/GPU/裸金属/超算等五大服务器架构技术特点、场景适配与选型策略

在我们选购阿里云服务器的时候，云服务器架构有X86计算、ARM计算、GPU/FPGA/ASIC、弹性裸金属服务器、高性能计算可选，有的用户并不清楚他们之间有何区别。本文将深入解析这些架构的特点、优势及适用场景，帮助用户更好地根据实际需求做出选择。

弹性计算小冉

1615 6 6

弹性计算小冉

|

机器学习/深度学习人工智能 PyTorch

阿里云GPU云服务器怎么样？产品优势、应用场景介绍与最新活动价格参考

阿里云GPU云服务器怎么样？阿里云GPU结合了GPU计算力与CPU计算力，主要应用于于深度学习、科学计算、图形可视化、视频处理多种应用场景，本文为您详细介绍阿里云GPU云服务器产品优势、应用场景以及最新活动价格。

弹性计算小冉

1200 8 9

阿里云GPU云服务器怎么样？产品优势、应用场景介绍与最新活动价格参考

热门文章

最新文章

GPU实例使用--单实例上运行Linux桌面多开解决方案

用GPU进行TensorFlow计算加速

AI开发者福音！国内首个基于NGC的GPU优化容器已在阿里云正式推出

英伟达新一代GPU架构（50系列显卡）PyTorch兼容性解决方案

NVIDIA GPU Operator分析四：DCGM Exporter安装

GPU架构及异构计算介绍GPU硬件平台

函数计算 FC：首发 GPU 极速模式，更弹性、更降本

GPU加速和CPU有什么不同

分享阿里云服务器GPU实例租用价格表明细

COMET：字节跳动开源MoE训练加速神器，单层1.96倍性能提升，节省百万GPU小时

阿里云服务器多少钱一年？亲自整理ECS、轻量和GPU服务器租赁价格表

Kubernetes集群中，部分使用GPU资源的Pod出现UnexpectedAdmissionError问题的解决方案。

硅谷GPU单节点服务器：技术解析与应用全景

租用阿里云服务器一年要多少钱？ECS、轻量和GPU服务器租赁价格，手动整理

2025年阿里云GPU服务器租用价格与应用场景详解

阿里云ACK托管集群Pro版共享GPU调度操作指南

沐曦 GPU 融入龙蜥，共筑开源 AI 基础设施新底座

阿里云AI基础设施成果入选顶级学术会议，显著提升GPU利用率

阿里云服务器多少钱一年？亲测ECS、轻量、GPU服务器收费价格整理

ACK One 注册集群云端节点池升级：IDC 集群一键接入云端 GPU 算力，接入效率提升 80%

相关课程

更多

云原生AI套件：一键训练大模型及部署GPU共享推理服务

相关电子书

更多

DeepStream: GPU加速海量视频数据智能处理

阿里巴巴高性能GPU架构与应用

GPU在超大规模深度学习中的发展和应用

相关实验场景

更多

在云上部署ChatGLM2-6B大模型（GPU版）

通过GPU云服务器训练GPT-2

下一篇

利用阿里云OSS（对象存储服务）快速搭建私人网盘