显卡风扇不转导致GPU占用100%

简介: 显卡风扇不转导致GPU占用100%

从昨天下午开始,视频测试工作,经常卡顿,几乎成了动画。使用nvidia-smi一看,GPU占用100%。这是怎么回事?


昨晚回去想了半天,猜测跟温度有关。早上来开始测试,一切正常……就是GPU升温太快了,不到10次就超过90度,风扇100%。这……


于是让主管过来看看,他也纳闷,汝程序使用GPU太高?温度95度,查一下机房的1080显卡也就50度什么的(长期使用,占用率高)。于是他打开机箱一看,显卡风扇不转?95度都不转,什么时候转?换了个显卡,再测试,升温就慢了。


有人问了,汝这机器自己组装的?NO,NO,这是洋话……这是DELL的工作站;显卡呢?技嘉,也是大品牌。竟然碰上了,这是何等的……那个。


相关实践学习
部署Stable Diffusion玩转AI绘画(GPU云服务器)
本实验通过在ECS上从零开始部署Stable Diffusion来进行AI绘画创作,开启AIGC盲盒。
目录
相关文章
|
7月前
|
弹性计算 人工智能 网络安全
ECS实例问题之增加GPU显卡失败如何解决
ECS实例指的是在阿里云ECS服务中创建的虚拟计算环境,用户可在此环境中运行应用程序和服务;本合集将介绍ECS实例的创建、管理、监控和维护流程,及常见问题处理方法,助力用户保障实例的稳定运行。
|
7月前
|
机器学习/深度学习 人工智能 API
薅羊毛!阿里云免费GPU云主机畅玩AI绘画,免费领取阿里云v100显卡搭建AI绘画利器Stable Diffusion
薅羊毛!阿里云免费GPU云主机畅玩AI绘画,免费领取阿里云v100显卡搭建AI绘画利器Stable Diffusion
920 4
薅羊毛!阿里云免费GPU云主机畅玩AI绘画,免费领取阿里云v100显卡搭建AI绘画利器Stable Diffusion
|
机器学习/深度学习 人工智能 芯片
一文详解多模态大模型发展及高频因子计算加速GPU算力 | 英伟达显卡被限,华为如何力挽狂澜?
近年来,全球范围内的芯片禁令不断升级,给许多企业和科研机构带来了很大的困扰,需要在技术层面进行创新和突破。一方面,可以探索使用国产芯片和其他不受限制的芯片来替代被禁用的芯片;另一方面,可以通过优化算法和架构等方法来降低对特定芯片的依赖程度。
|
存储 人工智能 安全
探秘英伟达显卡的制造之路 | 英伟达断供GPU,中国大模型何去何从?
在当今时代,人工智能技术正以前所未有的速度发展,推动着各个领域的创新与变革。作为人工智能技术的核心引擎之一,高性能GPU扮演着至关重要的角色。在这个领域,英伟达的H100无疑是一款备受瞩目的高端产品。它针对高性能计算和人工智能应用而设计,具备强大的计算能力和高内存容量,以及先进的互连技术,可以有效提升集群中的计算效率,加速深度学习、计算机视觉、自然语言处理等领域的AI训练和推理任务。
|
人工智能 大数据 5G
服务器显卡直通和GPU问题分析
服务器显卡直通和GPU问题分析
服务器显卡直通和GPU问题分析
|
机器学习/深度学习 并行计算 TensorFlow
使用anaconda配置gpu版本的tensorflow(30系列以下显卡)
使用anaconda配置gpu版本的tensorflow(30系列以下显卡)
使用anaconda配置gpu版本的tensorflow(30系列以下显卡)
|
机器学习/深度学习 并行计算 PyTorch
使用anaconda配置gpu版本的torch==1.7.1(非30系列以上显卡也可用)
使用anaconda配置gpu版本的torch==1.7.1(非30系列以上显卡也可用)
使用anaconda配置gpu版本的torch==1.7.1(非30系列以上显卡也可用)
|
机器学习/深度学习 并行计算 PyTorch
使用anaconda配置标配版gpu的torch==1.2.0(30系列以下显卡)
使用anaconda配置标配版gpu的torch==1.2.0(30系列以下显卡)
使用anaconda配置标配版gpu的torch==1.2.0(30系列以下显卡)
|
并行计算 程序员 TensorFlow
CV:查看本地的电脑显卡是否支持GPU以及需要安装匹配的CUDA版本、tensorflow_gpu版本等
CV:查看本地的电脑显卡是否支持GPU以及需要安装匹配的CUDA版本、tensorflow_gpu版本等
CV:查看本地的电脑显卡是否支持GPU以及需要安装匹配的CUDA版本、tensorflow_gpu版本等
|
1月前
|
弹性计算 人工智能 Serverless
阿里云ACK One:注册集群云上节点池(CPU/GPU)自动弹性伸缩,助力企业业务高效扩展
在当今数字化时代,企业业务的快速增长对IT基础设施提出了更高要求。然而,传统IDC数据中心却在业务存在扩容慢、缩容难等问题。为此,阿里云推出ACK One注册集群架构,通过云上节点池(CPU/GPU)自动弹性伸缩等特性,为企业带来全新突破。