显卡风扇不转导致GPU占用100%

简介: 显卡风扇不转导致GPU占用100%

从昨天下午开始,视频测试工作,经常卡顿,几乎成了动画。使用nvidia-smi一看,GPU占用100%。这是怎么回事?


昨晚回去想了半天,猜测跟温度有关。早上来开始测试,一切正常……就是GPU升温太快了,不到10次就超过90度,风扇100%。这……


于是让主管过来看看,他也纳闷,汝程序使用GPU太高?温度95度,查一下机房的1080显卡也就50度什么的(长期使用,占用率高)。于是他打开机箱一看,显卡风扇不转?95度都不转,什么时候转?换了个显卡,再测试,升温就慢了。


有人问了,汝这机器自己组装的?NO,NO,这是洋话……这是DELL的工作站;显卡呢?技嘉,也是大品牌。竟然碰上了,这是何等的……那个。


相关实践学习
部署Stable Diffusion玩转AI绘画(GPU云服务器)
本实验通过在ECS上从零开始部署Stable Diffusion来进行AI绘画创作,开启AIGC盲盒。
目录
相关文章
|
9月前
|
弹性计算 人工智能 网络安全
ECS实例问题之增加GPU显卡失败如何解决
ECS实例指的是在阿里云ECS服务中创建的虚拟计算环境,用户可在此环境中运行应用程序和服务;本合集将介绍ECS实例的创建、管理、监控和维护流程,及常见问题处理方法,助力用户保障实例的稳定运行。
|
9月前
|
机器学习/深度学习 人工智能 API
薅羊毛!阿里云免费GPU云主机畅玩AI绘画,免费领取阿里云v100显卡搭建AI绘画利器Stable Diffusion
薅羊毛!阿里云免费GPU云主机畅玩AI绘画,免费领取阿里云v100显卡搭建AI绘画利器Stable Diffusion
1070 4
薅羊毛!阿里云免费GPU云主机畅玩AI绘画,免费领取阿里云v100显卡搭建AI绘画利器Stable Diffusion
|
机器学习/深度学习 人工智能 芯片
一文详解多模态大模型发展及高频因子计算加速GPU算力 | 英伟达显卡被限,华为如何力挽狂澜?
近年来,全球范围内的芯片禁令不断升级,给许多企业和科研机构带来了很大的困扰,需要在技术层面进行创新和突破。一方面,可以探索使用国产芯片和其他不受限制的芯片来替代被禁用的芯片;另一方面,可以通过优化算法和架构等方法来降低对特定芯片的依赖程度。
|
存储 人工智能 安全
探秘英伟达显卡的制造之路 | 英伟达断供GPU,中国大模型何去何从?
在当今时代,人工智能技术正以前所未有的速度发展,推动着各个领域的创新与变革。作为人工智能技术的核心引擎之一,高性能GPU扮演着至关重要的角色。在这个领域,英伟达的H100无疑是一款备受瞩目的高端产品。它针对高性能计算和人工智能应用而设计,具备强大的计算能力和高内存容量,以及先进的互连技术,可以有效提升集群中的计算效率,加速深度学习、计算机视觉、自然语言处理等领域的AI训练和推理任务。
|
人工智能 大数据 5G
服务器显卡直通和GPU问题分析
服务器显卡直通和GPU问题分析
服务器显卡直通和GPU问题分析
|
机器学习/深度学习 并行计算 TensorFlow
使用anaconda配置gpu版本的tensorflow(30系列以下显卡)
使用anaconda配置gpu版本的tensorflow(30系列以下显卡)
使用anaconda配置gpu版本的tensorflow(30系列以下显卡)
|
机器学习/深度学习 并行计算 PyTorch
使用anaconda配置gpu版本的torch==1.7.1(非30系列以上显卡也可用)
使用anaconda配置gpu版本的torch==1.7.1(非30系列以上显卡也可用)
使用anaconda配置gpu版本的torch==1.7.1(非30系列以上显卡也可用)
|
机器学习/深度学习 并行计算 PyTorch
使用anaconda配置标配版gpu的torch==1.2.0(30系列以下显卡)
使用anaconda配置标配版gpu的torch==1.2.0(30系列以下显卡)
使用anaconda配置标配版gpu的torch==1.2.0(30系列以下显卡)
|
并行计算 程序员 TensorFlow
CV:查看本地的电脑显卡是否支持GPU以及需要安装匹配的CUDA版本、tensorflow_gpu版本等
CV:查看本地的电脑显卡是否支持GPU以及需要安装匹配的CUDA版本、tensorflow_gpu版本等
CV:查看本地的电脑显卡是否支持GPU以及需要安装匹配的CUDA版本、tensorflow_gpu版本等
|
2天前
|
存储 机器学习/深度学习 人工智能
2025年阿里云GPU服务器租用价格、选型策略与应用场景详解
随着AI与高性能计算需求的增长,阿里云提供了多种GPU实例,如NVIDIA V100、A10、T4等,适配不同场景。2025年重点实例中,V100实例GN6v单月3830元起,适合大规模训练;A10实例GN7i单月3213.99元起,适用于混合负载。计费模式有按量付费和包年包月,后者成本更低。针对AI训练、图形渲染及轻量级推理等场景,推荐不同配置以优化成本和性能。阿里云还提供抢占式实例、ESSD云盘等资源优化策略,支持eRDMA网络加速和倚天ARM架构,助力企业在2025年实现智能计算的效率与成本最优平衡。 (该简介为原文内容的高度概括,符合要求的字符限制。)

热门文章

最新文章