服务器硬件故障排查

简介:

电源故障现象
1、接电源线、电源灯不亮
2、电源指示灯报警
3、电源灯正常、按开机键无反应
排查方式:
1、检测电源线的接触是否有松散
2、替换电源测试
3、供电环境检测(是否存在电压不稳定)
4、查看事件日志

主板故障现象:
1、按开机键无效,黑屏
2、设备启动正常,接显示器黑屏
3、设备某些接口或者插槽接配件,导致无法开机

CPU故障现象
1、按开机键无效,黑屏
2、设备自动重启
3、设备无辜宕机
排查方式:
1、检测CPU安装问题
2、替换CPU
3、检测环境(风扇和温度)
4、查看事件日志

内存故障现象
1、按开机键无效,黑屏
2、开机卡自检
3、系统识别内存变小
4、设备无故宕机,重启
排查方式;
1、重新插拔内存,清理内存金手指部位
2、替换内存检测
3、内存插法检测
4、查看事件日志


硬盘故障现象
1、开机进BIOS
2、系统不识别硬盘
3、不进系统光标闪烁
4、设备无故宕机,重启
排查方式:
1、启动顺序检测
2、替换硬盘或检测更换硬盘接口检测
3、raid卡设置检测

设备不开机(电源、主板、CPU)
卡硬件自检(内存、扩展卡)
开机进BIOS(硬盘、启动项)
集中管理
网络唤醒

一、电脑显示器不提示,键盘鼠标显示灯不亮,风扇转动,打开主机箱擦擦内存条再试试,时间长了,可能进了些灰层,若不行返厂自检BIOS

二、服务器启不来进入不了界面,到DHCP就启动不了,可以断电重启试试


三、通过现象反映内存问题

wKiom1kejG3yBZYaAAOCspW9QRM140.jpg

拔内存重新插不能解决。错误就是:无法访问所有安装的内存。系统关闭。我还没装系统。新机器。 
内存错误,错误内存定位在 3号内存板 第三根内存。建议先内存最小化 两个内存板各装两根内存,机器无报错后,再用替换法检测内存

解决方式:

1、拔掉存储器板1(一组内存板)

2、更换内存










本文转自 周小玉 51CTO博客,原文链接:http://blog.51cto.com/maguangjie/1927523,如需转载请自行联系原作者
目录
相关文章
|
传感器 JSON 监控
Springboot + oshi 实现对服务器硬件的监控
OSHI是一个免费的基于JNA的(本机)Java操作系统和硬件信息库。它不需要安装任何额外的本地库,旨在提供跨平台实现来检索系统信息,如操作系统版本、进程、内存和CPU使用情况、磁盘和分区、设备、传感器等。
1646 0
|
运维 Linux
|
存储 数据挖掘 虚拟化
服务器数据恢复—Raid5阵列两块硬盘硬件故障掉线的数据恢复案例
服务器数据恢复环境: 一台某品牌存储设备上有一组由10块硬盘(9块数据盘+1块热备盘)组建的raid5阵列,上层部署vmware exsi虚拟化平台。 服务器故障: raid5阵列中两块硬盘对应的指示灯亮黄灯掉线。硬盘序列号无法读取,通过SAS扩展卡也无法读取。
|
11月前
|
存储 人工智能 运维
面向AI的服务器计算软硬件架构实践和创新
阿里云在新一代通用计算服务器设计中,针对处理器核心数迅速增长(2024年超100核)、超多核心带来的业务和硬件挑战、网络IO与CPU性能增速不匹配、服务器物理机型复杂等问题,推出了磐久F系列通用计算服务器。该系列服务器采用单路设计减少爆炸半径,优化散热支持600瓦TDP,并实现CIPU节点比例灵活配比及部件模块化可插拔设计,提升运维效率和客户响应速度。此外,还介绍了面向AI的服务器架构挑战与软硬件结合创新,包括内存墙问题、板级工程能力挑战以及AI Infra 2.0服务器的开放架构特点。最后,探讨了大模型高效推理中的显存优化和量化压缩技术,旨在降低部署成本并提高系统效率。
|
存储 监控 应用服务中间件
服务器硬件基础知识
服务器硬件基础知识
|
存储 缓存 安全
学习服务器硬件基础知识
服务器是指一种高性能计算机,提供计算、存储和通信服务。通常运行在网络环境中,为计算机、设备或用户提供资源共享、数据存储和处理等服务。服务器可以是专门设计的硬件设备,也可以是在普通计算机上运行的特定软件。
736 6
|
存储 监控 固态存储
计算机服务器硬件基础知识
服务器硬件是计算机系统的重要组成部分,专门设计用于处理大量的数据、复杂的计算和提供持续的服务。了解服务器硬件的基础知识对于确保系统的高效运行和维护至关重要。
208 1
|
存储 缓存 监控
X86架构服务器硬件设计
8月更文挑战第16天
593 0
|
存储 固态存储 安全
服务器硬件基础知识
服务器硬件基础知识
1119 1
|
存储 固态存储 虚拟化
服务器硬件基础知识有哪些?
服务器硬件基础知识有哪些?

热门文章

最新文章