故障案例-ESXI6.7 EP13 紫屏分析

简介: 一台ESXI6.7 EP13 紫屏分析过程

产品版本信息。
Huawei RH2288H V3 | BIOS: 3.87 | Date (ISO-8601): 2018-02-02
VMware ESXi 6.5.0 build-5969303
ESXi 6.5 U1 ESXi 6.5 U1 7/27/2017 5969303 N/A

下面是紫萍发生时的stacktrace,显示LINT1/NMI 导致的紫萍,应该是硬件问题。
2020-07-22T19:47:32.067Z cpu0:66825)@BlueScreen: LINT1/NMI (motherboard nonmaskable interrupt), undiagnosed. This may be a hardware problem; please contact your hardware vendor.
2020-07-22T19:47:32.068Z cpu0:66825)Code start: 0x41802ca00000 VMK uptime: 127:07:45:14.433
2020-07-22T19:47:32.068Z cpu0:66825)0x4380c0002c60:[0x41802caed451]PanicvPanicInt@vmkernel#nover+0x545 stack: 0x41802caed451
2020-07-22T19:47:32.068Z cpu0:66825)0x4380c0002d00:[0x41802caed4dd]Panic_NoSave@vmkernel#nover+0x4d stack: 0x4380c0002d60
2020-07-22T19:47:32.068Z cpu0:66825)0x4380c0002d60:[0x41802caea7ae]NMICheckLint1@vmkernel#nover+0x19a stack: 0x0
2020-07-22T19:47:32.069Z cpu0:66825)0x4380c0002e20:[0x41802caea844]NMI_Interrupt@vmkernel#nover+0x94 stack: 0x0
2020-07-22T19:47:32.069Z cpu0:66825)0x4380c0002ea0:[0x41802cb2c531]IDTNMIWork@vmkernel#nover+0x99 stack: 0x0
2020-07-22T19:47:32.069Z cpu0:66825)0x4380c0002f20:[0x41802cb2d9c1]Int2_NMI@vmkernel#nover+0x19 stack: 0x418040000000
2020-07-22T19:47:32.069Z cpu0:66825)0x4380c0002f40:[0x41802cb3d044]gate_entry_@vmkernel#nover+0x0 stack: 0x0
2020-07-22T19:47:32.070Z cpu0:66825)0x43916849bcf0:[0x41802ca8b9c2]Power_ArchSetCState@vmkernel#nover+0x106 stack: 0x7fffffffffffffff
2020-07-22T19:47:32.070Z cpu0:66825)0x43916849bd20:[0x41802ccc49d3]CpuSchedIdleLoopInt@vmkernel#nover+0x39b stack: 0x1
2020-07-22T19:47:32.070Z cpu0:66825)0x43916849bd90:[0x41802ccc728a]CpuSchedDispatch@vmkernel#nover+0x114a stack: 0x410000000001
2020-07-22T19:47:32.071Z cpu0:66825)0x43916849bec0:[0x41802ccc8502]CpuSchedWait@vmkernel#nover+0x27a stack: 0x100000000000000
2020-07-22T19:47:32.071Z cpu0:66825)0x43916849bf40:[0x41802ccc85d5]CpuSched_NoEvqWait@vmkernel#nover+0x19 stack: 0x0
2020-07-22T19:47:32.071Z cpu0:66825)0x43916849bf50:[0x41802d5cc345]TcpipDispatch@(tcpip4)#+0x345 stack: 0x6
2020-07-22T19:47:32.071Z cpu0:66825)0x43916849bfe0:[0x41802ccc91b5]CpuSched_StartWorld@vmkernel#nover+0x99 stack: 0x0
2020-07-22T19:47:32.075Z cpu0:66825)base fs=0x0 gs=0x418040000000 Kgs=0x0

IPMI日志相同时间点有下面一个event.
162 2020-07-22T19:47:38 2 111 (Unknown) 2 (System Event) 83 Assert + Slot/Connector Fault Status

下一步:
需要服务器硬件厂商做进一步排查

目录
相关文章
|
网络协议 数据安全/隐私保护 Windows
Windows Server 各版本搭建域控制器实现通过域管理用户(03~19)
Windows Server 各版本搭建域控制器实现通过域管理用户(03~19)
使用vos3000时sip O 口网关注册成对接网关作为 ivr 接入,主叫号码如何设置
在VOS3000系统中,将SIP终端作为IVR接入点涉及配置SIP网关指向IVR应用,注册SIP设备并设定含用户名和域名的SIP账户。主叫号码设置可在注册时通过 Caller-ID 头部或拨号计划完成。拨号规则用于控制主叫号码传递,例如根据来源自动调整。配置后需测试主叫号码及IVR接入。不同版本可能有差异,欢迎交流学习。
|
iOS开发
ElasticSearch-Head浏览器插件离线安装
ElasticSearch-Head浏览器插件离线安装
869 0
|
存储 Linux
Linux系统LVM信息丢失处理方法
Linux的LVM会存储用户对PV/VG/LV的每一步操作,并自动把当前的VG的信息备份到一个文件里面,该文件为/etc/lvm/backup/VG名,本文描述了当信息丢失时如何找回的处理方法。
10368 60
Linux系统LVM信息丢失处理方法
|
3月前
|
安全 Linux Shell
CentOS恢复或重置遗忘的root用户密码的方法
至此,整个手术过程完成。没有繁复的迷魂阵,也无需烧香拜佛,就这样直截了当,你已经成功将被遗忘的密码变成了新的秘密。就像你的影子随形,但却更加隐秘安全。这不仅限于CentOS,其实许多Linux系统对于这样的技巧也会乖乖听话。这样的流程就像变魔术一样,让你重新掌握了“开关命运”的钥匙。
242 12
|
7月前
|
虚拟化 iOS开发 MacOS
VMware ESXi 7.0U3r macOS Unlocker & OEM BIOS 2.7 集成网卡驱动和 NVMe 驱动 (集成驱动版)
VMware ESXi 7.0U3r macOS Unlocker & OEM BIOS 2.7 集成网卡驱动和 NVMe 驱动 (集成驱动版)
167 0
VMware ESXi 7.0U3r macOS Unlocker & OEM BIOS 2.7 集成网卡驱动和 NVMe 驱动 (集成驱动版)
|
10月前
|
并行计算 异构计算
建立Hugging Face模型调用环境
本文介绍了如何在环境中导入transformers库,并从Hugging Face网站下载模型。如果使用镜像网站,需获取access token。部分模型需申请仓库权限,建议使用国外信息填写。有GPU的用户需先配置CUDA和pytorch-gpu。
|
11月前
|
存储 固态存储 Go
M.2移动硬盘打造Win To Go系统:高效分区存储文件全攻略
【10月更文挑战第11天】Win To Go 是一种将 Windows 系统安装在 M.2 移动硬盘上的技术,便于用户携带自定义系统跨设备使用。需准备高性能 M.2 硬盘及合适硬盘盒,并使用 DiskGenius 或 Rufus 进行分区与系统安装。系统分区用于安装 Windows,其余分区可根据需求存储工作或娱乐文件,便于管理和备份。
1126 2
单机elasticsearch设置远程访问
我这里是在虚拟机安装的es,虚拟机系统用的是优麒麟20.04
|
算法 NoSQL 安全
腾讯云服务器操作系统TencentOS安装与体验
腾讯云服务器操作系统TencentOS安装与体验
1598 0
腾讯云服务器操作系统TencentOS安装与体验