关于kvm安装Linux时的CPU soft lockup报错解决方案

简介: 关于kvm安装Linux时的CPU soft lockup报错解决方案

最近对云原生比较感兴趣,因此决定使用vm虚拟机,给该Linux虚拟机安装kvm环境后,在这个虚拟机里再安装一个Linux。

问题解决的经历:


但世事难料啊,因为N年以前有过成功安装kvm的虚拟机经验,因此,还是按照原来的经验,一路安装,kvm虚拟环境就不用说了,手到擒来的事情。但进入安装界面后,报CPU软锁了。

image.png

一,

无奈之下,祭出CPU映射大法,因宿主机是e5CPU,考虑到是一个比较标准的服务器级别CPU,应该没什么问题了吧,但,问题依旧。

二,

后来仔细查看了系统日志,发现报错和看门狗也就是watchdog有关,因此,秉承解决不了的问题,就解决提出问题的人的原则,修改内核参数,将watchlog关闭,但,问题依旧。(备注,关闭看门狗方法如下)

/etc/sysctl.conf 文件内添加kernel.nmi_watchdog = 0,然后执行sysctl -p 使之立即生效。

# sysctl settings are defined through files in
# /usr/lib/sysctl.d/, /run/sysctl.d/, and /etc/sysctl.d/.
#
# Vendors settings live in /usr/lib/sysctl.d/.
# To override a whole file, create a new file with the same in
# /etc/sysctl.d/ and put new settings there. To override
# only specific settings, add a file with a lexically later
# name in /etc/sysctl.d/ and put new settings there.
#
# For more information, see sysctl.conf(5) and sysctl.d(5).
kernel.perf_event_max_sample_rate=19000
kernel.nmi_watchdog = 0

 再次观察系统日志,发现watchdog已经成功关闭。

ul 25 09:50:14 localhost kernel: NMI watchdog: disabled (cpu0): hardware events not enabled
Jul 25 09:50:14 localhost kernel: NMI watchdog: Shutting down hard lockup detector on all cpus

但,现实是很残酷的,依然没有任何效果,此路不通。由此推断,这个软锁是真的软锁了。

三,

那么,是真的没有办法了吗??NO NO NO kvm怎么可能安装不了Linux系统的啊,因此,仔细回忆了一下,前面成功的时候是在N年多前,kvm环境的安装是用的阿里云源,而现在的阿里云源和一年多前的阿里云源是不一样的,kvm版本应该是提升了的,其实到这里,解决方案也就呼之欲出了:由于kvm的版本升高导致现有的Linux内核不匹配了,从而造成了软锁问题,因此,要么降低kvm的版本,要么升级Linux的内核这么两条路。kvm降低版本是不可能的,因为老版本可不好寻找的哦,那么,就剩一条路:升级内核啦。

查看现在在使用的kvm 的版本号,命令如下:

[root@centos1 ~]# virsh -c qemu:///system
Welcome to virsh, the virtualization interactive terminal.
Type:  'help' for help with commands
       'quit' to quit
virsh # version
Compiled against library: libvirt 4.5.0
Using library: libvirt 4.5.0
Using API: QEMU 4.5.0
Running hypervisor: QEMU 2.12.0

链接:https://pan.baidu.com/s/1nOJZUlp9reoihOprTkRw9w
提取码:kvms

以上是我制作的离线升级kernel包,解压文件后,执行如下命令即可完成升级:

rpm -ivh kernel-lt-5.4.192-1.el7.elrepo.x86_64.rpm

重启后,进入Linux后,查看内核版本命令为:

1. [root@centos1 ~]# uname  -rv
2. 5.4.192-1.el7.elrepo.x86_64 #1 SMP Thu May 5 19:16:52 EDT 2022

原来的版本是3.10 ,现在升级到了5.4.192.

升级完成后,重启虚拟机,选择5.4内核启动,在启动kvm安装,世界清净了~~~~~~~~~~~  下面是我安装好的kvm虚拟机截图:

image.png

目录
相关文章
|
4月前
|
安全 Linux iOS开发
Tenable Nessus 10.10 (macOS, Linux, Windows) - 漏洞评估解决方案
Tenable Nessus 10.10 (macOS, Linux, Windows) - 漏洞评估解决方案
379 0
Tenable Nessus 10.10 (macOS, Linux, Windows) - 漏洞评估解决方案
|
10月前
|
运维 Linux 虚拟化
Linux 查看 CPU 使用情况
在 Linux 系统中,查看 CPU 使用情况是性能分析和故障排查的重要环节。查看 CPU 使用情况,使用 top 命令或者 htop 命令来查看。
|
10月前
|
安全 Unix Linux
Veritas NetBackup 11 for Linux & Windows - 领先的企业备份和恢复解决方案
Veritas NetBackup 11 for Linux & Windows - 领先的企业备份和恢复解决方案
403 0
Veritas NetBackup 11 for Linux & Windows - 领先的企业备份和恢复解决方案
|
5月前
|
安全 Linux iOS开发
Tenable Nessus 10.9.3 (macOS, Linux, Windows) - 漏洞评估解决方案
Tenable Nessus 10.9.3 (macOS, Linux, Windows) - 漏洞评估解决方案
602 0
Tenable Nessus 10.9.3 (macOS, Linux, Windows) - 漏洞评估解决方案
|
Linux 数据库 iOS开发
CrossOver 25.1.0 for macOS & Linux - 领先的 Wine 解决方案
CrossOver 25.1.0 for macOS & Linux - 领先的 Wine 解决方案
550 0
|
5月前
|
人工智能 机器人 Linux
开源的基于RTOnBoot多核异构框架打造的低成本高性能Linux主控加Ethercat主站解决方案,同步周期可稳定达到125微秒
开源的基于RTOnBoot多核异构框架打造的低成本高性能Linux主控加Ethercat主站解决方案,同步周期可稳定达到125微秒
|
9月前
|
存储 安全 Linux
Nexpose 8.4.1 for Linux & Windows - 领先的漏洞管理解决方案
Nexpose 8.4.1 for Linux & Windows - 领先的漏洞管理解决方案
222 0
Nexpose 8.4.1 for Linux & Windows - 领先的漏洞管理解决方案
|
10月前
|
容器
【Azure Container App】在消耗性的Container App Environmnet中无法查看当时正在使用多少CPU多少实例数的替代方案
在 Azure Container Apps 中使用 Consumption 消耗型环境时,无法通过门户查看当前核心 (CPU) 和实例使用情况。这是因为消耗型工作负载配置文件的设计所致。若需查看使用状态,可使用 az cli 命令 `az containerapp env list-usages` 获取详细信息,包括 Current Cores 数量。文档还提供了参考资料链接以帮助用户深入了解相关命令用法。
217 19