Linux 系统故障分析与排查

本文涉及的产品
日志服务 SLS,月写入数据量 50GB 1个月
简介:
   在Linux系统中,同样需要进行大量的备份来完成系统的维护工作,并且使用复制粘贴命令即可完成,在接下来的时间中介绍一些关于Linux系统故障分析与排查的操作。
日志服务器的部署
      通过一台RHEL5作为日志服务器A,一台RHEL5作为客户机B,需要将客户机B上的日志文件直接保存在日志服务器上,以保证日志安全。
步骤一:配置日志服务器A的IP地址,在实验之前希望在虚拟机上多添加一块硬盘,以方便后面的操作。
image
通过setup 命令进行设置,根据上图可以看到 日志服务器A 的IP地址为192.168.99.1,子网掩码:255.255.255.0
步骤二:修改 /etc/sysconfig/syslog 文件中的 SYSLOGD_OPTIONS 行, 加入-r选项。(使用vi工具)
image
为了使修改生效,要重新启动syslog服务。
image
步骤三:修改客户机B的IP地址,并测试通信。
image
image
步骤四: 修改客户机的 /etc/syslog.conf 配置文件,将cron(测试服务)的日志地址改为  @192.168.99.1
image
为使生效,同样要重新启动syslog服务。
image
步骤五: 测试是否成功,在客户机上创建人物计划 ,查询日志服务器是否有日志产生。
image
切换到日志服务器上查询。
clip_image002
这样就完成了日志服务器的部署。
MBR扇区故障分析与排查
      MBR扇区数据包含着硬盘的分区表,当MBR扇区遭到破坏,整个硬盘的数据就岌岌可危,我们可以通过备份的方式免除这种灾难性伤害。下面我们通过本章实验完成备份,模拟破坏,还原的操作。
步骤一: 备份MBR扇区数据
image
这里的 /bak目录,是我新加硬盘所挂载上去的。
步骤二: 模拟MBR扇区故障
使用dd命令,用zero(0设备)填充mbr扇区,模拟mbr扇区损坏。
image
重新启动系统,发现系统故障启动不起来。
步骤三: 重新启动并放入REHL5的光盘,在引导界面输入linux rescue 进入故障修复模式
image
步骤四: 进入故障恢复模式后,挂在我们备份的光盘,并将备份文件还原。
image
在这个界面是让你选择是否重新初始化磁盘,如果YES则原来的数据就全部丢失了,所以这里一定选择NO。
image
完成后执行reboot重新启动即可。
GRUB引导故障分析与排查
      GRUB是提供系统引导的,当GRUB引导损坏,则必须使用手动启动。然后进行还原才能完成修复。
步骤一: 查看 /boot/grub/grub.conf 文件,查看手动引导的命令。
image
步骤二: 备份GRUB文件,就是备份 /boot/grub/grub.conf
image
步骤三: 当GRUB引导故障之后 会直接进入grub>的界面,我们输入步骤一的三行命令即可进入系统。
image
然后使用boot进入系统。
步骤四: 这时候直接将备份的文件复制回去即可。
image
如果没有备份,可以将光盘放入,重新安装,命令如下:
chroot /mnt/sysimage
grub-install /dev/sda
exit
exit
完成。
遗忘root密码:
步骤一: 重新启动计算机,当进入引导的时候使用上下方向键取消倒计时,按e进入编辑界面。
image
进入之后进到这行再按e 键,在这行后面加上一个 1 或者 s 并回车使用 b 进入单用户模式。
image
进到以下模式即可直接修改密码,然后重新启动。


本文转自 郑伟  51CTO博客,原文链接:http://blog.51cto.com/zhengweiit/362361
相关实践学习
日志服务之使用Nginx模式采集日志
本文介绍如何通过日志服务控制台创建Nginx模式的Logtail配置快速采集Nginx日志并进行多维度分析。
目录
打赏
0
0
0
0
344
分享
相关文章
Linux错误排查:解决Ubuntu 20.4执行sudo apt-get update时出现的libnettle.so.6错误。
很有可能在你得到解决方案时,你也学到了不少Linux修复技巧。祝你处理计算机问题时顺利如麻!永远记得,各种问题总是像老鼠一样从意想不到的地方冒出来。但记住,不管它们跑到哪里,最终都逃不过你的捕鼠器。盖起你的计算机,拾起你的代码,大步向前!
41 28
Linux系统资源管理:多角度查看内存使用情况。
要知道,透过内存管理的窗口,我们可以洞察到Linux系统运行的真实身姿,如同解剖学家透过微观镜,洞察生命的奥秘。记住,不要惧怕那些高深的命令和参数,他们只是你掌握系统"魔法棒"的钥匙,熟练掌握后,你就可以骄傲地说:Linux,我来了!
72 27
Linux错误排查:解决Ubuntu 20.4执行sudo apt-get update时出现的libnettle.so.6错误。
很有可能在你得到解决方案时,你也学到了不少Linux修复技巧。祝你处理计算机问题时顺利如麻!永远记得,各种问题总是像老鼠一样从意想不到的地方冒出来。但记住,不管它们跑到哪里,最终都逃不过你的捕鼠器。盖起你的计算机,拾起你的代码,大步向前!
52 18
|
8天前
|
Linux基础:文件和目录类命令分析。
总的来说,这些基础命令,像是Linux中藏匿的小矮人,每一次我们使用他们,他们就把我们的指令准确的传递给Linux,让我们的指令变为现实。所以,现在就开始你的Linux之旅,挥动你的命令之剑,探索这个充满神秘而又奇妙的世界吧!
54 19
|
12天前
|
Linux系统ext4磁盘扩容实践指南
这个过程就像是给你的房子建一个新的储物间。你需要先找到空地(创建新的分区),然后建造储物间(格式化为ext4文件系统),最后将储物间添加到你的房子中(将新的分区添加到文件系统中)。完成这些步骤后,你就有了一个更大的储物空间。
67 10
|
24天前
|
Linux系统中如何查看CPU信息
本文介绍了查看CPU核心信息的方法,包括使用`lscpu`命令和读取`/proc/cpuinfo`文件。`lscpu`能快速提供逻辑CPU数量、物理核心数、插槽数等基本信息;而`/proc/cpuinfo`则包含更详细的配置数据,如核心ID和处理器编号。此外,还介绍了如何通过`lscpu`和`dmidecode`命令获取CPU型号、制造商及序列号,并解释了CPU频率与缓存大小的相关信息。最后,详细解析了`lscpu`命令输出的各项参数含义,帮助用户更好地理解CPU的具体配置。
75 8
PCIe 以太网芯片 RTL8125B 的 spec 和 Linux driver 分析备忘
本文详细介绍了 Realtek RTL8125B PCIe 以太网芯片的规格以及在 Linux 中的驱动安装和配置方法。通过深入分析驱动源码,可以更好地理解其工作原理和优化方法。在实际应用中,合理配置和优化驱动程序可以显著提升网络性能和稳定性。希望本文能帮助您更好地使用和管理 RTL8125B,以满足各种网络应用需求。
151 33
深度体验阿里云系统控制台:SysOM 让 Linux 服务器监控变得如此简单
作为一名经历过无数个凌晨三点被服务器报警电话惊醒的运维工程师,我对监控工具有着近乎苛刻的要求。记得去年那次大型活动,我们的主站流量暴增,服务器内存莫名其妙地飙升到90%以上,却找不到原因。如果当时有一款像阿里云 SysOM 这样直观的监控工具,也许我就不用熬通宵排查问题了。今天,我想分享一下我使用 SysOM 的亲身体验,特别是它那令人印象深刻的内存诊断功能。
用的到linux-tomcat端口占用排查-Day5
通过本文的介绍,详细讲解了在CentOS 8系统上排查和解决Tomcat端口占用问题的方法。从使用 `netstat`、`lsof`和 `ss`命令检查端口占用情况,到使用 `ps`和 `top`命令查找和停止占用端口的进程,再到修改Tomcat端口配置,最后介绍了自动化脚本的方法。希望本文能帮助系统管理员和开发者有效地解决端口占用问题,确保Tomcat服务器的正常运行。
39 11
|
14天前
|
微服务2——MongoDB单机部署4——Linux系统中的安装启动和连接
本节主要介绍了在Linux系统中安装、启动和连接MongoDB的详细步骤。首先从官网下载MongoDB压缩包并解压至指定目录,接着创建数据和日志存储目录,并配置`mongod.conf`文件以设定日志路径、数据存储路径及绑定IP等参数。之后通过配置文件启动MongoDB服务,并使用`mongo`命令或Compass工具进行连接测试。此外,还提供了防火墙配置建议以及服务停止的两种方法:快速关闭(直接杀死进程)和标准关闭(通过客户端命令安全关闭)。最后补充了数据损坏时的修复操作,确保数据库的稳定运行。
46 0