Linux 系统故障排查思路简析

本文涉及的产品
日志服务 SLS,月写入数据量 50GB 1个月
简介:
处理linux系统故障的思路:
    1.重视错误提示信息。
    2.查阅日志文件 。message (系统日志) 服务的日志 error(应用日志)
    3.分析,定位问题。
    4.解决问题。
    忘记root密码?
        重置:centos5或者6    启动加载grub引导菜单时 按esc 找到当前系统引导选项。
        按方向键找到需要的系统引导内核,按 “e“ 进入编辑状态。
        然后通过方向键选中带有kernel指令的行 继续按"e" 在行尾价格空格添加‘single’ 修改完成后
        按回车键进入上一级菜单。然后按"b".进入单用户模式, passwd   输入2次相同的密码。
        然后重新启动系统 (reboot   或是  init 3)
        重置centos7 下的密码:
            同样进入 kernel行尾添加 init=/bin/sh
            ctrl +x   启动shell引导,进入单用户模式。
            挂载根分区:
            mount  -o remount,rw /
            如果系统开启了 selinux 需要在根分区创建 autorelabel文件 (touch /.autorelabel)
            passwd  输入2次一样的密码
            重新启动:  exec  /sbin/init    
    linux 启动不了?
    援救模式启动系统。
        模拟故障: 修改 /etc/fstab  # \mv /etc/fstab /etc/fstab.bak
        启动系统:出现错误;
        Starting system logger: Can't open or create /var/run/syslogd.pid.  Can't write pid .
        解决方法: 在光驱中放入系统盘。用系统盘重新引导启动。
            进入修复模式:Rescue installed system
            启动到shell最终进入   bash-4.1#    命令提示符下:
            可以查看系统分区情况: # fdisk -l
            查看根分区的具体位置: tune2fs -l /dev/sda2 | more
            (/dev/sda2这个参数根据具体分区情况 查找到/ 目录 因为fstab在根目录下)
            找到根分区后挂载根分区。然后重构 fstab文件  
            重新启动系统。看是否读取fstab成功。
    文件系统受损(一般在频繁读写的时候出现断电。容易造成文件系统错误)
        如何查看文件体统类型:
        1. file -s /dev/sda2
        2.  mount
        3.  df -T /dev/sda2
        4.  more /etc/fstab
    如果系统不能修复就需要手动修复了:
     1.卸载 分区 umount
     2.  修复  fsck.ext4 -y /dev/sda5
Linxu网络问题?
     1.网络硬件异常。(网线,网卡,路由器,交换机)
     2.检查网卡是否正常工作(网卡配置文件是否正确)
     3.检查DNS设置  /etc/resolv.conf    /etc/hosts(域名解析服务冲突)
     4.服务是否正常打开。可以通过telnet或者netstat命令查看服务是否正常。
     5.访问权限是否打开,从本机iptalbes 防火墙,linux内核强制访问控制策略selinux。
     6.局域网主机之间联接是否正常,可以通过ping自身ip。ping局域网其它主机IP,ping网关
        地址确定局域网连接正常。
    查看网络路由信息。动态监测 : 
    mtr  域名或ip
    traceroute 域名或ip
    检查服务是否正常:例如sshd 服务:
     # telnet  192.168.1.123 22
    (成功进入telnet后 。如何退出? ctrl + ]   进入telnet> quit 退出 
    检查局域网主机之间联机是否正常:
        ping  ip   | telnet ip port
    错误解析: 一般操作文件系统时。例如 执行 mkdir 时 出现:“Read-only file system“
        可能是文件系统数据块出现不一致导致的,也有可能是磁盘故障造成的。
        对于简单的错误,文件系统一般可自行修复,当遇到致命错误无法修复时,文件系统为了保证数据一致性和安全,会暂时屏蔽文件系统的写操作,将文件系统变为只读,进而出现了上面的“Read-only file system”现象。
        解决: fsck命令修复
        卸载 分区。umount
        可以查看 文件所占用的pid  :  fuser  /
        执行 fsck   (fsck会自动识别文件系统类型)
    文件权限问题:
        # su - swa
        su: warning: cannot change directory to /home/swa: Permission denied
        su: /bin/bash: Permission denied
        查看 /home/下的权限:
           # ls -al
        drwxr-xr-x.  3 root root 4096 Jan 29 04:03 .
        drw-rw-rw-. 24 root root 4096 Jan 29 01:41 ..
        drwx------   2 swa  swa  4096 Jan 29 04:03 swa 
        这里发现 。。  目录没有x (执行权限)
        # chmod  755 .. (修改权限)
        成功切换登录。
        还可以通过 stat  查看 权限
         stat ..
          File: `..'
          Size: 4096            Blocks: 8          IO Block: 4096   directory
        Device: 802h/2050d      Inode: 1046530     Links: 3
        Access: (0755/drwxr-xr-x)  Uid: (    0/    root)   Gid: (    0/    root)
        Access: 2017-01-29 04:03:28.585978590 +0800
        Modify: 2017-01-29 04:03:08.505176624 +0800
        Change: 2017-01-29 04:03:08.505176624 +0800

    服务启动问题: 启动不了服务:
        可以查看 磁盘空间时候写满。或者 innode 是否写满。
        服务启动的时候,会写入日志。如果磁盘满了,日志文件写入不了。服务启动不了。









本文转自 swallow_zys  51CTO博客,原文链接:http://blog.51cto.com/12042068/1897993,如需转载请自行联系原作者
相关实践学习
日志服务之使用Nginx模式采集日志
本文介绍如何通过日志服务控制台创建Nginx模式的Logtail配置快速采集Nginx日志并进行多维度分析。
目录
相关文章
|
9天前
|
Linux
在 Linux 系统中,“cd”命令用于切换当前工作目录
在 Linux 系统中,“cd”命令用于切换当前工作目录。本文详细介绍了“cd”命令的基本用法和常见技巧,包括使用“.”、“..”、“~”、绝对路径和相对路径,以及快速切换到上一次工作目录等。此外,还探讨了高级技巧,如使用通配符、结合其他命令、在脚本中使用,以及实际应用案例,帮助读者提高工作效率。
37 3
|
9天前
|
监控 安全 Linux
在 Linux 系统中,网络管理是重要任务。本文介绍了常用的网络命令及其适用场景
在 Linux 系统中,网络管理是重要任务。本文介绍了常用的网络命令及其适用场景,包括 ping(测试连通性)、traceroute(跟踪路由路径)、netstat(显示网络连接信息)、nmap(网络扫描)、ifconfig 和 ip(网络接口配置)。掌握这些命令有助于高效诊断和解决网络问题,保障网络稳定运行。
29 2
|
19天前
|
Linux 应用服务中间件 Shell
linux系统服务二!
本文详细介绍了Linux系统的启动流程,包括CentOS 7的具体启动步骤,从BIOS自检到加载内核、启动systemd程序等。同时,文章还对比了CentOS 6和CentOS 7的启动流程,分析了启动过程中的耗时情况。接着,文章讲解了Linux的运行级别及其管理命令,systemd的基本概念、优势及常用命令,并提供了自定义systemd启动文件的示例。最后,文章介绍了单用户模式和救援模式的使用方法,包括如何找回忘记的密码和修复启动故障。
41 5
linux系统服务二!
|
3天前
|
Ubuntu Linux 网络安全
linux系统ubuntu中在命令行中打开图形界面的文件夹
在Ubuntu系统中,通过命令行打开图形界面的文件夹是一个高效且实用的操作。无论是使用Nautilus、Dolphin还是Thunar,都可以根据具体桌面环境选择合适的文件管理器。通过上述命令和方法,可以简化日常工作,提高效率。同时,解决权限问题和图形界面问题也能确保操作的顺利进行。掌握这些技巧,可以使Linux操作更加便捷和灵活。
12 3
|
9天前
|
安全 网络协议 Linux
本文详细介绍了 Linux 系统中 ping 命令的使用方法和技巧,涵盖基本用法、高级用法、实际应用案例及注意事项。
本文详细介绍了 Linux 系统中 ping 命令的使用方法和技巧,涵盖基本用法、高级用法、实际应用案例及注意事项。通过掌握 ping 命令,读者可以轻松测试网络连通性、诊断网络问题并提升网络管理能力。
32 3
|
12天前
|
安全 Linux 数据安全/隐私保护
在 Linux 系统中,查找文件所有者是系统管理和安全审计的重要技能。
在 Linux 系统中,查找文件所有者是系统管理和安全审计的重要技能。本文介绍了使用 `ls -l` 和 `stat` 命令查找文件所有者的基本方法,以及通过文件路径、通配符和结合其他命令的高级技巧。还提供了实际案例分析和注意事项,帮助读者更好地掌握这一操作。
31 6
|
12天前
|
Linux
在 Linux 系统中,`find` 命令是一个强大的文件查找工具
在 Linux 系统中,`find` 命令是一个强大的文件查找工具。本文详细介绍了 `find` 命令的基本语法、常用选项和具体应用示例,帮助用户快速掌握如何根据文件名、类型、大小、修改时间等条件查找文件,并展示了如何结合逻辑运算符、正则表达式和排除特定目录等高级用法。
42 6
|
13天前
|
机器学习/深度学习 自然语言处理 Linux
Linux 中的机器学习:Whisper——自动语音识别系统
本文介绍了先进的自动语音识别系统 Whisper 在 Linux 环境中的应用。Whisper 基于深度学习和神经网络技术,支持多语言识别,具有高准确性和实时处理能力。文章详细讲解了在 Linux 中安装、配置和使用 Whisper 的步骤,以及其在语音助手、语音识别软件等领域的应用场景。
43 5
|
13天前
|
缓存 运维 监控
【运维必备知识】Linux系统平均负载与top、uptime命令详解
系统平均负载是衡量Linux服务器性能的关键指标之一。通过使用 `top`和 `uptime`命令,可以实时监控系统的负载情况,帮助运维人员及时发现并解决潜在问题。理解这些工具的输出和意义是确保系统稳定运行的基础。希望本文对Linux系统平均负载及相关命令的详细解析能帮助您更好地进行系统运维和性能优化。
35 3
|
13天前
|
监控 网络协议 算法
Linux内核优化:提升系统性能与稳定性的策略####
本文深入探讨了Linux操作系统内核的优化策略,旨在通过一系列技术手段和最佳实践,显著提升系统的性能、响应速度及稳定性。文章首先概述了Linux内核的核心组件及其在系统中的作用,随后详细阐述了内存管理、进程调度、文件系统优化、网络栈调整及并发控制等关键领域的优化方法。通过实际案例分析,展示了这些优化措施如何有效减少延迟、提高吞吐量,并增强系统的整体健壮性。最终,文章强调了持续监控、定期更新及合理配置对于维持Linux系统长期高效运行的重要性。 ####