Linux下常用系统分析工具总结

简介:

对于程序员来说,整个计算机系统由四个重要的模块组成,分别是:CPU,网络,磁盘,内存。在我们的程序或者系统出现问题时,我们应该分别有一定先后顺序的对这四块进行排查。而在Linux系统下,有很多高效的工具,可以帮助我们分析定位问题。本文对于Linux下常用的一些工具进行一些简单的介绍,帮助读者能对这些工具有一个初步的了解。如果有不对的地方,欢迎随时指正交流。

1.CPU

对于cpu我们主要介绍top,strace,perf,vmstat。

1.1 top

top命令可以实时动态地查看系统的整体运行情况,是一个综合了多方信息监测系统性能和运行信息的实用工具。

Top常用的可选参数和其对应的含义如下:

(1)-c:显示完整的命令;

(2)-d:屏幕刷新间隔时间;

(3)-i<时间>:设置间隔时间;

(4)-u<用户名>:指定用户名;

(5)-p<进程号>:指定进程;

(6)-n<次数>:循环显示的次数。

top执行起来的效果如下:

前五行是系统整体的统计信息。第一行是任务队列信息,第二行和第三行为进程和CPU的信息,最后两行为内存信息。下面对一些比较重要的参数进行说明。

Load average:0.60,0.94,1.04。load average表示系统在过去1分钟5分钟15分钟的任务队列的平均长度。这个值越大就表示系统CPU越繁忙。

Cpu(s):5.0%us(用户空间占用的cpu百分百),3.9%sy(系统空间占用的cpu百分比),0.0%ni(用户进程空间内改变过优先级的用户占用的cpu百分比),90.9%id(空闲cpu的百分比),0.2%wa(等待输入输出cpu的百分比)。

Mem:817280k buffers(用作内核缓存的内存量)。

Swap:磁盘交换区容量。

1.2 strace

strace可以跟踪到一个进程产生的系统调用,包含参数、返回值、执行消耗的时间。

strace的常用的选项以及选项对应的含义如下:

(1)-c 统计每一系统调用的所执行的时间,次数和出错的次数等

(2)-f 跟踪由fork调用所产生的子进程

(3)-t 在输出中的每一行前加上时间信息

(4)-tt 在输出中的每一行前加上时间信息(微妙级)

(5)-T 显示每一调用所耗的时间

(6)-e trace=set 只跟踪指定的系统调用。例如:-e trace=open,close,read,write表示只跟踪这四个系统调用。默认的为set=all

(7)-e trace=file 只跟踪有关文件操作的系统调用

(8)-e trace=process 只跟踪有关进程控制的系统调用

(9)-e trace=network 跟踪与网络有关的所有系统调用

(10)-e strace=signal 跟踪所有与系统信号有关的 系统调用

(11)-e trace=ipc 跟踪所有与进程通讯有关的系统调用

(12)-o filename 将strace的输出写入文件filename -p pid 跟踪指定的进程pid

例如执行 strace cat /dev/null,会得到如下输出:

每一行都是一条系统调用,等号左边是系统调用的函数名及其参数,右边是该调用的返回值。如果你知道你要找的是什么,你可以让strace只跟踪一些类型的系统调用。例如你需要看看在loadconfigure脚本里面执行的程序里面系统调用ececve的调用情况,则只需要输入这样一条shell命令:strace -f -o loadconfigure-strace.txt -e execve ./loadconfigure

再例如,我们知道ActLogicSvr的进程号是16789,则可以执行strace -p 16789 -c来统计ActLogicSvr在某一段时间系统调用的统计情况。结果如下所示:

这里很清楚的告诉你调用了那些系统函数,调用次数多少,消耗了多少时间等等这些信息,这个对我们分析一个程序来说是非常有用的。

1.3 Perf

perf是Linux的性能调优工具。perf工具的常用命令包括top,record,report等。

perf top命令用来显示程序运行的整体状况。该命令主要用来观察整个系统当前的状态,比如可以通过查看该命令的输出来查看当前系统最耗时的内核函数或某个用户进程。Perf stat的运行效果如下:

perf record命令则用来记录指定事件在程序运行过程中的信息,而Perf report命令则用来报告基于前面record命令记录的事件信息生成的程序运行状况报告。我们通常用命令perf record -g -p pid将进程在命令运行期间的各项指令运行所占CPU的比例存在perf.data里面(-g表示记录函数之间的调用关系)。再用perf report --call-graph --stdio将刚刚的统计结果展示出来。

perf record带-g选项时,perf report的运行效果:

perf record不带-g选项时,perf report的运行效果:

1.4 vmstat

vmstat是一个很全面的性能分析工具,可以观察到系统的进程状态、内存使用、虚拟内存使用、磁盘的 IO、中断、上下问切换、CPU使用等。

vmstat的输出如下:

procs:

- r:运行队列中进程数量,这个值也可以判断是否需要增加CPU。(长期大于1)

- b:因为io处于阻塞状态的进程数。

memory:

-swap:使用虚拟内存大小

-free:空闲物理内存大小

-buff:用作缓冲的内存大小

-cache:用作缓存的内存大小

swap:

si:每秒从交换区写到内存的大小,由磁盘调入内存

so:每秒写入交换区的内存大小,由内存调入磁盘

io:

- bi:从块设备读入的数据总量(读磁盘)(KB/s)

- bo:写入到块设备的数据总量(写磁盘)(KB/s)

system:

- in:每秒产生的中断次数

- cs:每秒产生的上下文切换次数

cpu:

- us:用户进程消耗的CPU时间百分比

- sy:内核进程消耗的CPU时间百分比

- wa:IO等待消耗的CPU时间百分比

- id:CPU处在空闲状态时间百分比

2.网络

2.1 netstat命令

netstat命令用来打印Linux中网络系统的状态信息,可让你得知整个Linux系统的网络情况。

netstat的常用的选项如下:

(1)-a(all)显示所有选项

(2)-t(tcp)仅显示tcp相关选项

(3)-u(udp)仅显示udp相关选项

(4)-l(listen)仅列出有在Listen(监听)的服务状态

(5)-p(program)显示建立相关链接的程序名

(6)-r(route)显示路由信息,路由表

(7)-e(extend)显示扩展信息

(8)-c 每隔一个固定时间,执行该netstat命令。

在这里我们简单复习一下TCP三次握手和四次挥手的过程,便于下面解释netstat中tcp的各种状态。

TCP三次握手的过程如下:

(1)主动连接端发送一个SYN包给被动连接端;

(2)被动连接端收到SYN包后,发送一个带ACK的SYN包给主动连接端。

(3)主动连接端发送一个带ACK标志的包给被动连接端,握手动作完成。

TCP的四次挥手过程如下:

(1)主动关闭端发送一个FIN包给被动关闭端。

(2)被动关闭端收到FIN包后,发送一个ACK包给主动关闭端。

(3)被动关闭端发送了ACK包后,再发送一个FIN包给主动关闭端。

(4)主动关闭端收到FIN包后,发送一个ACK包。当被动关闭端收到ACK后,四次挥手动作完成,连接断开。

下面我们解释一下netstat中tcp连接对应的各种状态。

(1)LISTEN:侦听状态,等待远程机器的连接请求。

(2)SYN_SEND:在TCP三次握手期间,主动连接端发送了SYN包后,进入SYN_SEND状态,等待对方的ACK包。

(3)SYN_RECV:在TCP三次握手期间,主动接收端收到SYN包后,进入SYN_RECV状态。

(4)ESTABLISHED:完成TCP三次握手后,主动连接端进入ESTABLISHED状态。此时,TCP连接已经建立,可以进行通信。

(5)FIN_WAIT_1:在TCP四次挥手时,主动关闭端发送FIN包后,进入FIN_WAIT_1状态。

(6)FIN_WAIT_2:在TCP四次挥手时,主动关闭端收到ACK包后,进入FIN_WAIT_2状态。

(7)TIME_WAIT:在TCP四次挥手时,主动关闭端发送了ACK包之后,进入TIME_WAIT状态,等待最多2MSL时间,让被动关闭端收到ACK包。

(8)CLOSING:在TCP四次挥手期间,主动关闭端发送了FIN包后,没有收到对应的ACK包,却收到了对方的FIN包,此时进入CLOSING状态。

(9)CLOSE_WAIT:在TCP四次挥手期间,被动关闭端收到FIN包后,进入CLOSE_WAIT状态。

(10)LAST_ACK:在TCP四次挥手时,被动关闭端发送FIN包后,进入LAST_ACK状态,等待对方的ACK包。

netstat -te(显示出所有的tcp连接)执行起来的效果如下:

netstat的常用方法:

(1)netstat -p | grep 19626:得到进程号19626的进程所打开的所有端口

(2)netstat -tpl:查看当前tcp监听端口, 需要显示监听的程序名。

(3)netstat -c 2:隔两秒执行一次netstat,持续输出

2.2 lsof

lsof命令用于查看进程开打的文件,打开文件的进程,进程打开的端口(TCP、UDP)。在linux环境下,任何事物都以文件的形式存在,通过文件不仅仅可以访问常规数据,还可以访问网络连接和硬件。在使用TCP的UDP的时候,系统在后台都为该应用程序分配了一个文件描述符。无论这个文件的本质如何,该文件描述符为应用程序与基础操作系统之间的交互提供了通用接口。

lsof的使用示例如下:

输出的各项的含义如下:

COMMAND:进程的名称

PID:进程标识符

USER:进程所有者

FD:文件描述符,应用程序通过文件描述符识别该文件。如cwd、txt等

TYPE:文件类型,如DIR、REG等

DEVICE:指定磁盘的名称

SIZE:文件的大小

NODE:索引节点(文件在磁盘上的标识)

NAME:打开文件的确切名称

Lsof的常用方法:

(1)lsof abc.txt:查看所有打开了文件abc.txt的进程。

(2)lsof -p pid:显示进程打开的所有的文件。

2.3 tcpdump

tcpdump可以将网络中传送的数据包完全截获下来提供分析。它支持针对网络层、协议、主机、网络或端口的过滤,并提供and、or、not等逻辑语句来帮助你去掉无用的信息。

tcpdump的常用参数:

(1)-nn,直接以 IP 及 Port Number 显示,而非主机名与服务名称。

(2)-i,后面接要「监听」的网络接口,例如 eth0, lo, ppp0 等等的接口。

(3)-w,如果你要将监听所得的数据包数据储存下来,用这个参数就对了。后面接文件名。

(4)-c,监听的数据包数,如果没有这个参数, tcpdump 会持续不断的监听,直到用户输入 [ctrl]-c 为止。

(5)-A,数据包的内容以 ASCII 显示,通常用来捉取 WWW 的网页数据包资料。

(6)-e,使用资料连接层 (OSI 第二层) 的 MAC 数据包数据来显示。

(7)-q,仅列出较为简短的数据包信息,每一行的内容比较精简。

(8)-X,可以列出十六进制 (hex) 以及 ASCII 的数据包内容,对于监听数据包内容很有用。

(9)-r,从后面接的文件将数据包数据读出来。那个「文件」是已经存在的文件,并且这个「文件」是由 -w 所制作出来的。

tcpdump的常见用法:

(1)tcpdump -i eth1 host ***.***.***.***:抓取所有经过 eth1,目的或源地址是***.***.***.***的网络数据。

(2)tcpdump -i eth1 dst host ***.***.***.***:抓取所有经过 eth1,目的地址是***.***.***.***的网络数据。

(3)tcpdump -i eth1 src host ***.***.***.***:抓取所有经过 eth1,源地址是***.***.***.***的网络数据。

(4)tcpdump -i eth1 port 36000:抓取所有经过 eth1,目的端口或源端口是36000的网络数据。

(5)tcpdump -i eth1 src port 36000:抓取所有经过 eth1,源端口是36000的网络数据。

(6)tcpdump -i eth1 dst port 36000:抓取所有经过 eth1,目的端口是36000的网络数据。

(7)tcpdump -i eth1 'src host ***.***.***.*** && src port 36000':抓取所有经过 eth1,目的地址是10.136.12.1且目的端口是36000的网络数据。

(8)在10.136.12.1机器上我们通过top知道了ActLogicSvr的进程id为16789。然后通过netstat -ap | grep 16789得到ActLogicSvr监听的端口是10014。如下图所示:

然后我们通过 tcpdump -i eth1 'port 10014' -xxx抓取通过10014端口的所有的包。我们通过模拟接口测试的方法给ActLogicSvr发一条请求。抓到的包结果如下:

 

从抓到的包上我们可以清楚的看到tcp连接建立的三次握手到数据传输到tcp连接断开四次挥手的过程(前三个数据包是三次握手的过程,最后四个数据包是四次挥手的过程,中间的为数据传输所产生的网络数据包)。

3 内存

3.1 valgrind

valgrind 是在Linux程序中广泛使用的调试应用程序。它尤其擅长发现内存管理的问题,可以检查程序运行时的内存泄漏问题等。我们在使用valgrind时也主要用到它的内存泄漏检测功能,即memcheck功能。它检查所有对内存的读/写操作,并截取所有的malloc/new/free/delete调用。因此memcheck工具能够探测到以下问题:

(1)使用未初始化的内存

(2)读/写已经被释放的内存

(3)读/写内存越界

(4)读/写不恰当的内存栈空间

(5)内存泄漏

(6)使用malloc/new/new[]和free/delete/delete[]不匹配。

(7)src和dst的重叠valgrind的可选的参数以及对应的含义如下所示:

(1)-version 显示valgrind内核的版本,每个工具都有各自的版本。

(2)q –quiet 安静地运行,只打印错误信。

(3)v –verbose 更详细的信息, 增加错误数统计。

(4)-trace-children=no|yes 跟踪子线程

(5)-track-fds=no|yes 跟踪打开的文件描述

(6)-time-stamp=no|yes 增加时间戳到LOG信息

(7)-log-fd=<number> 输出LOG到描述符文

(8)-log-file=<file> 将输出的信息写入到filename.PID的文件里,PID是运行程序的进行ID

(9)-log-file-exactly=<file> 输出LOG信息到 file

(10)-log-file-qualifier=<VAR> 取得环境变量的值来做为输出信息的文件名。

(11)-log-socket=ipaddr:port 输出LOG到socket ,ipaddr:port

LOG信息输出:

(1)-xml=yes 将信息以xml格式输出,只有memcheck可用

(2)-num-callers=<number> show <number> callers in stack traces [12]

(3)-error-limit=no|yes 如果太多错误,则停止显示新错误? [yes]

(4)-error-exitcode=<number> 如果发现错误则返回错误代码 [0=disable]

(5)-db-attach=no|yes 当出现错误,valgrind会自动启动调试器gdb。[no]

(6)-db-command=<command> 启动调试器的命令行选项[gdb -nw %f %p]适用于Memcheck工具的相关选项:

(1)--leak-check=no|summary|full 要求对leak给出详细信息? [summary]

(2)--leak-resolution=low|med|high how much bt merging in leak check [low]

(3)--show-reachable=no|yes show reachable blocks in leak check? [no]

示例:valgrind --leak-check=full /usr/local/app/taf/tafnode/data/TenFortune.WeChatProxySvr/bin/WeChatProxySvr --config=/usr/local/app/taf/tafnode/data/TenFortune.WeChatProxySvr/conf/TenFortune.WeChatProxySvr.config.conf -trace-child=yes。执行的结果:

4 磁盘

4.1 iotop

iotop命令是一个用来监视磁盘I/O使用状况的top类工具。iotop具有与top相似的UI,其中包括PID、用户、I/O、进程等相关信息。Linux下的IO统计工具如iostat,nmon等大多数是只能统计到per设备的读写情况,如果你想知道每个进程是如何使用IO的就比较麻烦,使用iotop命令可以很方便的查看。

iostat命令选项:

-o:只显示有io操作的进程

-n NUM:显示NUM次,主要用于非交互式模式。

-d SEC:间隔SEC秒显示一次。

-p PID:监控的进程pid。

-u USER:监控的进程用户。

iotop的执行效果:





作者:姚卓敏
来源:51CTO

相关实践学习
通过Ingress进行灰度发布
本场景您将运行一个简单的应用,部署一个新的应用用于新的发布,并通过Ingress能力实现灰度发布。
容器应用与集群管理
欢迎来到《容器应用与集群管理》课程,本课程是“云原生容器Clouder认证“系列中的第二阶段。课程将向您介绍与容器集群相关的概念和技术,这些概念和技术可以帮助您了解阿里云容器服务ACK/ACK Serverless的使用。同时,本课程也会向您介绍可以采取的工具、方法和可操作步骤,以帮助您了解如何基于容器服务ACK Serverless构建和管理企业级应用。 学习完本课程后,您将能够: 掌握容器集群、容器编排的基本概念 掌握Kubernetes的基础概念及核心思想 掌握阿里云容器服务ACK/ACK Serverless概念及使用方法 基于容器服务ACK Serverless搭建和管理企业级网站应用
目录
相关文章
|
1月前
|
Linux 网络安全 数据安全/隐私保护
Linux 超级强大的十六进制 dump 工具:XXD 命令,我教你应该如何使用!
在 Linux 系统中,xxd 命令是一个强大的十六进制 dump 工具,可以将文件或数据以十六进制和 ASCII 字符形式显示,帮助用户深入了解和分析数据。本文详细介绍了 xxd 命令的基本用法、高级功能及实际应用案例,包括查看文件内容、指定输出格式、写入文件、数据比较、数据提取、数据转换和数据加密解密等。通过掌握这些技巧,用户可以更高效地处理各种数据问题。
95 8
|
1月前
|
Linux
在 Linux 系统中,“cd”命令用于切换当前工作目录
在 Linux 系统中,“cd”命令用于切换当前工作目录。本文详细介绍了“cd”命令的基本用法和常见技巧,包括使用“.”、“..”、“~”、绝对路径和相对路径,以及快速切换到上一次工作目录等。此外,还探讨了高级技巧,如使用通配符、结合其他命令、在脚本中使用,以及实际应用案例,帮助读者提高工作效率。
80 3
|
1月前
|
监控 安全 Linux
在 Linux 系统中,网络管理是重要任务。本文介绍了常用的网络命令及其适用场景
在 Linux 系统中,网络管理是重要任务。本文介绍了常用的网络命令及其适用场景,包括 ping(测试连通性)、traceroute(跟踪路由路径)、netstat(显示网络连接信息)、nmap(网络扫描)、ifconfig 和 ip(网络接口配置)。掌握这些命令有助于高效诊断和解决网络问题,保障网络稳定运行。
72 2
|
3天前
|
存储 缓存 监控
Linux缓存管理:如何安全地清理系统缓存
在Linux系统中,内存管理至关重要。本文详细介绍了如何安全地清理系统缓存,特别是通过使用`/proc/sys/vm/drop_caches`接口。内容包括清理缓存的原因、步骤、注意事项和最佳实践,帮助你在必要时优化系统性能。
110 78
|
7天前
|
Linux Shell 网络安全
Kali Linux系统Metasploit框架利用 HTA 文件进行渗透测试实验
本指南介绍如何利用 HTA 文件和 Metasploit 框架进行渗透测试。通过创建反向 shell、生成 HTA 文件、设置 HTTP 服务器和发送文件,最终实现对目标系统的控制。适用于教育目的,需合法授权。
36 9
Kali Linux系统Metasploit框架利用 HTA 文件进行渗透测试实验
|
1月前
|
缓存 Java Linux
如何解决 Linux 系统中内存使用量耗尽的问题?
如何解决 Linux 系统中内存使用量耗尽的问题?
119 48
|
3天前
|
存储 监控 Linux
嵌入式Linux系统编程 — 5.3 times、clock函数获取进程时间
在嵌入式Linux系统编程中,`times`和 `clock`函数是获取进程时间的两个重要工具。`times`函数提供了更详细的进程和子进程时间信息,而 `clock`函数则提供了更简单的处理器时间获取方法。根据具体需求选择合适的函数,可以更有效地进行性能分析和资源管理。通过本文的介绍,希望能帮助您更好地理解和使用这两个函数,提高嵌入式系统编程的效率和效果。
36 13
|
27天前
|
Ubuntu Linux 网络安全
linux系统ubuntu中在命令行中打开图形界面的文件夹
在Ubuntu系统中,通过命令行打开图形界面的文件夹是一个高效且实用的操作。无论是使用Nautilus、Dolphin还是Thunar,都可以根据具体桌面环境选择合适的文件管理器。通过上述命令和方法,可以简化日常工作,提高效率。同时,解决权限问题和图形界面问题也能确保操作的顺利进行。掌握这些技巧,可以使Linux操作更加便捷和灵活。
20 3
|
4天前
|
Ubuntu Linux C++
Win10系统上直接使用linux子系统教程(仅需五步!超简单,快速上手)
本文介绍了如何在Windows 10上安装并使用Linux子系统。首先,通过应用商店安装Windows Terminal和Linux系统(如Ubuntu)。接着,在控制面板中启用“适用于Linux的Windows子系统”并重启电脑。最后,在Windows Terminal中选择安装的Linux系统即可开始使用。文中还提供了注意事项和进一步配置的链接。
16 0
|
1月前
|
存储 运维 Linux
如何在 Linux 系统中使用 envsubst 命令替换环境变量?
`envsubst` 是 Linux 系统中用于替换文本中环境变量值的实用工具。本文分三部分介绍其工作原理、使用方法及实际应用,包括配置文件替换、脚本执行中环境变量替换和动态生成文件等场景,帮助用户高效利用 `envsubst` 进行开发和运维工作。
52 4
下一篇
DataWorks