Linux 系统监控常用命令

本文涉及的产品
云数据库 MongoDB,独享型 2核8GB
推荐场景:
构建全方位客户视图
简介: 简介列举操作系统级监控常用的几个方法,建议收藏使用CPUtop 命令可用于监控系统整体负载,包括cpu、内存使用等,能够实时显示系统中各个进程的资源占用状况输出样例top - 19:37:41 up 192 days, 9:14, 1 user, load average: 0.

简介

列举操作系统级监控常用的几个方法,建议收藏使用

CPU

top 命令可用于监控系统整体负载,包括cpu、内存使用等,能够实时显示系统中各个进程的资源占用状况

输出样例

top - 19:37:41 up 192 days,  9:14,  1 user,  load average: 0.39, 0.28, 0.27
Tasks: 126 total,   1 running, 125 sleeping,   0 stopped,   0 zombie
Cpu(s):  0.1%us,  0.1%sy,  0.0%ni, 99.8%id,  0.0%wa,  0.0%hi,  0.0%si,  0.0%st
Mem:     32113M total,    11351M used,    20762M free,      266M buffers
Swap:     4091M total,        0M used,     4091M free,      304M cached

  PID USER      PR  NI  VIRT  RES  SHR S   %CPU %MEM    TIME+  COMMAND                                                                                                                                                                     
    1 root      20   0 25280 1016  968 S      0  0.0   2:37.44 init                                                                                                                                                                         
    2 root      20   0     0    0    0 S      0  0.0   0:02.40 kthreadd                                                                                                                                                                     
    3 root      20   0     0    0    0 S      0  0.0   3:28.59 ksoftirqd/0                                                                                                                                                                  
    5 root      20   0     0    0    0 S      0  0.0   0:00.59 kworker/u:0                                                                                                                                                                  
    6 root      RT   0     0    0    0 S      0  0.0   0:11.39 migration/0 

指标说明

  • load average: 0.06, 0.60, 0.48
    系统负载,即任务队列的长度。分别为 1分钟、5分钟、15分钟内的平均值。
  • Tasks
    进程汇总,包括运行中、睡眠、停止、僵尸态的梳理
  • Cpu(s)
指标 说明
0.3% us 用户空间占用CPU百分比
1.0% sy 内核空间占用CPU百分比
0.0% ni 用户进程优先级调度CPU百分比
98.7% id 空闲CPU百分比
0.0% wa 等待输入输出的CPU时间百分比
0.0% hi 硬件CPU中断占用百分比
0.0% si 软中断占用百分比
0.0% st 虚拟机占用百分比
  • Mem
    内存统计,包括物理内存、已使用内存、空闲内存、内核缓存

  • Swap
    交换区统计,包括总量、已使用、空闲量、缓存量
  • 进程列表

指标 说明
PID 进程ID
USER 进程所有者的用户名
PR 优先级
NI nice值。负值表示高优先级,正值表示低优先级
VIRT 进程使用的虚拟内存总量,单位kb。VIRT=SWAP+RES
RES 进程使用的、未被换出的物理内存大小,单位kb。RES=CODE+DATA
SHR 共享内存大小,单位kb
S 进程状态(D=不可中断的睡眠状态,R=运行,S=睡眠,T=跟踪/停止,Z=僵尸进程)
%CPU 进程使用的CPU百分比
%MEM 进程使用的物理内存百分比
TIME+ 进程使用的CPU时间总计,单位1/100秒
SWAP 进程使用的虚拟内存中,被换出的大小,单位kb
CODE 可执行代码占用的物理内存大小,单位kb
DATA 可执行代码以外的部分(数据段+栈)占用的物理内存大小,单位kb
COMMAND 命令名/命令行

按F键可以选择显示不同的指标,非常详细
参考文档

内存监控

vmstat 指虚拟内存统计(Virtual Meomory Statistics), 是常用的实时系统监控工具。

输出样例

~-> vmstat 2
procs -----------memory---------- ---swap-- -----io---- -system-- -----cpu------
 r  b   swpd   free   buff  cache     si   so    bi    bo   in   cs us sy id wa st
 0  0    212 21250404 272916 320572    0    0     0     2    0    0  0  0 100  0  0
 0  0    212 21250652 272916 320576    0    0     0     0  535 1061  0  0 100  0  0
 0  0    212 21250652 272916 320576    0    0     0     0  496 1062  0  0 100  0  0
 2  0    212 21250256 272916 320576    0    0     0     0  751 1107  0  0 99  0  0
 0  0    212 21250404 272916 320568    0    0     0     0  496 1056  0  0 100  0  0
 0  0    212 21250404 272916 320568    0    0     0     0  593 1089  0  0 100  0  0
 0  0    212 21250404 272916 320568    0    0     0    56  539 1074  0  0 100  0  0
 0  0    212 21250404 272916 320568    0    0     0     0  589 1137  0  0 100  0  0
 0  0    212 21250404 272916 320564    0    0     0     0  608 1154  0  0 100  0  0
 0  0    212 21250404 272916 320564    0    0     0     0  601 1156  0  0 100  0  0
 1  0    212 21250404 272916 320564    0    0     0     0  611 1155  0  0 100  0  0
 0  0    212 21250404 272916 320564    0    0     0     0  599 1151  0  0 100  0  0

指标说明

指标 说明
procs.r 等待cpu时间片的进程数
procs.b 等待资源的进程数,比如等待IO或内存交换等
cpu.us 用户态CPU 时间百分比
cpu.sy 内核态CPU 时间百分比,参考值us+sy<=80%
cpu.wa IO等待所占用的CPU 时间百分比,参考值wa<=30
cpu.id 空闲状态CPU 时间百分比
cpu.st 虚拟机CPU占用时间百分比,存在超分时可能较高
system.in 设备中断数
system.cs 上下文切换次数
memory.swpd 内存交换区的内存数量(KB)
memory.free 空闲页的内存数量(KB)
memory.buff buffer cache的内存数量,一般在块设备读写使用
memory.cache 作为page cache的内存数量,一般作为文件系统的cache
swap.si 由内存进入内存交换区数量
swap.so 由内存交换区进入内存数量
io.bi 从块设备读入的数据量(KB/S)
io.bo 向块设备写入的数据量(KB/S)

参考文档
关于 linux OOM Killer
free 查看可用内存

网络连接

netstat 命令用于显示各种网络相关信息,如网络连接,路由表,接口状态等。

输出样例

iotweb@kwe1000111753:~> netstat -ano |head
Active Internet connections (servers and established)
Proto Recv-Q Send-Q Local Address           Foreign Address         State    
tcp        0      0 0.0.0.0:4444            0.0.0.0:*               LISTEN   
tcp        0      0 0.0.0.0:19999           0.0.0.0:*               LISTEN   
tcp        0      0 0.0.0.0:27017           0.0.0.0:*               LISTEN   
tcp        0      0 0.0.0.0:6380            0.0.0.0:*               LISTEN   
tcp        0      0 0.0.0.0:111             0.0.0.0:*               LISTEN   

常见用法

  • 检查出TIME_WAIT的数量
netstat -an | grep -c TIME_WAIT 
  • 检查全部socket状态
netstat -nat| awk '{print awk $NF}'|sort|uniq -c|sort -n  
  • 检查进程及socket数量
netstat -nap| awk '{print awk $NF}'|sort|uniq -c|sort -n  
  • 查看端口连接数
netstat -anp |grep 27071|wc -l

磁盘使用

iostat 用于监控磁盘的IO吞吐及资源占用情况

命令

iostat -d -x -k 1 10

-d为查看磁盘状况,-k表示以KB为单位,-x表示输出更多的扩展字段

Device:         rrqm/s   wrqm/s     r/s     w/s    rkB/s    wkB/s avgrq-sz avgqu-sz   await  svctm  %util
xvda              0.01     8.32    0.49    4.94     6.82    53.08    22.06     0.11   19.68   1.76   0.95
xvde              0.02   841.11   33.24  304.80   331.20  4583.79    29.08     1.67    4.93   1.15  38.76
dm-0              0.00     0.00   33.26 1145.95   331.20  4583.79     8.34     0.30    2.61   0.33  38.81

指标说明

指标 说明
rrqm/s 每秒merge的读取请求数(同一个Block存在merge机制)
rrqm/s 每秒merge的写入请求数(同一个Block存在merge机制)
r/s 每秒提交的读取请求数
w/s 每秒提交的写入请求数
await IO请求的平均响应时间,参考值<=10ms
rkB/s 每秒读取数据量
wkb/s 每秒写入数据量
avgrq-sz IO平均请求大小(扇区)
avgqu-sz IO平均请求队列大小
svctm IO请求平均执行时间
%util CPU占用百分比

进程监控

ps命令能够给出当前系统中进程的快照

  • 查找进程方法
ps -ef |grep nscl
  • 按cpu占用排序查看前10进程
-> ps -aux --sort -pcpu |head -n 10
USER       PID %CPU %MEM    VSZ   RSS TTY      STAT START   TIME COMMAND
iotweb    9313  1.0 14.3 6277488 4708752 ?     Sl   Nov03 687:08 ./bin/mongod -f conf/mongodb.conf --auth
iotweb   16957  0.3 10.1 10208428 3322260 ?    Sl   Nov01 251:37 java -jar redis-stat-0.4.14.jar 127.0.0.1:6380 3 --server=63800
root      2822  0.1  0.0 133196  1288 ?        Sl   Jun07 431:05 /usr/bin/vm-agent
iotweb   16942  0.1  0.0  52364 13304 ?        Ssl  Nov01  95:57 ./bin/redis-server 0.0.0.0:6380

指标说明

指标 说明
USER 进程 owner
PID 进程ID
%CPU CPU占用率
%MEM 内存占用率
TTY 终端
STAT 进程状态
VSZ 虚拟内存占用
RSS 物理内存占用
START 开始日期
TIME 启动时长
COMMAND Bash命令

参考文档

文件占用

lsof(list open files)用于列出当前系统打开文件句柄,包括网络套接字、设备句柄等。

输出样例

~->lsof /opt

COMMAND  PID   USER   FD   TYPE DEVICE  SIZE/OFF   NODE NAME
mongod  9313 iotweb  txt    REG  252,0  36409888 761870 /opt/local/mongodb/bin/mongod
mongod  9313 iotweb    4w   REG  252,0   7082638 778244 /opt/local/mongodb/log/mongodb.log
mongod  9313 iotweb    8uW  REG  252,0         5 778246 /opt/local/mongodb/data/mongod.lock
mongod  9313 iotweb    9uw  REG  252,0        21 778247 /opt/local/mongodb/data/WiredTiger.lock
mongod  9313 iotweb   15u   REG  252,0     36864 778253 /opt/local/mongodb/data/sizeStorer.wt

指标说明

指标 说明
COMMAND 进程的名称
PID 进程ID
USER 进程所有者
FD 文件描述符
TYPE 文件类型,如DIR、REG等
DEVICE 指定磁盘的名称
SIZE 文件的大小
NODE 文件索引节点
NAME 文件的名称

参考文档

img_9b09a36f6de95886f52ce82fa1e89c88.jpe

作者: zale

出处: http://www.cnblogs.com/littleatp/, 如果喜欢我的文章,请关注我的公众号

本文版权归作者和博客园共有,欢迎转载,但未经作者同意必须保留此段声明,且在文章页面明显位置给出 原文链接  如有问题, 可留言咨询.

相关实践学习
MongoDB数据库入门
MongoDB数据库入门实验。
快速掌握 MongoDB 数据库
本课程主要讲解MongoDB数据库的基本知识,包括MongoDB数据库的安装、配置、服务的启动、数据的CRUD操作函数使用、MongoDB索引的使用(唯一索引、地理索引、过期索引、全文索引等)、MapReduce操作实现、用户管理、Java对MongoDB的操作支持(基于2.x驱动与3.x驱动的完全讲解)。 通过学习此课程,读者将具备MongoDB数据库的开发能力,并且能够使用MongoDB进行项目开发。 &nbsp; 相关的阿里云产品:云数据库 MongoDB版 云数据库MongoDB版支持ReplicaSet和Sharding两种部署架构,具备安全审计,时间点备份等多项企业能力。在互联网、物联网、游戏、金融等领域被广泛采用。 云数据库MongoDB版(ApsaraDB for MongoDB)完全兼容MongoDB协议,基于飞天分布式系统和高可靠存储引擎,提供多节点高可用架构、弹性扩容、容灾、备份回滚、性能优化等解决方案。 产品详情: https://www.aliyun.com/product/mongodb
目录
相关文章
|
2月前
|
Linux 网络安全 数据安全/隐私保护
Linux 超级强大的十六进制 dump 工具:XXD 命令,我教你应该如何使用!
在 Linux 系统中,xxd 命令是一个强大的十六进制 dump 工具,可以将文件或数据以十六进制和 ASCII 字符形式显示,帮助用户深入了解和分析数据。本文详细介绍了 xxd 命令的基本用法、高级功能及实际应用案例,包括查看文件内容、指定输出格式、写入文件、数据比较、数据提取、数据转换和数据加密解密等。通过掌握这些技巧,用户可以更高效地处理各种数据问题。
222 8
|
2月前
|
监控 Linux
如何检查 Linux 内存使用量是否耗尽?这 5 个命令堪称绝了!
本文介绍了在Linux系统中检查内存使用情况的5个常用命令:`free`、`top`、`vmstat`、`pidstat` 和 `/proc/meminfo` 文件,帮助用户准确监控内存状态,确保系统稳定运行。
889 6
|
2月前
|
Linux
在 Linux 系统中,“cd”命令用于切换当前工作目录
在 Linux 系统中,“cd”命令用于切换当前工作目录。本文详细介绍了“cd”命令的基本用法和常见技巧,包括使用“.”、“..”、“~”、绝对路径和相对路径,以及快速切换到上一次工作目录等。此外,还探讨了高级技巧,如使用通配符、结合其他命令、在脚本中使用,以及实际应用案例,帮助读者提高工作效率。
141 3
|
2月前
|
监控 安全 Linux
在 Linux 系统中,网络管理是重要任务。本文介绍了常用的网络命令及其适用场景
在 Linux 系统中,网络管理是重要任务。本文介绍了常用的网络命令及其适用场景,包括 ping(测试连通性)、traceroute(跟踪路由路径)、netstat(显示网络连接信息)、nmap(网络扫描)、ifconfig 和 ip(网络接口配置)。掌握这些命令有助于高效诊断和解决网络问题,保障网络稳定运行。
113 2
|
1月前
|
Linux Shell
Linux 10 个“who”命令示例
Linux 10 个“who”命令示例
81 14
Linux 10 个“who”命令示例
|
22天前
|
Prometheus 监控 Cloud Native
Prometheus+Grafana监控Linux主机
通过本文的步骤,我们成功地在 Linux 主机上使用 Prometheus 和 Grafana 进行了监控配置。具体包括安装 Prometheus 和 Node Exporter,配置 Grafana 数据源,并导入预设的仪表盘来展示监控数据。通过这种方式,可以轻松实现对 Linux 主机的系统指标监控,帮助及时发现和处理潜在问题。
110 7
|
1月前
|
Ubuntu Linux
Linux 各发行版安装 ping 命令指南
如何在不同 Linux 发行版(Ubuntu/Debian、CentOS/RHEL/Fedora、Arch Linux、openSUSE、Alpine Linux)上安装 `ping` 命令,详细列出各发行版的安装步骤和验证方法,帮助系统管理员和网络工程师快速排查网络问题。
143 20
|
24天前
|
Linux
linux查看目录下的文件夹命令,find查找某个目录,但是不包括这个目录本身?
通过本文的介绍,您应该对如何在 Linux 系统中查看目录下的文件夹以及使用 `find` 命令查找特定目录内容并排除该目录本身有了清晰的理解。掌握这些命令和技巧,可以大大提高日常文件管理和查找操作的效率。 在实际应用中,灵活使用这些命令和参数,可以帮助您快速定位和管理文件和目录,满足各种复杂的文件系统操作需求。
70 8
|
28天前
|
Prometheus 运维 监控
Prometheus+Grafana+NodeExporter:构建出色的Linux监控解决方案,让你的运维更轻松
本文介绍如何使用 Prometheus + Grafana + Node Exporter 搭建 Linux 主机监控系统。Prometheus 负责收集和存储指标数据,Grafana 用于可视化展示,Node Exporter 则采集主机的性能数据。通过 Docker 容器化部署,简化安装配置过程。完成安装后,配置 Prometheus 抓取节点数据,并在 Grafana 中添加数据源及导入仪表盘模板,实现对 Linux 主机的全面监控。整个过程简单易行,帮助运维人员轻松掌握系统状态。
198 3
|
1月前
|
网络协议 Linux 应用服务中间件
kali的常用命令汇总Linux
kali的常用命令汇总linux
70 7