浅析磁盘常见的性能指标及观测IO性能指标的命令(上)

简介: 磁盘性能指标说明衡量磁盘性能常见的指标有: 使用率、饱和度、IOPS、吞吐量以及响应时间,具体说明如下:使用率,是指磁盘处理 I/O 的时间百分比。过高的使用率(比如超过 80%),通常意味着磁盘 I/O 存

磁盘性能指标说明


衡量磁盘性能常见的指标有: 使用率、饱和度、IOPS、吞吐量以及响应时间,具体说明如下:

  • 使用率,是指磁盘处理 I/O 的时间百分比。过高的使用率(比如超过 80%),通常意味着磁盘 I/O 存在性能瓶颈。
  • 饱和度,是指磁盘处理 I/O 的繁忙程度。过高的饱和度,意味着磁盘存在严重的性能瓶颈。当饱和度为 100% 时,磁盘无法接受新的 I/O 请求。
  • IOPS(Input/Output Per Second),是指每秒的 I/O 请求数。
  • 吞吐量,是指每秒的 I/O 请求大小,即每秒磁盘 I/O 的流量,磁盘写入加上读出数据的大小。单位为bps。
  • 响应时间,是指 I/O 请求从发出到收到响应的间隔时间。

IOPS 与吞吐量的关系

每秒 I/O 吞吐量= IOPS * 平均 I/O SIZE。从公式可以看出: I/O SIZE 越大,IOPS 越高,那么每秒 I/O 的吞吐量就越高。因此,我们会认为 IOPS 和吞吐量的数值越高越好。实际上,对于一个磁盘来讲,这两个参数均有其最大值,而且这两个参数也存在着一定的关系。

IOPS可细分为如下几个指标:

  • Toatal IOPS,混合读写和顺序随机I/O负载情况下的磁盘IOPS,这个与实际I/O情况最为相符,大多数应用关注此指标。
  • Random Read IOPS,100%随机读负载情况下的IOPS。
  • Random Write IOPS,100%随机写负载情况下的IOPS。
  • Sequential Read IOPS,100%顺序读负载情况下的IOPS。
  • Sequential Write IOPS,100%顺序写负载情况下的IOPS。


常用的观测IO性能指标命令


iostat

iostat,对系统的磁盘操作活动进行监视。它的特点是汇报磁盘活动统计情况,同时也会汇报出CPU使用情况。iostat也有一个弱点,就是它不能对某个进程进行深入分析,仅对系统的整体情况进行分析。

命令参数说明:

  • -c: 显示CPU使用情况
  • -d: 显示磁盘使用情况
  • -N: 显示磁盘阵列(LVM) 信息
  • -n: 显示NFS 使用情况
  • -k: 以 KB 为单位显示
  • -m: 以 M 为单位显示
  • -t: 报告每秒向终端读取和写入的字符数和CPU的信息
  • -V: 显示版本信息
  • -x: 显示IO相关的详细信息
  • -p [磁盘] : 显示磁盘和分区的情况

备注:

如果%iowait的值过高,表示硬盘存在I/O瓶颈,%idle值高,表示CPU较空闲。

如果%idle值高但系统响应慢时,有可能是CPU等待分配内存,此时应加大内存容量。

如果%idle值持续低于10,那么系统的CPU处理能力相对较低,表明系统中最需要解决的资源是CPU。

CPU属性值说明:

  • %user: CPU处在用户模式下的时间百分比
  • %nice: CPU处在带NICE值的用户模式下的时间百分比
  • %system: CPU处在系统模式下的时间百分比
  • %iowait: CPU等待输入输出完成时间的百分比
  • %steal: 管理程序维护另一个虚拟处理器时,虚拟CPU的无意识等待时间百分比
  • %idle: CPU空闲时间百分比

磁盘属性值说明:

  • device: 磁盘名称
  • tps: 每秒钟发送到的I/O请求数
  • Blk_read/s: 每秒读取的block数
  • Blk_wrtn/s: 每秒写入的block数
  • Blk_read: 读入的block总数
  • Blk_wrtn: 写入的block总数

磁盘IO相关的详细说明:

  • rrqm/s: 每秒进行 merge 的读操作数目。即 rmerge/s
  • wrqm/s: 每秒进行 merge 的写操作数目。即 wmerge/s
  • r/s: 每秒完成的读 I/O 设备次数。即 rio/s
  • w/s: 每秒完成的写 I/O 设备次数。即 wio/s
  • rkB/s: 每秒读K字节数。是 rsect/s 的一半,因为每扇区大小为512字节。
  • wkB/s: 每秒写K字节数。是 wsect/s 的一半
  • avgrq-sz: 平均每次设备I/O操作的数据大小 (扇区)
  • avgqu-sz: 平均I/O队列长度
  • rsec/s: 每秒读扇区数。即 rsect/s
  • wsec/s: 每秒写扇区数。即 wsect/s
  • r_await: 每个读操作平均所需的时间,不仅包括硬盘设备读操作的时间,还包括了在kernel队列中等待的时间
  • w_await: 每个写操作平均所需的时间,不仅包括硬盘设备写操作的时间,还包括了在kernel队列中等待的时间
  • await: 平均每次设备I/O操作的等待时间 (毫秒)
  • svctm: 平均每次设备I/O操作的服务时间 (毫秒)
  • %util: 一秒中有百分之多少的时间用于 I/O 操作,即被io消耗的cpu百分比

备注:

如果 %util 接近 100%,说明产生的I/O请求太多,I/O系统已经满负荷,该磁盘可能存在瓶颈。

如果 svctm 比较接近 await,说明 I/O 几乎没有等待时间;

如果 await 远大于 svctm,说明I/O 队列太长,io响应太慢,则需要进行必要优化。

如果avgqu-sz比较大,也表示有当量io在等待。

示例:查看cpu状态

iostat -c 1 1
复制代码

示例:查看磁盘使用率和响应时间

#  -d 显示磁盘使用情况,-x 显示详细信息
iostat -d -x -k 1 1
复制代码


其他示例

# 间隔1秒,总共显示5次
iostat 1 5
# 每隔2秒,显示一次设备统计信息
iostat -d 2
# 每隔2秒,显示一次设备统计信息,总共输出3次
iostat -d 2 3
# 每隔2秒显示一次sda, sdb两个设备的扩展统计信息,共输出3次
iostat -x sda sdb 2 3
# 每隔2秒显示一次sda及上面所有分区的统计信息,共输出3次
iostat -p sda 2 3
# 以M为单位显示所有信息
iostat -m
复制代码


pidstat

pidstat,用于监控全部或指定进程的cpu、内存、线程、设备IO等系统资源的占用情况。pidstat首次运行时显示自系统启动开始的各项统计信息,之后运行pidstat将显示自上次运行该命令以后的统计信息。用户可以通过指定统计的次数和时间来获得所需的统计信息。

命令参数说明:

  • -u:默认的参数,显示各个进程的cpu使用统计
  • -r:显示各个进程的内存使用统计
  • -d:显示各个进程的IO使用情况
  • -p:指定进程号
  • -w:显示每个进程的上下文切换情况
  • -t:显示选择任务的线程的统计信息外的额外信息
  • -T { TASK | CHILD | ALL }:TASK表示报告独立的task,CHILD关键字表示报告进程下所有线程统计信息。ALL表示报告独立的task和task下面的所有线程。注意:task和子线程的全局的统计信息和pidstat选项无关。这些统计信息不会对应到当前的统计间隔,这些统计信息只有在子线程kill或者完成的时候才会被收集
  • -V:显示版本号
  • -h:在一行上显示了所有活动,这样其他程序可以容易解析
  • -I:在SMP环境,表示任务的CPU使用率/内核数量
  • -l:显示命令名和所有参数

示例:查看所有进程的CPU使用情况

pidstat -u -p ALL
Linux 3.10.0-957.el7.x86_64 (VM-75-65)  04/24/2020      _x86_64_        (4 CPU)
02:10:43 PM   UID       PID    %usr %system  %guest    %CPU   CPU  Command
02:10:43 PM     0         1    0.00    0.01    0.00    0.01     0  systemd
02:10:43 PM     0         2    0.00    0.00    0.00    0.00     1  kthreadd
02:10:43 PM     0         3    0.00    0.06    0.00    0.06     0  ksoftirqd/0
02:10:43 PM     0         7    0.00    0.00    0.00    0.00     0  migration/0
02:10:43 PM     0         8    0.00    0.00    0.00    0.00     3  rcu_bh
02:10:43 PM     0         9    0.00    0.16    0.00    0.16     2  rcu_sched
02:10:43 PM     0        10    0.00    0.00    0.00    0.00     0  lru-add-drain
02:10:43 PM     0        11    0.00    0.00    0.00    0.00     0  watchdog/0
复制代码


属性值说明:

  • PID:进程ID
  • %usr:进程在用户空间占用cpu的百分比
  • %system:进程在内核空间占用cpu的百分比
  • %guest:进程在虚拟机占用cpu的百分比
  • %CPU:进程占用cpu的百分比
  • CPU:处理进程的cpu编号
  • Command:当前进程对应的命令

示例:查看指定进程的内存使用情况

指定PID为29468的进程内存使用情况,每秒展示一次,展示四次! 也可以直接pidstat -r,是全部进程的内存使用情况!

pidstat -r -p 29468 1 4
Linux 3.10.0-957.el7.x86_64 (VM-75-65)  04/24/2020      _x86_64_        (4 CPU)
02:16:00 PM   UID       PID  minflt/s  majflt/s     VSZ    RSS   %MEM  Command
02:16:01 PM     0     29468      0.00      0.00  413040   4104   0.03  docker-containe
02:16:02 PM     0     29468      0.00      0.00  413040   4104   0.03  docker-containe
02:16:03 PM     0     29468      0.00      0.00  413040   4104   0.03  docker-containe
02:16:04 PM     0     29468      0.00      0.00  413040   4104   0.03  docker-containe
Average:        0     29468      0.00      0.00  413040   4104   0.03  docker-containe
复制代码


相关文章
|
6月前
|
机器学习/深度学习 缓存 监控
linux查看CPU、内存、网络、磁盘IO命令
`Linux`系统中,使用`top`命令查看CPU状态,要查看CPU详细信息,可利用`cat /proc/cpuinfo`相关命令。`free`命令用于查看内存使用情况。网络相关命令包括`ifconfig`(查看网卡状态)、`ifdown/ifup`(禁用/启用网卡)、`netstat`(列出网络连接,如`-tuln`组合)以及`nslookup`、`ping`、`telnet`、`traceroute`等。磁盘IO方面,`iostat`(如`-k -p ALL`)显示磁盘IO统计,`iotop`(如`-o -d 1`)则用于查看磁盘IO瓶颈。
309 10
|
6月前
|
Linux
Linux操作系统调优相关工具(三)查看IO运行状态相关工具 查看哪个磁盘或分区最繁忙?
Linux操作系统调优相关工具(三)查看IO运行状态相关工具 查看哪个磁盘或分区最繁忙?
138 0
|
18天前
|
存储 关系型数据库 MySQL
查询服务器CPU、内存、磁盘、网络IO、队列、数据库占用空间等等信息
查询服务器CPU、内存、磁盘、网络IO、队列、数据库占用空间等等信息
192 2
|
2月前
|
存储 关系型数据库 MySQL
查询服务器CPU、内存、磁盘、网络IO、队列、数据库占用空间等等信息
查询服务器CPU、内存、磁盘、网络IO、队列、数据库占用空间等等信息
130 5
|
3月前
|
Unix 数据处理 Perl
|
3月前
|
NoSQL Redis 数据库
Redis AOF重写问题之同一数据产生两次磁盘IO如何解决
Redis AOF重写问题之同一数据产生两次磁盘IO如何解决
Redis AOF重写问题之同一数据产生两次磁盘IO如何解决
|
2月前
crash —— 获取系统的磁盘IO统计数据
crash —— 获取系统的磁盘IO统计数据
|
5月前
|
网络协议 Unix Shell
第三方App与Termux命令建立IO通道
、第三方 App 与 Termux 建立 TCP/Socket 通信 通过 RunCommandService 调用 Termux 执行 nc 命令反弹某个程序,然后通过 java.net.Socket 建立 Socket 连接,取得 Socket 的 IO 流,即可实现进程间通信。 调用 Termux。注意,Termux 可使用两个版本的 Netcat:安卓自带的 /system/bin/nc 和 Termux 仓库的 netcat-openbsd。前者随 ToyBox 在 Android Marshmallow 被引入,支持反弹 shell,而后者不支持;后者支持抽象命名空间 UDS。所以
|
6月前
|
存储 消息中间件 缓存
jeecgboot运行磁盘不足问题( java.io.IOException)和redis闪退问题
jeecgboot运行磁盘不足问题( java.io.IOException)和redis闪退问题
71 0
|
3月前
|
存储 Java
【IO面试题 四】、介绍一下Java的序列化与反序列化
Java的序列化与反序列化允许对象通过实现Serializable接口转换成字节序列并存储或传输,之后可以通过ObjectInputStream和ObjectOutputStream的方法将这些字节序列恢复成对象。