io分析神器blktrace

简介: 一、概述  【许久之前就用过blktrace,现整理如下】   从linux 一个完整的IO入手分析:        一个I/O请求进入block layer之后,可能会经历下面的过程:Remap: 可能被DM(Device Mapper)或MD(Multiple Device, ...

一、概述

  【许久之前就用过blktrace,现整理如下】

   从linux 一个完整的IO入手分析:

  

    

  一个I/O请求进入block layer之后,可能会经历下面的过程:

    • Remap: 可能被DM(Device Mapper)或MD(Multiple Device, Software RAID) remap到其它设备
    • Split: 可能会因为I/O请求与扇区边界未对齐、或者size太大而被分拆(split)成多个物理I/O
    • Merge: 可能会因为与其它I/O请求的物理位置相邻而合并(merge)成一个I/O
    • 被IO Scheduler依照调度策略发送给driver
    • 被driver提交给硬件,经过HBA、电缆(光纤、网线等)、交换机(SAN或网络)、最后到达存储设备,设备完成IO请求之后再把结果发回。

 blktrace 能够记录下IO所经历的各个步骤: 

     一起看下blktrace的输出长什么样子:

  • 第一个字段:8,0 这个字段是设备号 major device ID和minor device ID。
  • 第二个字段:3 表示CPU
  • 第三个字段:11 序列号
  • 第四个字段:0.009507758 Time Stamp是时间偏移
  • 第五个字段:PID 本次IO对应的进程ID
  • 第六个字段:Event,这个字段非常重要,反映了IO进行到了那一步
  • 第七个字段:R表示 Read, W是Write,D表示block,B表示Barrier Operation
  • 第八个字段:223490+56,表示的是起始block number 和 number of blocks,即我们常说的Offset 和 Size
  • 第九个字段: 进程名

    其中第六个字段非常有用:每一个字母都代表了IO请求所经历的某个阶段。

1 Q – 即将生成IO请求
2 |
3 G – IO请求生成
4 |
5 I – IO请求进入IO Scheduler队列
6 |
7 D – IO请求进入driver
8 |
9 C – IO请求执行完毕

  注意,整个IO路径,分成很多段,每一段开始的时候,都会有一个时间戳,根据上一段开始的时间和下一段开始的时间,就可以得到IO 路径各段花费的时间。

  注意,我们心心念念的service time,也就是反应块设备处理能力的指标,就是从D到C所花费的时间,简称D2C。

  而iostat输出中的await,即整个IO从生成请求到IO请求执行完毕,即从Q到C所花费的时间,我们简称Q2C。

  我们知道Linux 有I/O scheduler,调度器的效率如何,I2D是重要的指标。

    注意,这只是blktrace输出的一个部分,很明显,我们还能拿到offset和size,根据offset,我们能拿到某一段时间里,应用程序都访问了整个块设备的那些block,从而绘制出块设备访问轨迹图。

    另外还有size和第七个字段(Read or Write),我们可以知道IO size的分布直方图。对于本文来讲,我们就是要根据blktrace来获取这些信息。      

相关文章
|
4月前
|
数据采集 算法 数据处理
Python中的并发编程:异步IO与多线程对比分析
传统的多线程编程在Python中因为全局解释器锁(GIL)的存在受到限制,导致多线程并不能充分利用多核处理器的优势。本文将探讨Python中的异步IO编程与多线程编程的差异与优劣,并分析适合的应用场景。
|
5月前
|
存储 自然语言处理 Java
Java IO流完全手册:字节流和字符流的常见应用场景分析!
【6月更文挑战第26天】Java IO流涵盖字节流和字符流,字节流用于二进制文件读写及网络通信,如图片和音频处理;字符流适用于文本文件操作,支持多语言编码,确保文本正确性。在处理数据时,根据内容类型选择合适的流至关重要。
66 0
|
6月前
|
SQL 关系型数据库 MySQL
PostgreSQL【异常 01】java.io.IOException:Tried to send an out-of-range integer as a 2-byte value 分析+解决
PostgreSQL【异常 01】java.io.IOException:Tried to send an out-of-range integer as a 2-byte value 分析+解决
410 1
|
监控 数据库 块存储
【操作系统】磁盘IO常见性能指标和分析工具实战
【操作系统】磁盘IO常见性能指标和分析工具实战
【操作系统】磁盘IO常见性能指标和分析工具实战
一键分析硬件/IO/全国网络性能脚本(强推)
一键分析硬件/IO/全国网络性能脚本(强推)
|
缓存 网络协议 Linux
【攻破技术盲点】— 网络IO模型的分析(上)
【攻破技术盲点】— 网络IO模型的分析(上)
180 0
【攻破技术盲点】— 网络IO模型的分析(上)
|
设计模式 移动开发 编解码
从操作系统层面分析Java IO演进之路
本文从操作系统实际调用角度(以CentOS Linux release 7.5操作系统为示例),力求追根溯源看IO的每一步操作到底发生了什么。
从操作系统层面分析Java IO演进之路
|
MySQL 关系型数据库
MySQL服务器 IO 100%的案例分析
原文:MySQL服务器 IO 100%的案例分析 【问题】 有台MySQL 5.6.21的数据库实例以写入为主,IO %util接近100%   写入IOPS很高   【分析过程】 1、通过iotop工具可以看到当前IO消耗最高的mysql线程   2、查看线程49342的堆栈,可以...
985 0
|
Java API
Java NIO (十四)NIO 和 IO 的区别和适用场景分析
在研究Java NIO和IO API时,很快就会想到一个问题: 什么时候应该使用IO,什么时候应该使用NIO? 在本文中,我将尝试阐明Java NIO和IO之间的区别,它们的用例以及它们如何影响代码的设计。
1587 0