Linux系统之Wait CPU time解析

简介: 上篇文章我们简要解析了用户CPU时间相关概念及应用实践,具体可参考链接🔗:Linux系统之User CPU time解析。 回顾之前的内容:在Linux操作系统中,通常采用8个不同的指标来研究Linux / Unix操作系统中的CPU消耗:用户CPU时间(us)、系统CPU时间(sy)、良好的CPU时间(ni)、空闲CPU时间(id)、等待CPU时间(wa)、硬件中断CPU时间(hi),软件中断CPU时间(si),被盗CPU时间(st)。在本文中,我们主要针对“等待CPU时间”进行解析。

     上篇文章我们简要解析了用户CPU时间相关概念及应用实践,具体可参考链接🔗:

Linux系统之User CPU time解析

      回顾之前的内容:在Linux操作系统中,通常采用8个不同的指标来研究Linux / Unix操作系统中的CPU消耗:用户CPU时间(us)、系统CPU时间(sy)、良好的CPU时间(ni)、空闲CPU时间(id)、等待CPU时间(wa)、硬件中断CPU时间(hi),软件中断CPU时间(si),被盗CPU时间(st)。在本文中,我们主要针对“等待CPU时间”进行解析。

 

什么是“等待” CPU时间?

     等待CPU时间表示CPU等待磁盘I / O或网络I / O操作完成所花费的时间。等待时间过长表示由于该设备上的I / O操作,CPU被“绞死”了。为了获得最佳性能,应该以使I / O等待CPU时间尽可能短为目标。如果等待时间> 10%,则需要对其进行问题排查。

      我们可以通过以下场景来形象化描述I / O等待时间:大家应该经历过或者已经在堵车中,有数百辆汽车在繁忙的道路上等待交通信号灯从“红色”切换为“绿色”。但是由于技术上的故障(此刻,交警也不在现场),交通信号灯从“红色”转换为“绿色”经历很长时间,迟迟没有发生更替。结果呢?数百辆汽车就傻傻的在原地等待,等待第三方介入处理。如果没有不及时处理,这将导致多种不良后果:乘客将无法及时到达目的地,驾驶员可能会感到沮丧并开始鸣喇叭(噪音污染),并且燃油将被浪费(空气污染),更有甚者直接无视交规,酿成大祸。    

如何查找“等待” CPU时间?

      可从以下来源找到等待的CPU时间:

     1、可以使用基于网络的根本原因分析工具来报告“等待”的CPU时间。如果“等待” CPU时间超出阈值,该工具便能够生成警报。


      2、Linux/Unix命令行工具“ wa”字段中的“ top”中也能够打印“等待” CPU时间,如下图所示:


[administrator@JavaLangOutOfMemory nacos-docker ]% top
top - 20:50:49 up 20:39,  2 users,  load average: 1.13, 0.86, 1.05
Tasks: 123 total,   1 running, 122 sleeping,   0 stopped,   0 zombie
%Cpu(s):  9.1 us,  6.2 sy,  0.0 ni, 83.9 id,  0.0 wa,  0.0 hi,  0.8 si,  0.0 st
KiB Mem :  3880584 total,  1006448 free,   859684 used,  2014452 buff/cache
KiB Swap:        0 total,        0 free,        0 used.  2583448 avail Mem 
  PID USER      PR  NI    VIRT    RES    SHR S  %CPU %MEM     TIME+ COMMAND                                                                                                                  
 2824 root      20   0  621140 357616  18272 S  10.9  9.2 118:20.09 kube-apiserver                                                                                                           
 2805 root      20   0  222392  49924  11240 S   7.6  1.3  81:42.59 kube-controller                                                                                                          
11442 root      20   0 1512420  69476  33528 S   6.9  1.8   0:03.56 kubelet                                                                                                                  
 2783 root      20   0   10.1g  58052   8152 S   5.3  1.5  48:55.54 etcd                                                                                                                     
 1108 root      20   0  626628  85044  10092 S   4.3  2.2  45:54.18 dockerd                                                                                                                  
  974 root      20   0 1078420  41340   4352 S   1.0  1.1   8:44.73 containerd                                                                                                               
11794 root      20   0  162136   2248   1556 R   0.7  0.1   0:00.09 top                                                                                                                      
    6 root      20   0       0      0      0 S   0.3  0.0   1:05.12 ksoftirqd/0                                                                                                              
    9 root      20   0       0      0      0 S   0.3  0.0   2:42.23 rcu_sched                                                                                                                
  395 root      20   0       0      0      0 S   0.3  0.0   2:26.41 xfsaild/dm-0                                                                                                             
  641 root      20   0   21540   1204    976 S   0.3  0.0   0:07.82 irqbalance                                                                                                               
 2858 root      20   0  147076  20348   6116 S   0.3  0.5   3:58.21 kube-scheduler                                                                                                           
 3884 root      20   0  142856  15952   4376 S   0.3  0.4   1:26.73 kube-proxy                                                                                                               
11268 root      20   0       0      0      0 S   0.3  0.0   0:00.01 kworker/u4:0                                                                                                             
    1 root      20   0  125616   3692   2152 S   0.0  0.1   0:42.74 systemd                                                                                                                  
    2 root      20   0       0      0      0 S   0.0  0.0   0:00.02 kthreadd                                                                                                                 
    4 root       0 -20       0      0      0 S   0.0  0.0   0:00.00 kworker/0:0H                                                                                                             
    7 root      rt   0       0      0      0 S   0.0  0.0   0:03.03 migration/0                                                                                                              
    8 root      20   0       0      0      0 S   0.0  0.0   0:00.00 rcu_bh                                                                                                                   
   10 root       0 -20       0      0      0 S   0.0  0.0   0:00.00 lru-add-drain                                                                                                            
   11 root      rt   0       0      0      0 S   0.0  0.0   0:05.44 watchdog/0

     

如何模拟较高的“等待” CPU时间?

      为了模拟高“等待” CPU报告,同样原理,与之前的“用户” CPU时间场景类似,我们写个简单的Demon。将其打成jar包,使其运行以模拟各种性能问题。当我们启动此应用jar包时,它将导致主机上的“等待” CPU消耗激增。具体如下:


[administrator@JavaLangOutOfMemory cpu ]% java -jar devopsDemo.jar PROBLEM_IO
Application started!
Starting to write to iofile-01.log
Starting to write to iofile-02.log
Starting to write to iofile-03.log
Starting to write to iofile-04.log
Starting to write to iofile-05.log
Starting to write to iofile-06.log
Read & write 1000 times to iofile-05.log
Read & write 1000 times to iofile-02.log
Read & write 1000 times to iofile-01.log
Read & write 1000 times to iofile-04.log
Read & write 1000 times to iofile-03.log
Read & write 1000 times to iofile-06.log
Read & write 1000 times to iofile-04.log
Read & write 1000 times to iofile-02.log
... ...

     

       针对此应用jar包,我们看下其部分代码如下:


public class IODemo {
    public void start() {              
             for (int counter =1; counter <= 6; ++counter) { 
            // Launch 6 threads.             
            new IOThread ("iofile-" + counter + ".log").start();         
         }     
     } 
}
public class IOThread extends Thread {     
    public String fileName; 
    public static final String CONTENT = 
"Hello CPU World! We are building a world where cpu resources are wasted and memmory resource are leaking. \n" + 
"Hello CPU World! We are building a world where cpu resources are wasted and memmory resource are leaking. \n" + 
"Hello CPU World! We are building a world where cpu resources are wasted and memmory resource are leaking. \n" + 
"Hello CPU World! We are building a world where cpu resources are wasted and memmory resource are leaking. \n" 
"Hello CPU World! We are building a world where cpu resources are wasted and memmory resource are leaking. \n" + 
"Hello CPU World! We are building a world where cpu resources are wasted and memmory resource are leaking. \n" + 
"Hello CPU World! We are building a world where cpu resources are wasted and memmory resource are leaking. \n" + 
"Hello CPU World! We are building a world where cpu resources are wasted and memmory resource are leaking. \n" 
    public IOThread(String fileName) {         
           this.fileName = fileName;     
}     
    public void run() {     
        int counter = 0; 
        // Loop infinitely trying to read and close the file.         
       while (true) { 
            // Write the contents to the file.             
            FileUtil.write(fileName, CONTENT);                          
            // Read the contents from the file.             
             FileUtil.read(fileName);         
         }        
     } 
} 

 

如何解决高“等待时间”?

      如果我们的资源设备的I / O等待时间过长,则可以尝试参考以下步骤进行优化及调整:

       1、借助命令行及相关分析工具,该工具会指向应用程序中的代码行,从而导致较高的I / O等待时间。

       2、可以通过执行以下操作来优化应用程序的等待时间:

     (1)减少数据库调用次数

     (2)优化数据库查询,以减少从数据库返回到应用程序的数据

     (3)减少对外部应用程序进行的网络呼叫数量

     (4)尝试最小化在外部应用程序和您的应用程序之间发送的有效负载量

     (5)尝试减少写入磁盘的文件数量。

     (6)尝试减少从磁盘读取的数据量。

     (7)确保仅将基本日志语句写入磁盘。

       3、确保我们的操作系统在安装了所有补丁程序的最新版本上运行。从安全性的角度来看,这不仅很好,而且还可以提高性能。

       4、确保在设备上分配了足够的可用内存。缺少可用内存有两个有害影响:

    (1)如果缺少可用内存,则将交换进程进出内存。磁盘将频繁写入和读取几页。它将增加磁盘I / O操作。

    (2)如果可用内存较少,则操作系统将无法在内存中缓存常用磁盘块。当高速缓存的磁盘块被缓存时,I / O等待时间将减少。

       5、将文件系统磁盘使用率保持在80%以下,以避免过多的碎片。当磁盘碎片过多时,I / O时间将增加。

       6、如果上述所有步骤均失败,则我们也可以尝试考虑升级存储以提高性能。例如,可以考虑切换到更快的SSD,NVMe,SAN存储等。

相关实践学习
CentOS 8迁移Anolis OS 8
Anolis OS 8在做出差异性开发同时,在生态上和依赖管理上保持跟CentOS 8.x兼容,本文为您介绍如何通过AOMS迁移工具实现CentOS 8.x到Anolis OS 8的迁移。
相关文章
|
21天前
|
网络协议 Unix Linux
深入解析:Linux网络配置工具ifconfig与ip命令的全面对比
虽然 `ifconfig`作为一个经典的网络配置工具,简单易用,但其功能已经不能满足现代网络配置的需求。相比之下,`ip`命令不仅功能全面,而且提供了一致且简洁的语法,适用于各种网络配置场景。因此,在实际使用中,推荐逐步过渡到 `ip`命令,以更好地适应现代网络管理需求。
34 11
|
1月前
|
缓存 安全 Linux
Linux系统查看操作系统版本信息、CPU信息、模块信息
在Linux系统中,常用命令可帮助用户查看操作系统版本、CPU信息和模块信息
110 23
|
25天前
|
小程序 前端开发 关系型数据库
uniapp跨平台框架,陪玩系统并发性能测试,小程序源码搭建开发解析
多功能一体游戏陪练、语音陪玩系统的开发涉及前期准备、技术选型、系统设计与开发及测试优化。首先,通过目标用户分析和竞品分析明确功能需求,如注册登录、预约匹配、实时语音等。技术选型上,前端采用Uni-app支持多端开发,后端选用PHP框架确保稳定性能,数据库使用MySQL保证数据一致性。系统设计阶段注重UI/UX设计和前后端开发,集成WebSocket实现语音聊天。最后,通过功能、性能和用户体验测试,确保系统的稳定性和用户满意度。
|
1月前
|
存储 运维 安全
深入解析操作系统控制台:阿里云Alibaba Cloud Linux(Alinux)的运维利器
本文将详细介绍阿里云的Alibaba Cloud Linux操作系统控制台的功能和优势。
67 6
|
1月前
|
存储 分布式计算 Hadoop
基于Java的Hadoop文件处理系统:高效分布式数据解析与存储
本文介绍了如何借鉴Hadoop的设计思想,使用Java实现其核心功能MapReduce,解决海量数据处理问题。通过类比图书馆管理系统,详细解释了Hadoop的两大组件:HDFS(分布式文件系统)和MapReduce(分布式计算模型)。具体实现了单词统计任务,并扩展支持CSV和JSON格式的数据解析。为了提升性能,引入了Combiner减少中间数据传输,以及自定义Partitioner解决数据倾斜问题。最后总结了Hadoop在大数据处理中的重要性,鼓励Java开发者学习Hadoop以拓展技术边界。
50 7
|
2月前
|
存储 监控 算法
企业内网监控系统中基于哈希表的 C# 算法解析
在企业内网监控系统中,哈希表作为一种高效的数据结构,能够快速处理大量网络连接和用户操作记录,确保网络安全与效率。通过C#代码示例展示了如何使用哈希表存储和管理用户的登录时间、访问IP及操作行为等信息,实现快速的查找、插入和删除操作。哈希表的应用显著提升了系统的实时性和准确性,尽管存在哈希冲突等问题,但通过合理设计哈希函数和冲突解决策略,可以确保系统稳定运行,为企业提供有力的安全保障。
|
2月前
|
安全 前端开发 Android开发
探索移动应用与系统:从开发到操作系统的深度解析
在数字化时代的浪潮中,移动应用和操作系统成为了我们日常生活的重要组成部分。本文将深入探讨移动应用的开发流程、关键技术和最佳实践,同时分析移动操作系统的核心功能、架构和安全性。通过实际案例和代码示例,我们将揭示如何构建高效、安全且用户友好的移动应用,并理解不同操作系统之间的差异及其对应用开发的影响。无论你是开发者还是对移动技术感兴趣的读者,这篇文章都将为你提供宝贵的见解和知识。
|
2月前
|
安全 搜索推荐 数据挖掘
陪玩系统源码开发流程解析,成品陪玩系统源码的优点
我们自主开发的多客陪玩系统源码,整合了市面上主流陪玩APP功能,支持二次开发。该系统适用于线上游戏陪玩、语音视频聊天、心理咨询等场景,提供用户注册管理、陪玩者资料库、预约匹配、实时通讯、支付结算、安全隐私保护、客户服务及数据分析等功能,打造综合性社交平台。随着互联网技术发展,陪玩系统正成为游戏爱好者的新宠,改变游戏体验并带来新的商业模式。
|
3月前
|
监控 Java 应用服务中间件
高级java面试---spring.factories文件的解析源码API机制
【11月更文挑战第20天】Spring Boot是一个用于快速构建基于Spring框架的应用程序的开源框架。它通过自动配置、起步依赖和内嵌服务器等特性,极大地简化了Spring应用的开发和部署过程。本文将深入探讨Spring Boot的背景历史、业务场景、功能点以及底层原理,并通过Java代码手写模拟Spring Boot的启动过程,特别是spring.factories文件的解析源码API机制。
132 2
|
2月前
|
设计模式 存储 安全
【23种设计模式·全精解析 | 创建型模式篇】5种创建型模式的结构概述、实现、优缺点、扩展、使用场景、源码解析
创建型模式的主要关注点是“怎样创建对象?”,它的主要特点是"将对象的创建与使用分离”。这样可以降低系统的耦合度,使用者不需要关注对象的创建细节。创建型模式分为5种:单例模式、工厂方法模式抽象工厂式、原型模式、建造者模式。
【23种设计模式·全精解析 | 创建型模式篇】5种创建型模式的结构概述、实现、优缺点、扩展、使用场景、源码解析