linux系统cpu占用过高故障排查-阿里云开发者社区

开发者社区> 负债程序猿> 正文

linux系统cpu占用过高故障排查

简介: 首先使用top命令查看cpu使用情况
+关注继续查看

20210127144445160.png首先使用top命令查看cpu使用情况

20210127142233352.png

属性释义


PID - 进程标示号

USER - 进程所有者

PR - 进程优先级

NI - 进程优先级别数值

VIRT - 进程占用的虚拟内存值

RES - 进程占用的物理内存值

SHR - 进程使用的共享内存值

S - 进程的状态,其中S表示休眠,R表示正在运行,Z表示僵死

%CPU - 进程占用的CPU使用率

%MEM - 进程占用的物理内存百分比

TIME+ - 进程启动后占用的总的CPU时间

Command - 进程启动的启动命令名称


通过%cpu列就能看出cpu占用情况,现在找到罪魁祸首后就该杀的杀该关的关


关闭进程

执行top命令出现任务列表后,如果想关闭进程,直接按键盘上的K键

20210127143527106.png

此时会让你输入想要关闭进程的pid(任务列表第一列,如果不输入的话默认关闭排在第一的进程)


比如你想关闭上面图片中的“51466”进程,输入54166后按回车


切记!

切记!

切记!


这里输入数字时注意不要按小键盘,要按键盘字母区上面的那排数字键;


比如我们要关闭pid为2的进程,输入2后按回车,会出现以下提示,此时再按回车就ok

20210127144445160.png

注意

如果执行top命令后,发现没有cpu占用率较高的进程,这时候你就得看看load average

20210127145220279.png

这里会有三个数值


load average:0.98,1.37,1.48


释义:


第一位表示最近1分钟平均负载

第二位表示最近5分钟平均负载

第三位表示最近15分钟平均负载


数值分析


我们一般直接看第三位,如果不正常再去看前两位,看下有没有下降趋势,这个值越大说明当前阻塞的任务越多


对于单核处理器来讲,数值超过1就是不正常的


如果是多核处理器,一般来说数值数值也不会超过5,当然这个跟自己服务器cpu核心数有关,你可以通过lscpu查看自己的核心数(cpus列)

20210127150456759.png

我的服务器是56核,上面图中能看到我的load average:0.98,1.37,1.48,这个值是5秒刷新一次,我观察了下,不会超过2,基本上处于0.8-1.8范围内波动。


cpu高负载是由于当前等待执行的任务过多,一般就是因为某些任务依赖的服务挂了或者cpu资源不足,只能通过恢复阻塞任务依赖的服务,或者直接重启来解决。。。




版权声明:本文内容由阿里云实名注册用户自发贡献,版权归原作者所有,阿里云开发者社区不拥有其著作权,亦不承担相应法律责任。具体规则请查看《阿里云开发者社区用户服务协议》和《阿里云开发者社区知识产权保护指引》。如果您发现本社区中有涉嫌抄袭的内容,填写侵权投诉表单进行举报,一经查实,本社区将立刻删除涉嫌侵权内容。

相关文章
ECS服务器CPU使用率异常100%问题排查
服务器会莫名其妙的出现CPU使用率100%,且top、htop等一些命令,无法查询到消耗CPU的进程,陷入排查困境怎么办?
14240 0
阿里云服务器端口号设置
阿里云服务器初级使用者可能面临的问题之一. 使用tomcat或者其他服务器软件设置端口号后,比如 一些不是默认的, mysql的 3306, mssql的1433,有时候打不开网页, 原因是没有在ecs安全组去设置这个端口号. 解决: 点击ecs下网络和安全下的安全组 在弹出的安全组中,如果没有就新建安全组,然后点击配置规则 最后如上图点击添加...或快速创建.   have fun!  将编程看作是一门艺术,而不单单是个技术。
10762 0
阿里云服务器如何登录?阿里云服务器的三种登录方法
购买阿里云ECS云服务器后如何登录?场景不同,阿里云优惠总结大概有三种登录方式: 登录到ECS云服务器控制台 在ECS云服务器控制台用户可以更改密码、更换系.
12909 0
湖北阿里云授权服务中心分析云服务器CPU跑满或跑高排查问题
相信很多客户在使用云服务器ECS时,若出现服务的速度变慢,或ECS实例突然断开。这种情况我们一般考虑服务器带宽和CPU是否有跑满或跑高的问题。若您预先创建报警任务,当带宽和CPU跑满或跑高时,系统将自动进行报警提醒。
1832 0
一次性搞清楚线上CPU100%,频繁FullGC排查套路
“ 处理过线上问题的同学基本上都会遇到系统突然运行缓慢,CPU 100%,以及 Full GC 次数过多的问题。 当然,这些问题最终导致的直观现象就是系统运行缓慢,并且有大量的报警。 本文主要针对系统运行缓慢这一问题,提供该问题的排查思路,从而定位出问题的代码点,进而提供解决该问题的思路。
1718 0
记一次Linux系统内存占用较高得排查
收到报警,系统的内存使用率触发阈值
1985 0
+关注
负债程序猿
知道的越多,不知道的越多
118
文章
0
问答
文章排行榜
最热
最新
相关电子书
更多
《2021云上架构与运维峰会演讲合集》
立即下载
《零基础CSS入门教程》
立即下载
《零基础HTML入门教程》
立即下载