怎么找出消耗 CPU 的罪魁祸首?!

简介: 谁在消耗cpu?用户+系统+IO等待+软硬中断+空闲。用户空间CPU消耗,各种逻辑运算,正在进行大量tps,函数/排序/类型转化/逻辑IO访问…

云栖号资讯:【点击查看更多行业资讯
在这里您可以找到不同行业的第一手的上云资讯,还在等什么,快来!

谁在消耗cpu?
用户+系统+IO等待+软硬中断+空闲

911D557F_A73C_4079_BF59_9EBC11591CFD

# 祸首是谁?

用户

用户空间CPU消耗,各种逻辑运算
正在进行大量tps
函数/排序/类型转化/逻辑IO访问…

IO等待

等待IO请求的完成
此时CPU实际上空闲
如vmstat中的wa 很高。但IO等待增加,wa也不一定会上升(请求I/O后等待响应,但进程从核上移开了)

D32FC49F_D9B3_4f65_AEF8_A3319AE9D8A9

产生影响

用户和IO等待消耗了大部分cpu

  • 吞吐量下降(tps)
  • 查询响应时间增加
  • 慢查询数增加
  • 对mysql的并发陡增,也会产生上述影响

35C9ABB2_3034_4da9_9459_8D3C0BB27D25

# 如何减少CPU消耗?

减少等待

减少IO量
SQL/index,使用合适的索引减少扫描的行数(需平衡索引的正收益和维护开销,空间换时间)
提升IO处理能力
加cache/加磁盘/SSD

25F10EAE_343D_4e95_92A1_94093F525129

减少计算

减少逻辑运算量

  • 避免使用函数,将运算转移至易扩展的应用服务器中
    如substr等字符运算,dateadd/datesub等日期运算,abs等数学函数
  • 减少排序,利用索引取得有序数据或避免不必要排序
    如union all代替 union,order by 索引字段等
  • 禁止类型转换,使用合适类型并保证传入参数类型与数据库字段类型绝对一致,如数字用tiny/int/bigint等,必需转换的在传入数据库之前在应用中转好
  • 简单类型,尽量避免复杂类型,降低由于复杂类型带来的附加运算。更小的数据类型占用更少的磁盘、内存、cpu缓存和cpu周期
  • ….

减少逻辑IO量

  • index,优化索引,减少不必要的表扫描
    如增加索引,调整组合索引字段顺序,去除选择性很差的索引字段等等
  • table,合理拆分,适度冗余
    如将很少使用的大字段拆分到独立表,非常频繁的小字段冗余到“引用表”
  • SQL,调整SQL写法,充分利用现有索引,避免不必要的扫描,排序及其他操作
    如减少复杂join,减少order by,尽量union all,避免子查询等
  • 数据类型,够用就好,减少不必要使用大字段
    如tinyint够用就别总是int,int够用也别老bigint,date够用也别总是timestamp
  • ….

1A65D612_095F_4d44_A58A_5C324AC0448C

减少query请求量(非数据库本身)

  • 适当缓存,降低缓存数据粒度,对静态并被频繁请求的数据进行适当的缓存
    如用户信息,商品信息等
  • 优化实现,尽量去除不必要的重复请求
    如禁止同一页面多次重复请求相同数据的问题,通过跨页面参数传递减少访问等
  • 合理需求,评估需求产出比,对产出比极端底下的需求合理去除
  • ….

2FDB3D07_041F_4f9f_B272_0470D7CA9DA1

升级cpu

  • 若经过减少计算和减少等待后还不能满足需求,cpu利用率还高T_T
  • 是时候拿出最后的杀手锏了,升级cpu,是选择更快的cpu还是更多的cpu了?

【云栖号在线课堂】每天都有产品技术专家分享!
课程地址:https://yqh.aliyun.com/zhibo

立即加入社群,与专家面对面,及时了解课程最新动态!
【云栖号在线课堂 社群】https://c.tb.cn/F3.Z8gvnK

原文发布时间:2020-06-10
本文作者:jiaxin
本文来自:“互联网架构师 微信公众号”,了解相关信息可以关注“互联网架构师

相关文章
|
Docker 容器
CPU内存不足分析Gitlab的内存消耗
CPU内存不足分析Gitlab的内存消耗
CPU内存不足分析Gitlab的内存消耗
|
容器
【Azure Container App】在消耗性的Container App Environmnet中无法查看当时正在使用多少CPU多少实例数的替代方案
在 Azure Container Apps 中使用 Consumption 消耗型环境时,无法通过门户查看当前核心 (CPU) 和实例使用情况。这是因为消耗型工作负载配置文件的设计所致。若需查看使用状态,可使用 az cli 命令 `az containerapp env list-usages` 获取详细信息,包括 Current Cores 数量。文档还提供了参考资料链接以帮助用户深入了解相关命令用法。
251 17
|
存储 安全 Java
什么?CPU消耗要压降80% ——《事件序列化CPU开销压降》揭榜
本文为《事件CPU开销压降》揭榜报告,旨在解决风控系统间信息传递时事件体持续膨胀导致的序列化/反序列化CPU消耗过高的问题。
439 12
|
存储 Kubernetes Perl
【CKA模拟题】查询消耗CPU最多的Pod
【CKA模拟题】查询消耗CPU最多的Pod
260 0
【CKA模拟题】查询消耗CPU最多的Pod
|
缓存 Java 大数据
深入解析JVM调优:解决OutOfMemoryError、内存泄露、线程死锁、锁争用和高CPU消耗问题
深入解析JVM调优:解决OutOfMemoryError、内存泄露、线程死锁、锁争用和高CPU消耗问题
639 0
|
移动开发 Java
Java进程如何定位消耗CPU的代码
Java进程如何定位消耗CPU的代码
612 0
|
Java 调度
JVM调优之Java进程消耗CPU过高
JVM调优之Java进程消耗CPU过高
470 0
|
7月前
|
缓存 人工智能 算法
不同业务怎么选服务器?CPU / 内存 / 带宽配置表
本文详解了服务器三大核心配置——CPU、内存、带宽,帮助读者快速理解服务器性能原理。结合不同业务场景,如个人博客、电商、数据库、直播等,提供配置选择建议,并强调合理搭配的重要性,避免资源浪费或瓶颈限制。内容实用,适合初学者和业务选型参考。
1083 0
|
7月前
|
存储 消息中间件 缓存
从纳秒到毫秒的“时空之旅”:CPU是如何看待内存与硬盘的?
在数据爆炸的时代,如何高效存储与管理海量数据成为系统设计的核心挑战。本文从计算机存储体系结构出发,解析B+树、LSM树与Kafka日志结构在不同数据库中的应用与优化策略,帮助你深入理解高性能存储背后的原理。
235 0
|
9月前
|
存储
阿里云轻量应用服务器收费标准价格表:200Mbps带宽、CPU内存及存储配置详解
阿里云香港轻量应用服务器,200Mbps带宽,免备案,支持多IP及国际线路,月租25元起,年付享8.5折优惠,适用于网站、应用等多种场景。
2951 0

热门文章

最新文章

下一篇
开通oss服务