如何解决 MySQL 数据库服务器 CPU 飙升的情况

本文涉及的产品
RDS MySQL Serverless 基础系列,0.5-2RCU 50GB
云数据库 RDS MySQL,集群系列 2核4GB
推荐场景:
搭建个人博客
RDS MySQL Serverless 高可用系列,价值2615元额度,1个月
简介: 大家好,我是 V 哥。当 MySQL 数据库服务器 CPU 飙升时,如何快速定位和解决问题至关重要。本文整理了一套实用的排查和优化套路,包括使用系统监控工具、分析慢查询日志、优化 SQL 查询、调整 MySQL 配置参数、优化数据库架构及检查硬件资源等步骤。通过一个电商业务系统的案例,详细展示了从问题发现到解决的全过程,帮助你有效降低 CPU 使用率,提升系统性能。关注 V 哥,掌握更多技术干货。

大家好,我是 V 哥。当 MySQL 数据库服务器 CPU 飙升时,我们应该怎么办?从何入手解决问题,有没有什么套路,因为自古真情留不住,唯有套路得人心,虽然这是一句玩笑话,也算很贴切,遇到这种问题,你有哪些手段去排查是致关重要的,下面是 V 哥整理的套路,可按以下步骤来解决问题。先赞再看,你必腰缠万贯。

先来看一下有哪些套路

1. 定位问题

  • 使用工具监控:通过系统监控工具(如 Linux 下的 top、htop、vmstat 等)查看 MySQL 进程占用 CPU 的情况。还可以使用 MySQL 自带的性能监控工具,如 SHOW PROCESSLIST 查看当前正在执行的 SQL 语句,找出执行时间长或占用资源多的查询。
    SHOW PROCESSLIST;
    
  • 查看慢查询日志:开启慢查询日志,它可以记录执行时间超过指定阈值的 SQL 语句。通过分析慢查询日志,能找出可能导致 CPU 飙升的慢查询。
    -- 查看慢查询日志是否开启
    SHOW VARIABLES LIKE 'slow_query_log';
    -- 开启慢查询日志
    SET GLOBAL slow_query_log = 'ON';
    -- 设置慢查询时间阈值(单位:秒)
    SET GLOBAL long_query_time = 1;
    

2. 优化 SQL 查询

  • 优化查询语句:对慢查询语句进行优化,避免使用复杂的子查询、全表扫描等低效操作。例如,将子查询转换为连接查询,合理使用索引来提高查询效率。
    -- 原查询:使用子查询
    SELECT * FROM orders WHERE customer_id IN (SELECT customer_id FROM customers WHERE country = 'China');
    -- 优化后:使用连接查询
    SELECT orders.* FROM orders JOIN customers ON orders.customer_id = customers.customer_id WHERE customers.country = 'China';
    
  • 添加合适的索引:根据查询条件和经常排序、分组的字段添加索引,但要注意避免创建过多索引,因为索引会增加写操作的开销。
    -- 为 customers 表的 country 字段添加索引
    CREATE INDEX idx_country ON customers (country);
    

3. 调整 MySQL 配置参数

  • 调整缓冲池大小innodb_buffer_pool_size 参数控制 InnoDB 存储引擎的缓冲池大小,适当增大该参数可以减少磁盘 I/O,降低 CPU 使用率。
    [mysqld]
    innodb_buffer_pool_size = 2G
    
  • 调整线程池参数:如果 MySQL 版本支持线程池,可以调整线程池的相关参数,如 thread_pool_size 来优化线程管理,减少 CPU 上下文切换的开销。
    [mysqld]
    thread_pool_size = 64
    

4. 优化数据库架构

  • 表分区:对于大表,可以考虑使用表分区技术,将数据分散存储在不同的分区中,提高查询效率。
    -- 创建一个按范围分区的表
    CREATE TABLE sales (
      id INT,
      sale_date DATE,
      amount DECIMAL(10, 2)
    )
    PARTITION BY RANGE (YEAR(sale_date)) (
      PARTITION p2023 VALUES LESS THAN (2024),
      PARTITION p2024 VALUES LESS THAN (2025),
      PARTITION pmax VALUES LESS THAN MAXVALUE
    );
    
  • 垂直拆分和水平拆分:如果表的字段过多,可以进行垂直拆分,将不常用的字段分离到其他表中;如果表的数据量过大,可以进行水平拆分,将数据分散到多个表中。

5. 检查硬件资源

  • 增加 CPU 资源:如果服务器的 CPU 核心数不足或性能较低,可以考虑升级 CPU 或者增加服务器的 CPU 核心数。
  • 检查磁盘 I/O:高 CPU 使用率可能是由于磁盘 I/O 瓶颈导致的。可以使用工具(如 Linux 下的 iostat)检查磁盘 I/O 情况,如果磁盘 I/O 过高,可以考虑使用更快的磁盘(如 SSD)或者优化磁盘配置。

6. 处理锁竞争问题

  • 分析锁等待情况:使用 SHOW ENGINE INNODB STATUS 查看 InnoDB 存储引擎的状态信息,分析是否存在锁等待的情况。
    SHOW ENGINE INNODB STATUS;
    
  • 优化事务:尽量缩短事务的执行时间,避免长时间持有锁。可以将大事务拆分成多个小事务,减少锁的持有时间。

下面来看一个案例场景。

案例场景分析

案例背景是这样的,在电商业务系统中,数据库采用 MySQL 存储商品信息、订单信息、用户信息等。近期,运营部门反馈系统响应变慢,尤其是在每天晚上 8 点到 10 点的促销活动期间,系统几乎处于卡顿状态,经过监控发现 MySQL 服务器的 CPU 使用率飙升至接近 100%。

问题排查过程

  1. 使用系统监控工具:运维人员使用 Linux 系统的 top 命令查看系统进程,发现 MySQL 进程占用了大量的 CPU 资源。
  2. 查看 MySQL 执行情况:执行 SHOW PROCESSLIST 命令,发现有大量的查询语句处于执行状态,其中一条查询语句出现的频率很高,该语句用于查询某个热门商品的详细信息以及相关的用户评论。
    SELECT p.*, c.comment_content 
    FROM products p 
    JOIN comments c ON p.product_id = c.product_id 
    WHERE p.product_id = 12345 
    ORDER BY c.comment_time DESC;
    
  3. 分析慢查询日志:开启慢查询日志后,发现该查询语句的执行时间超过了 5 秒,属于慢查询。

问题原因分析

  1. 索引缺失products 表和 comments 表在连接字段 product_id 上没有创建索引,导致在执行连接查询时需要进行全表扫描,增加了 CPU 的负担。
  2. 数据量过大comments 表中存储了大量的用户评论信息,在进行排序操作时,需要对大量数据进行比较和排序,进一步消耗了 CPU 资源。

解决方法

  1. 添加索引:为 products 表和 comments 表的 product_id 字段添加索引,同时为 comments 表的 comment_time 字段添加索引,以提高排序效率。
    -- 为 products 表的 product_id 字段添加索引
    CREATE INDEX idx_products_product_id ON products (product_id);
    -- 为 comments 表的 product_id 字段添加索引
    CREATE INDEX idx_comments_product_id ON comments (product_id);
    -- 为 comments 表的 comment_time 字段添加索引
    CREATE INDEX idx_comments_comment_time ON comments (comment_time);
    
  2. 优化查询语句:考虑到用户可能只关心最新的几条评论,可以在查询语句中添加 LIMIT 子句,减少需要排序和返回的数据量。
    SELECT p.*, c.comment_content 
    FROM products p 
    JOIN comments c ON p.product_id = c.product_id 
    WHERE p.product_id = 12345 
    ORDER BY c.comment_time DESC 
    LIMIT 10;
    
  3. 调整 MySQL 配置参数:适当增大 innodb_buffer_pool_size 参数,以提高缓存命中率,减少磁盘 I/O 操作,从而降低 CPU 使用率。
    [mysqld]
    innodb_buffer_pool_size = 4G
    
  4. 定期清理数据:对 comments 表中一些陈旧的、用户不太关心的评论数据进行定期清理,减少表的数据量,提高查询效率。

实施效果

经过上述优化措施后,在促销活动期间再次监控 MySQL 服务器的 CPU 使用率,发现其稳定在 30% - 40% 左右,系统响应速度明显提升,用户体验得到了极大改善。

最后

唯有套路得人心,在理工男的字典里,啥都得有套路来尊循,如果还没有,那就去找到为止,希望这篇文章可以帮助到你,关注威哥爱编程,全栈之路就你行。

相关实践学习
如何快速连接云数据库RDS MySQL
本场景介绍如何通过阿里云数据管理服务DMS快速连接云数据库RDS MySQL,然后进行数据表的CRUD操作。
全面了解阿里云能为你做什么
阿里云在全球各地部署高效节能的绿色数据中心,利用清洁计算为万物互联的新世界提供源源不断的能源动力,目前开服的区域包括中国(华北、华东、华南、香港)、新加坡、美国(美东、美西)、欧洲、中东、澳大利亚、日本。目前阿里云的产品涵盖弹性计算、数据库、存储与CDN、分析与搜索、云通信、网络、管理与监控、应用服务、互联网中间件、移动服务、视频服务等。通过本课程,来了解阿里云能够为你的业务带来哪些帮助     相关的阿里云产品:云服务器ECS 云服务器 ECS(Elastic Compute Service)是一种弹性可伸缩的计算服务,助您降低 IT 成本,提升运维效率,使您更专注于核心业务创新。产品详情: https://www.aliyun.com/product/ecs
相关文章
|
4天前
|
关系型数据库 MySQL Linux
在Linux环境下备份Docker中的MySQL数据并传输到其他服务器以实现数据级别的容灾
以上就是在Linux环境下备份Docker中的MySQL数据并传输到其他服务器以实现数据级别的容灾的步骤。这个过程就像是一场接力赛,数据从MySQL数据库中接力棒一样传递到备份文件,再从备份文件传递到其他服务器,最后再传递回MySQL数据库。这样,即使在灾难发生时,我们也可以快速恢复数据,保证业务的正常运行。
61 28
|
1月前
|
弹性计算 Ubuntu 网络安全
ECS磁盘使用率异常升高,BPS,IOPS飙升
我刚开了一个2C4G的ECS,运行Ubuntu 20.04,常出现无响应、SSH断开等问题。原因是未配置swap,导致内存过高时磁盘写入频繁。解决办法在文章里。
167 72
|
26天前
|
安全 关系型数据库 MySQL
【YashanDB知识库】YMP从mysql迁移到崖山,报错:服务器错误
【YashanDB知识库】YMP从mysql迁移到崖山,报错:服务器错误
|
25天前
|
安全 关系型数据库 MySQL
【YashanDB知识库】YMP从mysql迁移到崖山,报错:服务器错误
【YashanDB知识库】YMP从mysql迁移到崖山,报错:服务器错误
【YashanDB知识库】YMP从mysql迁移到崖山,报错:服务器错误
|
1月前
|
安全 数据库 Windows
解决Windows云服务器带宽和CPU利用率高的问题
本文针对Windows Server 2019 ×64系统,介绍如何排查云服务器带宽和CPU利用率过高的问题。通过任务管理器、性能监视器等工具定位高资源占用的进程,并根据进程是否正常采取相应措施。对于正常进程,建议优化或升级配置;对于异常进程,建议关闭进程并进行系统备份或还原。详细步骤包括使用“perfmon -res”查看资源使用情况,结合PID查找具体进程,分析处理后台任务、杀毒软件及应用程序的影响。
72 1
|
2月前
|
存储 SQL 关系型数据库
服务器数据恢复—云服务器上mysql数据库数据恢复案例
某ECS网站服务器,linux操作系统+mysql数据库。mysql数据库采用innodb作为默认存储引擎。 在执行数据库版本更新测试时,操作人员误误将在本来应该在测试库执行的sql脚本在生产库上执行,导致生产库上部分表被truncate,还有部分表中少量数据被delete。
92 25
|
2月前
|
人工智能 运维 监控
2025年阿里云服务器配置选择全攻略:CPU、内存、带宽与系统盘详解
在2025年,阿里云服务器以高性能、灵活扩展和稳定服务助力数字化转型,提供轻量应用服务器、通用型g8i实例等多样化配置,满足个人博客至企业级业务需求。针对不同场景(如计算密集型、内存密集型),推荐相应实例类型与带宽规划,强调成本优化策略,包括包年包月节省成本、ESSD云盘选择及地域部署建议。文中还提及安全设置、监控备份的重要性,并指出未来可关注第九代实例g9i支持的新技术。整体而言,阿里云致力于帮助用户实现性能与成本的最优平衡。 以上简介共计238个字符。
|
3月前
|
SQL 监控 测试技术
一次压测引发的数据库CPU飙升...
一次压测过程中,当数据库的qps和tps都正常时,如果cpu利用率异常的高,应该如何排查?希望通过这篇文章,给你一些启发。
|
22天前
|
存储 缓存 网络协议
阿里云特惠云服务器99元与199元配置与性能和适用场景解析:高性价比之选
2025年,阿里云长效特惠活动继续推出两款极具吸引力的特惠云服务器套餐:99元1年的经济型e实例2核2G云服务器和199元1年的通用算力型u1实例2核4G云服务器。这两款云服务器不仅价格亲民,而且性能稳定可靠,为入门级用户和普通企业级用户提供了理想的选择。本文将对这两款云服务器进行深度剖析,包括配置介绍、实例规格、使用场景、性能表现以及购买策略等方面,帮助用户更好地了解这两款云服务器,以供参考和选择。
|
30天前
|
域名解析 人工智能 弹性计算
DeepSeek服务器繁忙解决方法:使用阿里云一键部署DeepSeek个人网站!
通过阿里云一键部署DeepSeek个人网站,解决服务器繁忙问题。学生用户可领取300元代金券实现0成本部署,普通用户则可用99元/年的服务器。教程涵盖从选择套餐、设置密码到获取百炼API-KEY的全流程,助您快速搭建专属大模型主页,体验DeepSeek、Qwen-max、Llama等多款模型,无需代码,最快5分钟完成部署。支持绑定个人域名,共享亲友使用,日均成本仅约1元。
132 10

热门文章

最新文章