Mysql 高负载排查思路

本文涉及的产品
云数据库 RDS MySQL,集群系列 2核4GB
推荐场景:
搭建个人博客
RDS MySQL Serverless 基础系列,0.5-2RCU 50GB
云数据库 RDS PostgreSQL,集群系列 2核4GB
简介:

Mysql 高负载排查思路 

发现问题 
top命令 查看服务器负载,发现 mysql竟然百分之两百的cpu,引起Mysql 负载这么高的原因,估计是索引问题和某些变态SQL语句. 

排查思路 
1. 确定高负载的类型,top命令看负载高是CPU还是IO。 
2. mysql 下执行查看当前的连接数与执行的sql 语句。 
3. 检查慢查询日志,可能是慢查询引起负载高。 
4. 检查硬件问题,是否磁盘故障问题造成的。 
5. 检查监控平台,对比此机器不同时间的负载。 

确定负载类型(top)

  1. top - 10:14:18 up 23 days, 11:01,  1 user, load average: 124.17, 55.88, 24.70 

  2. Tasks: 138 total,   1 running, 137 sleeping,   0 stopped,   0 zombie 

  3. Cpu(s):  2.4%us,  1.0%sy,  0.0%ni, 95.2%id,  2.0%wa,  0.1%hi,  0.2%si,  0.0%st 

  4. Mem:   3090528k total,  2965772k used,   124756k free,    93332k buffers 

  5. Swap:  4192956k total,  2425132k used,  1767824k free,   756524k cached 

  6.            

  7. PID USER      PR  NI  VIRT  RES  SHR S %CPU %MEM    TIME+  COMMAND 

  8. 30833 mysql     15   0 6250m 2.5g 4076 S 257.1 49.9 529:34.45 mysqld 


查看当前的连接数与执行的sql 语句

show processlist; 
Id  User    Host    db  Command Time    State   Info 
192 slave   8.8.8.142:39820 NULL    Binlog Dump 58982   Has sent all binlog to slave; waiting for binlog to be updated  NULL 
194 slave   8.8.8.120:41075 NULL    Binlog Dump 58982   Has sent all binlog to slave; waiting for binlog to be updated  NULL 
424891 biotherm    8.8.8.46:57861  biotherm    Query   493 Sending data    SELECT * FROM xxx_list WHERE tid = '1112'  AND del = 0  ORDER BY  id 
DESC  LIMIT 0, 4 
424917 biotherm    8.8.8.49:50984  biotherm    Query   488 Sending data    SELECT * FROM xxx_list WHERE tid = '1112'  AND del = 0  ORDER BY  id 
DESC  LIMIT 0, 4 
.............................................. 
430330 biotherm    8.8.8.42:35982  biotherm    Query   487 Sending data    SELECT * FROM xxx_list WHERE tid = '1112'  AND del = 0


记录慢查询 
编辑Mysql 配置文件(my.cnf),在[mysqld]字段添加以下几行:

log_slow_queries = /usr/local/mysql/var/slow_queries.log   #慢查询日志路径 
long_query_time = 10                                       #记录SQL查询超过10s的语句 
log-queries-not-using-indexes = 1                          #记录没有使用索引的sql


查看慢查询日志

tail /usr/local/mysql/var/slow_queries.log 
# Time: 130305  9:48:13
# User@Host: biotherm[biotherm] @  [8.8.8.45]
# Query_time: 1294.881407  Lock_time: 0.000179 Rows_sent: 4  Rows_examined: 1318033
SET timestamp=1363916893;
SELECT * FROM xxx_list WHERE tid = '11xx'  AND del = 0  ORDER BY  id DESC  LIMIT 0, 4;


4个参数 
Query_time: 0 Lock_time: 0 Rows_sent: 1 Rows_examined: 54 

分别意思为:查询时间 锁定时间 查询结果行数 扫描行数,主要看扫描行数多的语句,然后去数据库加上对应的索引,再优化下变态的sql 语句。 


极端情况kill sql进程

找出占用cpu时间过长的sql,在mysql 下执行如下命令: 
show processlist;
确定后一条sql处于Query状态,且Time时间过长,锁定它的ID,执行如下命令:
kill QUERY  269815764;

注意
:杀死 sql进程,可能导致数据丢失,所以执行前要衡量数据的重要性。 









本文转自 huangzp168 51CTO博客,原文链接:http://blog.51cto.com/huangzp/1981368,如需转载请自行联系原作者
相关实践学习
如何在云端创建MySQL数据库
开始实验后,系统会自动创建一台自建MySQL的 源数据库 ECS 实例和一台 目标数据库 RDS。
全面了解阿里云能为你做什么
阿里云在全球各地部署高效节能的绿色数据中心,利用清洁计算为万物互联的新世界提供源源不断的能源动力,目前开服的区域包括中国(华北、华东、华南、香港)、新加坡、美国(美东、美西)、欧洲、中东、澳大利亚、日本。目前阿里云的产品涵盖弹性计算、数据库、存储与CDN、分析与搜索、云通信、网络、管理与监控、应用服务、互联网中间件、移动服务、视频服务等。通过本课程,来了解阿里云能够为你的业务带来哪些帮助     相关的阿里云产品:云服务器ECS 云服务器 ECS(Elastic Compute Service)是一种弹性可伸缩的计算服务,助您降低 IT 成本,提升运维效率,使您更专注于核心业务创新。产品详情: https://www.aliyun.com/product/ecs
目录
相关文章
|
SQL 关系型数据库 MySQL
Java 最常见的面试题:mysql 问题排查都有哪些手段?
Java 最常见的面试题:mysql 问题排查都有哪些手段?
|
1月前
|
SQL 关系型数据库 MySQL
MySQL如何排查和删除重复数据
该文章介绍了在MySQL中如何排查和删除重复数据的方法,包括通过组合字段生成唯一标识符以及使用子查询和聚合函数来定位并删除重复记录的具体步骤。
116 2
|
2月前
|
SQL 关系型数据库 MySQL
遇到mysql数据库死锁,你会怎么排查?
遇到mysql数据库死锁,你会怎么排查?
172 0
|
2月前
|
SQL 关系型数据库 MySQL
(十八)MySQL排查篇:该如何定位并解决线上突发的Bug与疑难杂症?
前面《MySQL优化篇》、《SQL优化篇》两章中,聊到了关于数据库性能优化的话题,而本文则再来聊一聊关于MySQL线上排查方面的话题。线上排查、性能优化等内容是面试过程中的“常客”,而对于线上遇到的“疑难杂症”,需要通过理性的思维去分析问题、排查问题、定位问题,最后再着手解决问题,同时,如果解决掉所遇到的问题或瓶颈后,也可以在能力范围之内尝试最优解以及适当考虑拓展性。
161 3
|
2月前
|
SQL 关系型数据库 MySQL
破防了,谁懂啊家人们:记一次mysql问题排查
某天用户反馈线上产品报错,本文记录了这次mysql问题排查和修复的过程,希望给大家参考。
|
3月前
|
消息中间件 关系型数据库 MySQL
实时计算 Flink版操作报错合集之运行mysql to doris pipeline时报错,该如何排查
在使用实时计算Flink版过程中,可能会遇到各种错误,了解这些错误的原因及解决方法对于高效排错至关重要。针对具体问题,查看Flink的日志是关键,它们通常会提供更详细的错误信息和堆栈跟踪,有助于定位问题。此外,Flink社区文档和官方论坛也是寻求帮助的好去处。以下是一些常见的操作报错及其可能的原因与解决策略。
|
5月前
|
SQL 运维 关系型数据库
记一次 MySQL 主从同步异常的排查记录,百转千回!
这篇文章主要讲述了在 MySQL 主从同步过程中遇到的一个问题,即从库的 SQL 线程因 Relay Log 损坏导致同步停止。作者首先介绍了现象,从库的 Slave_IO_Running 正常,但 Slave_SQL_Running 停止,报错信息提示可能是 binlog 或 relay log 文件损坏。
161 6
|
5月前
|
负载均衡 关系型数据库 MySQL
MySQL-Proxy实现MySQL读写分离提高并发负载
MySQL-Proxy实现MySQL读写分离提高并发负载
|
关系型数据库 MySQL Serverless
RDS入门——RDS MySQL Serverless资源与负载自适应
通过本教程的操作,可以掌握如何创建RDS Serverless版实例、配置RDS Serverless版实例和体验RDS Serverless动态计费。
|
11月前
|
SQL 存储 关系型数据库
mysql 利用 performance_schema 排查 qps 过高过程记录
mysql 利用 performance_schema 排查 qps 过高过程记录
217 0

热门文章

最新文章