DB Server 磁盘IO诊断

本文涉及的产品
云数据库 RDS MySQL Serverless,0.5-2RCU 50GB
简介:

今日 zabbix 报警磁盘IO利用率达到90%。

   又激动又担心,很久没处理故障啦,这次的故障应该很快会修复吧。。。

   首先查看磁盘基本情况:

   iostat  -x  1

   avg-cpu:  %user   %nice %system %iowait  %steal   %idle
           1.57    0.00    2.75   37.65    0.00   58.04

Device:         rrqm/s   wrqm/s     r/s     w/s    rkB/s    wkB/s avgrq-sz avgqu-sz   await r_await w_await  svctm  %util
vda               0.00     0.00    0.00    0.00     0.00     0.00     0.00     0.00    0.00    0.00    0.00   0.00   0.00
vdb               0.00    10.00    0.00   19.00     0.00  2240.00   235.79     1.91  104.21    0.00  104.21  52.21  99.20

avg-cpu:  %user   %nice %system %iowait  %steal   %idle
           2.84    0.00    1.75   20.09    0.00   75.33

Device:         rrqm/s   wrqm/s     r/s     w/s    rkB/s    wkB/s avgrq-sz avgqu-sz   await r_await w_await  svctm  %util
vda               0.00     0.00    0.00    0.00     0.00     0.00     0.00     0.00    0.00    0.00    0.00   0.00   0.00
vdb               0.00     4.00    0.00  102.00     0.00  1832.00    35.92     5.03   47.37    0.00   47.37   9.80 100.00

avg-cpu:  %user   %nice %system %iowait  %steal   %idle
           1.92    0.00    2.24   30.13    0.00   65.71

Device:         rrqm/s   wrqm/s     r/s     w/s    rkB/s    wkB/s avgrq-sz avgqu-sz   await r_await w_await  svctm  %util
vda               0.00     0.00    0.00    9.00     0.00    36.00     8.00     0.00    0.00    0.00    0.00   0.00   0.00
vdb               0.00    17.00    1.00   31.00     4.00  1596.00   100.00     2.38   54.75   72.00   54.19  30.75  98.40

avg-cpu:  %user   %nice %system %iowait  %steal   %idle
           0.35    0.00    0.35   30.56    0.00   68.75

Device:         rrqm/s   wrqm/s     r/s     w/s    rkB/s    wkB/s avgrq-sz avgqu-sz   await r_await w_await  svctm  %util
vda               0.00     0.00    0.00    0.00     0.00     0.00     0.00     0.00    0.00    0.00    0.00   0.00   0.00
vdb               0.00     0.00    0.00   24.00     0.00   304.00    25.33     2.46  133.83    0.00  133.83  41.67 100.00   

   CPU iowait 达到 20%左右, IO利用率 几乎全部100%。

   首选确定没有新的功能上线,

   SQL都是审核过的,

   查看show processlist 语句大多处于 updating 状态。

   iotop 查看 具体进程的情况:

   (Iotop 使用 Python 语言编写而成,要求 Python 2.5(及以上版本)和 Linux kernel 2.6.20(及以上版本))

   817 be/3 root        0.00 B/s    0.00 B/s  0.00 % 43.37 % [jbd2/vdb-8]
14841 be/4 mysql       0.00 B/s 1971.36 K/s  0.00 % 37.46 % mysqld --defaults-file=/usr/local/mysql/mysql.cnf --basedir=/usr/local/mysql/ --datadir=~sr/local/mysql/data//10-4-7-99.pid --socket=/usr/local/mysql/data/mysql.sock --port=3306
21497 be/4 mysql       0.00 B/s    0.00 B/s  0.00 %  7.27 % mysqld --defaults-file=/usr/local/mysql/mysql.cnf --basedir=/usr/local/mysql/ --datadir=~sr/local/mysql/data//10-4-7-99.pid --socket=/usr/local/mysql/data/mysql.sock --port=3306
14837 be/4 mysql       0.00 B/s  231.02 K/s  0.00 %  0.00 % mysqld --defaults-file=/usr/local/mysql/mysql.cnf --basedir=/usr/local/mysql/ --datadir=~sr/local/mysql/data//10-4-7-99.pid --socket=/usr/local/mysql/data/mysql.sock --port=3306
14832 be/4 mysql       0.00 B/s  261.82 K/s  0.00 %  0.00 % mysqld --defaults-file=/usr/local/mysql/mysql.cnf --basedir=/usr/local/mysql/ --datadir=~sr/local/mysql/data//10-4-7-99.pid --socket=/usr/local/mysql/data/mysql.sock --port=3306

   可以确定 问题出在操作系统上,

   我们使用的云主机,jdb2进程 应该交给云平台服务商来处理啦。

   结果问题是:我们多个DB是存在于同一个母机上,IO竞争比较严重。。哎可恶的云计算,

   云中的mysql 可以参考这边文章,http://weipengfei.blog.51cto.com/1511707/1060212

   但高兴的是 可以将DB分至其他母机。






本文转自 位鹏飞 51CTO博客,原文链接:http://blog.51cto.com/weipengfei/1124199,如需转载请自行联系原作者

相关实践学习
基于CentOS快速搭建LAMP环境
本教程介绍如何搭建LAMP环境,其中LAMP分别代表Linux、Apache、MySQL和PHP。
全面了解阿里云能为你做什么
阿里云在全球各地部署高效节能的绿色数据中心,利用清洁计算为万物互联的新世界提供源源不断的能源动力,目前开服的区域包括中国(华北、华东、华南、香港)、新加坡、美国(美东、美西)、欧洲、中东、澳大利亚、日本。目前阿里云的产品涵盖弹性计算、数据库、存储与CDN、分析与搜索、云通信、网络、管理与监控、应用服务、互联网中间件、移动服务、视频服务等。通过本课程,来了解阿里云能够为你的业务带来哪些帮助     相关的阿里云产品:云服务器ECS 云服务器 ECS(Elastic Compute Service)是一种弹性可伸缩的计算服务,助您降低 IT 成本,提升运维效率,使您更专注于核心业务创新。产品详情: https://www.aliyun.com/product/ecs
目录
相关文章
|
2月前
|
缓存 运维 Linux
Linux系统调优详解(十二)——IO调优之磁盘测速
Linux系统调优详解(十二)——IO调优之磁盘测速
58 1
|
4月前
|
缓存 关系型数据库 MySQL
MySQL Binlog--事务日志和BINLOG落盘参数对磁盘IO的影响
MySQL Binlog--事务日志和BINLOG落盘参数对磁盘IO的影响
47 0
|
5天前
|
机器学习/深度学习 缓存 监控
linux查看CPU、内存、网络、磁盘IO命令
`Linux`系统中,使用`top`命令查看CPU状态,要查看CPU详细信息,可利用`cat /proc/cpuinfo`相关命令。`free`命令用于查看内存使用情况。网络相关命令包括`ifconfig`(查看网卡状态)、`ifdown/ifup`(禁用/启用网卡)、`netstat`(列出网络连接,如`-tuln`组合)以及`nslookup`、`ping`、`telnet`、`traceroute`等。磁盘IO方面,`iostat`(如`-k -p ALL`)显示磁盘IO统计,`iotop`(如`-o -d 1`)则用于查看磁盘IO瓶颈。
|
17天前
|
Linux
Linux操作系统调优相关工具(三)查看IO运行状态相关工具 查看哪个磁盘或分区最繁忙?
Linux操作系统调优相关工具(三)查看IO运行状态相关工具 查看哪个磁盘或分区最繁忙?
21 0
|
2月前
|
运维 Linux
Linux系统调优详解(五)——磁盘IO状态查看命令
Linux系统调优详解(五)——磁盘IO状态查看命令
53 5
|
2月前
|
网络协议 Linux
【系统DFX】如何诊断占用过多 CPU、内存、IO 等的神秘进程?
【系统DFX】如何诊断占用过多 CPU、内存、IO 等的神秘进程?
111 0
|
3月前
|
Linux 测试技术
百度搜索:蓝易云【linux系统磁盘IO性能检测教程】
这些是在Linux系统中检测磁盘IO性能的常见方法。根据您的需求和具体环境,您可以选择适合您的方法来监视和测试磁盘IO性能。请注意,在进行性能测试时要小心,以避免对系统造成不必要的负载或影响正常运行。
46 0
|
4月前
|
存储 缓存 监控
Elasticsearch elastic io 100%,但磁盘的iops和吞吐量没爆没啥原因吗?
Elasticsearch elastic io 100%,但磁盘的iops和吞吐量没爆没啥原因吗?
53 2
|
4月前
|
搜索推荐 索引
Elasticsearch elastic io 100%,但磁盘的iops和吞吐量没爆没啥原因吗?
Elasticsearch elastic io 100%,但磁盘的iops和吞吐量没爆没啥原因吗?
71 3
|
10月前
|
存储 缓存 算法
【Linux】基础IO(二)--- 理解内核级和用户级缓冲区、磁盘与ext系列文件系统、inode与软硬连接(下)
【Linux】基础IO(二)--- 理解内核级和用户级缓冲区、磁盘与ext系列文件系统、inode与软硬连接(下)
139 1