【巡检问题分析与最佳实践】RDS MySQL 实例IO高问题

本文涉及的产品
RDS MySQL Serverless 基础系列,0.5-2RCU 50GB
云原生数据库 PolarDB MySQL 版,Serverless 5000PCU 100GB
云原生数据库 PolarDB 分布式版,标准版 2核8GB
简介: RDS MySQL的IO性能受到硬件层存储介质类型、软件层的DB内核架构、具体SQL语句扫描或修改数据量的影响。

存储形态

RDS MySQL的存储形态主要有2种:

  • 本地存储:本地存储拥有最低的IO延迟,但是本地盘的存储大小有限,如果数据增量大,本地空间不够时,需要迁移数据到其他的主机,数据量大时迁移时间较长,且迁移会有闪断。
  • 分布式存储:也就是云盘,包括SSD和ESSD,云盘拥有更高的性价比,提供更大的存储空间,扩容非常快,不需要迁移数据。

关于更多存储相关的介绍,请参考:云数据库RDS简介 -> 存储类型 https://help.aliyun.com/document_detail/69795.html

InnoDB IO系统

InnoDB AIO实现了一套独立的IO系统来处理数据页的读取和写入,如果SQL请求的数据页不在buffer pool中,会产生物理IO,需要读写底层存储的数据。对于读数据页操作通过同步IO实现,同步IO调用底层的读接口,对于写数据页操作通过异步IO实现,比如后台线程刷脏,后台IO线程会异步的将脏页刷到存储。除了对普通数据文件的读写IO操作,写redo/undo日志、写binlog日志、临时表排序、DDL重建表空间也会产生大量的IO。

高IO负载常见问题

高吞吐的写入

比如表上有很多索引或大字段,频繁的更新、删除、插入场景,读取数据和刷脏会有大量的IO。您可以从自治服务->性能趋势查看IO负载相关的指标:

InnoDB Data读写吞吐量

1.png

每秒Innodb读取、删除、插入、更新的行数:

2.png

建议降低读写频率或升级实例规格、优化刷脏相关的参数来解决高IO问题。和刷脏相关的参数如下:

innodb_max_dirty_pages_pct

innodb_max_dirty_pages_pct_lwm

innodb_io_capacity

innodb_io_capacity_max

临时表产生大量IO

关注临时文件目录大小,如果临时目录很大,可能有慢SQL排序、去重产生很大的临时表,临时表写入也会造成IO增加。您可以从自治服务->性能趋势查看tmp或other目录大小:

3.png

读取冷数据造成的IO高

如果SQL查询或修改的数据不在buffer pool中,则需要从存储读取,如果读取的数据量非常大,可能会造成很大的读IO吞吐。缓存池命中率,如果命中率很低说明请求的数据不在buffer pool中,可能会产生大量的读IO请求。您可以从自治服务->性能趋势查看buffer pool命中率:

4.png

DDL语句产生的IO负担

DDL语句可能会rebuild表空间,扫描全表数据,创建索引排序,新表产生的脏页需要刷脏,这些都会导致大量的IO吞吐。另外一种场景是drop table大表造成的IO抖动,常见于删除上T的大表,可能会造成文件系统jbd2 进程D状态,可以采用AliSQL异步删除大文件的功能避免这个问题。如下图所示:

5.png

6.png

大事务写Binlog

事务只有在提交时才会写binlog文件,如果存在大事务,比如一条delete sql删除大量的行,可能会产生数十G的binlog文件,这个binlog的文件的落盘,会造成很高的IO吞吐。建议尽量将事务拆小,避免大事务和降低修改频率。如下图所示:

7.png

优化建议

您需要分析实例高IO负载是属于上面说的哪种类型,然后采取针对性的优化方法,比如调整刷脏参数,SQL优化(培训视频https://yq.aliyun.com/live/1938)、规格升级(参考https://help.aliyun.com/document_detail/96061.html)、采用AliSQL异步删除表空间(参考https://help.aliyun.com/document_detail/134095.html)的功能等。

相关实践学习
基于CentOS快速搭建LAMP环境
本教程介绍如何搭建LAMP环境,其中LAMP分别代表Linux、Apache、MySQL和PHP。
全面了解阿里云能为你做什么
阿里云在全球各地部署高效节能的绿色数据中心,利用清洁计算为万物互联的新世界提供源源不断的能源动力,目前开服的区域包括中国(华北、华东、华南、香港)、新加坡、美国(美东、美西)、欧洲、中东、澳大利亚、日本。目前阿里云的产品涵盖弹性计算、数据库、存储与CDN、分析与搜索、云通信、网络、管理与监控、应用服务、互联网中间件、移动服务、视频服务等。通过本课程,来了解阿里云能够为你的业务带来哪些帮助     相关的阿里云产品:云服务器ECS 云服务器 ECS(Elastic Compute Service)是一种弹性可伸缩的计算服务,助您降低 IT 成本,提升运维效率,使您更专注于核心业务创新。产品详情: https://www.aliyun.com/product/ecs
相关文章
|
8天前
|
Prometheus 监控 Cloud Native
使用mysqld_exporter监控所有MySQL实例
使用mysqld_exporter监控所有MySQL实例
39 2
|
14天前
|
分布式计算 DataWorks 关系型数据库
DataWorks操作报错合集之DataWorks集成实例绑定到同一个vpc下面,也添加了RDS的IP白名单报错:数据源配置有误,请检查,该怎么处理
DataWorks是阿里云提供的一站式大数据开发与治理平台,支持数据集成、数据开发、数据服务、数据质量管理、数据安全管理等全流程数据处理。在使用DataWorks过程中,可能会遇到各种操作报错。以下是一些常见的报错情况及其可能的原因和解决方法。
28 0
|
14天前
|
DataWorks 关系型数据库 MySQL
DataWorks产品使用合集之在DataWorks中配置RDS MySQL数据源的步骤如何解决
DataWorks作为一站式的数据开发与治理平台,提供了从数据采集、清洗、开发、调度、服务化、质量监控到安全管理的全套解决方案,帮助企业构建高效、规范、安全的大数据处理体系。以下是对DataWorks产品使用合集的概述,涵盖数据处理的各个环节。
27 0
|
14天前
|
DataWorks NoSQL 关系型数据库
DataWorks操作报错合集之在使用 DataWorks 进行 MongoDB 同步时遇到了连通性测试失败,实例配置和 MongoDB 白名单配置均正确,且同 VPC 下 MySQL 可以成功连接并同步,但 MongoDB 却无法完成同样的操作如何解决
DataWorks是阿里云提供的一站式大数据开发与治理平台,支持数据集成、数据开发、数据服务、数据质量管理、数据安全管理等全流程数据处理。在使用DataWorks过程中,可能会遇到各种操作报错。以下是一些常见的报错情况及其可能的原因和解决方法。
31 1
|
15天前
|
存储 SQL 关系型数据库
MySql入门教程--MySQL数据库基础操作
MySql入门教程--MySQL数据库基础操作
|
15天前
|
存储 关系型数据库 MySQL
RDS for MySQL测试
【4月更文挑战第28天】
|
16天前
|
SQL 关系型数据库 MySQL
【MySQL 探索之旅】初始MySQL数据库
【MySQL 探索之旅】初始MySQL数据库
|
10月前
|
SQL Cloud Native 关系型数据库
ADBPG(AnalyticDB for PostgreSQL)是阿里云提供的一种云原生的大数据分析型数据库
ADBPG(AnalyticDB for PostgreSQL)是阿里云提供的一种云原生的大数据分析型数据库
780 1
|
10月前
|
数据可视化 关系型数据库 MySQL
将 PostgreSQL 迁移到 MySQL 数据库
将 PostgreSQL 迁移到 MySQL 数据库
1105 2
|
9月前
|
SQL 存储 自然语言处理
玩转阿里云RDS PostgreSQL数据库通过pg_jieba插件进行分词
在当今社交媒体的时代,人们通过各种平台分享自己的生活、观点和情感。然而,对于平台管理员和品牌经营者来说,了解用户的情感和意见变得至关重要。为了帮助他们更好地了解用户的情感倾向,我们可以使用PostgreSQL中的pg_jieba插件对这些发帖进行分词和情感分析,来构建一个社交媒体情感分析系统,系统将根据用户的发帖内容,自动判断其情感倾向是积极、消极还是中性,并将结果存储在数据库中。
玩转阿里云RDS PostgreSQL数据库通过pg_jieba插件进行分词

相关产品

  • 云数据库 RDS MySQL 版