MySQL · 最佳实践 · RDS 只读实例延迟分析-阿里云开发者社区

开发者社区> db匠> 正文

MySQL · 最佳实践 · RDS 只读实例延迟分析

简介:
+关注继续查看

前言

只读实例是目前 RDS 用户实现数据读写分离的一种常见架构,用户只需要将业务中的读请求分担到只读节点上,就可以缓解主库查询压力,同时也可以把一些 OLAP 的分析查询放到另外的只读节点上,减小复杂统计查询对主库的冲击,RDS只读节点架构图如下:

screenshot

由于RDS只读节点采用原生的MySQL Binlog复制技术,那么延迟必然会成为其成立之初就会存在的问题。延迟会导致只读节点与主库的数据出现不一致,进而可能造成业务上逻辑的混乱或者数据不正确。

最近也收到了很多用户关于只读实例延迟的问题反馈,下面将会分析RDS只读实例出现延迟的几种常见场景,希望能够帮助用户理解和处理只读节点的延迟,更好地使用只读节点:

  1. 只读节点规格过小(10%)

  2. 主库的TPS过高(20%)

  3. 主库的DDL(alter、drop、repair)(40%)

  4. 主库大事务(insert..select)(20%)

  5. 其他(无主键)(10%)

screenshot

场景一:只读实例规格配置过小导致延迟

这类延迟场景的出现往往是主节点购买的一个较大规格的配置,而只读节点却购买了一个最小规格的配置(例如240M内存/150 IOPS)。

分析:只读节点的数据为了和主节点保持同步,采用了MySQL原生的binlog复制技术,由一个IO线程和一个SQL线程来完成,IO线程负责将主库的binlog拉取到只读节点,SQL线程负责消费这些binlog日志,这两个线程会消耗掉只读节点的IO资源,所以当只读节点IOPS配置不够的时候,则会导致只读节点的数据出现延迟:

screenshot

可以通过只读节点性能监控来判断是否已经达到只读实例的资源配额:

screenshot

screenshot

所以当这样的延迟情况的发生的时候,需要用户升级只读实例的规格(可以参考主库此时的IOPS的消耗情况),防止由于只读实例的规格较小导致了数据延迟。

最佳实践:只读实例节点的配置大于或者等于主节点的配置;

场景二:主库的TPS过高导致只读节点延迟

这一类的延迟也是非常常见的延迟,由于只读节点与主库的同步采用的是单线程同步,而主库的压力是并发多线程写入,这样势必会导致只读节点的数据延迟,可以通过观察只读节点的TPS与主节点的TPS性能数据来完成判断:

主库的TPS性能数据:

screenshot

只读节点的TPS性能数据:

screenshot

针对这样场景的延迟,开启只读节点的并行复制是解决这一问题的根本方法,目前RDS生产环境默认开启了并行复制。但是并行复制也不能够彻底解决单表更新的问题,所以用户需要排查业务写入压力是否正常,适当对业务进行优化或者拆分,保证主库的TPS不会导致slave出现延迟。

场景三:主库的DDL(alter、drop、repair、create)导致只读节点延迟

这种延迟是非常常见的延迟, 可以分为两类:

第一类:只读节点与主库的DDL同步是串行进行的,如果DDL操作在主库执行时间很长,那么同样在备库也会消耗同样的时间,比如在主库对一张500W的表添加一个字段耗费了10分钟,那么在只读节点上也同样会耗费10分钟,所以只读节点会延迟600S,其他常见操作比如:

create indexrepair tablealter table add column

范例:只读节点出现延迟

screenshot

主实例备库同样出现延迟:

screenshot

查看主库这这一段时间是否存在DDL,发现主库在添加索引:

screenshot

第二类:由于只读节点上会有用户的查询在上面运行,所以如果只读节点上有一个执行时间非常长的的查询正在执行,那么这个查询会堵塞来自主库的DDL,直到查询结束为止,进而导致了只读节点的数据延迟。在只读节点上可以通过执行show processlist命令查看连接的状态处于: Waiting for table metadata lock

screenshot

这个时候只需要kill掉只读节点上的大查询就可以恢复只读节点与主节点的数据同步。

场景四:主库执行大事务导致延迟

这一种延迟场景也是比较常见的,比如在主库执行一个大的update、delete、insert … select的事务操作,产生大量的binlog传送到只读节点,只读节点需要花费与主库相同的时间来完成该事务操作,进而导致了只读节点的延迟。只读实例发生延迟,在只读节点执行show slave status\G命令,可以通过两个关键的位点参数来判断只读实例上是否在执行大事务:Seconds_Behind_Master不断增加,但是Exec_Master_Log_Pos 却没有发生变化,这样则可以判断只读节点的SQL线程在执行一个大的事务或者DDL操作。

例如下面的例子,用户在主库执行了一条insert … select非常大的插入操作,该操作产生了近几十G的binlog文件传输到只读节点,进而导致了只读节点出现应用binlog延迟:

screenshot

screenshot

针对此类大事务延迟的场景,需要将大事务拆分成为小事务进行排量提交,这样只读节点就可以迅速的完成事务的执行,不会造成数据的延迟。

场景五:其他只读实例出现延迟的情况

如对无主键的表进行删除(可以参考MySQL主键的缺少导致备库hang),RDS目前已经支持对表添加隐式主键,但是对于以前历史创建的表需要进行重建才能支持隐式主键。

总结

综上所述,当只读实例出现延迟后的排查思路:

  1. 看只读节点IOPS定位是否存在资源瓶颈;
  2. 看只读节点的binlog增长量定位是否存在大事务;
  3. 看只读节点的comdml性能指标,对比主节点的commdml定位是否是主库写入压力过高导致;
  4. 看只读节点show full processlist,判断是否有Waiting for table metadata lock和alter,repair,create等ddl操作。

最佳实践

  1. 使用innodb存储引擎;
  2. 只读实例的规格不低于主实例;
  3. 大事务拆分为小事务;
  4. 购买多个只读节点冗余;
  5. DDL变更期间观察是否有大查询。

版权声明:本文内容由阿里云实名注册用户自发贡献,版权归原作者所有,阿里云开发者社区不拥有其著作权,亦不承担相应法律责任。具体规则请查看《阿里云开发者社区用户服务协议》和《阿里云开发者社区知识产权保护指引》。如果您发现本社区中有涉嫌抄袭的内容,填写侵权投诉表单进行举报,一经查实,本社区将立刻删除涉嫌侵权内容。

相关文章
新零售的路上,人人都是数据分析专家
-- 零售通自助分析平台实战分享 前言 零售通自助分析平台是服务于零售通业务线运营和产品同学,无需SQL无需配置快速分析数据,定制个性化报表的地方。 传统方式进行数据分析需要6步走,门槛高到拦下大部分到初学者:1. 申请数据项目空间;2. 查找对应数据底表并申请权限;3.D2中获取AccessID;4.DI中配置项目空间和AccessID;5.DI中用数据底表配置数据源;6. 开始数据分析
579 0
DRDS和RDS只读实例性能对比测试
我们都知道,对于数据库中基础信息表来说,它的数据变化频率低,数据量小,但由于基础数据本身的特点,大多数相关系统都会对频繁地读取它。即便我们通过对数据调取服务进行服务化包装,通过HSF服务的方式对外暴露,以减少多个系统直接操作数据库带来的问题,但数据本身的读取频率和并发度都非常高,QPS可以轻易达到10万以上。
261 0
MSSQL-最佳实践-实例级别数据库上云RDS SQL Server
--- title: MSSQL-最佳实践-实例级别数据库上云RDS SQL Server author: 风移 --- # 摘要 到目前,我们完成了SQL Server备份还原专题系列八篇月报分享:三种常见的数据库备份、备份策略的制定、查找备份链、数据库的三种恢复模式与备份之间的关系、利用文件组实现冷热数据隔离备份方案、如何监控备份还原进度、阿里云RDS SQL自动化迁移上云的一种
1460 0
MSSQL · 最佳实践 · 使用混合密钥实现列加密
摘要 在SQL Server安全系列专题的上两期月报分享中,我们分别分享了:如何使用对称密钥实现SQL Server列加密技术和使用非对称密钥加密方式实现SQL Server列加密。本期月报我们分享使用混合密钥加密方式实现SQL Server列加密技术,最大限度减少性能损失,最大程度保护用户数据安全。
1504 0
德歌:阿里云RDS PG最佳实践
5月27日云栖社区《云数据库RDS for PostgreSQL最佳实践》的直播分享顺利结束,来自阿里云的高级技术专家德歌与大家分享阿里云云数据库PostgreSQL的最佳技术实战,包括上云实战、数据迁移与同步、阿里云RDS相关周边组件用法、插件使用等内容。
14327 0
MSSQL - 最佳实践 - 使用SSL加密连接
--- title: MSSQL - 最佳实践 - 使用SSL加密连接 author: 风移 --- # 摘要 在SQL Server安全系列专题月报分享中,往期我们已经陆续分享了:[如何使用对称密钥实现SQL Server列加密技术](http://mysql.taobao.org/monthly/2018/08/03/)、[使用非对称密钥实现SQL Server列加密](http:/
2456 0
+关注
db匠
rds内核团队秘密研发的全自动卖萌机. 追加特效: 发数据库内核月报. 月报传送: http://mysql.taobao.org/monthly/
497
文章
0
问答
文章排行榜
最热
最新
相关电子书
更多
文娱运维技术
立即下载
《SaaS模式云原生数据仓库应用场景实践》
立即下载
《看见新力量:二》电子书
立即下载