MySQL Online DDL 方案剖析

本文涉及的产品
RDS MySQL Serverless 基础系列,0.5-2RCU 50GB
云数据库 RDS MySQL,集群系列 2核4GB
推荐场景:
搭建个人博客
RDS MySQL Serverless 高可用系列,价值2615元额度,1个月
简介:

一、常见的几种方案

  • 1.1 MySQL源生的IN-PLACE ONLINE DDL

5.5,5.6 开始支持
5.7 支持的更好,有更多ddl操作支持online
8.0 支持快速加列功能
  • 1.2 第三方工具
1. pt-online-schema-change
2. gh-ost
  • 1.3 slave 先ddl,后切换主从

二、方案剖析

2.1 MySQL源生的IN-PLACE ONLINE DDL

  • 原理
原理比较复杂,不一一解读。但是中间有几个重要的过程:
1. 加一会排它锁,开启战场,并释放排它锁
2. 记录ddl期间产生的增量dml(大小由innodb_online_alter_log_max_size控制)
3. 应用这些增量dml
4. 再加一会排它锁,清理战场,释放排它锁

这里关心的问题:
1. 如果再ddl期间,innodb_online_alter_log_max_size的大小被占满,会有怎样的后果?
2. 如果DDL期间,被强行终止了,会有怎么样的后果?
  • 优点
1. 官方出品,原生态,品质有保障
  • 缺点
1. 有所等待风险
2. innodb_online_alter_log_max_size 是有限制的
3. 有可能造成主从延迟
4. 不是所有的ddl都是online的,对ddl类型有要求
  • 哪些DDL可以online (基于5.7的官方文档)

8.0 可以支持快速加列

类型 操作 是否需要copy数据,重新rebuild表 是否允许并发DML 是否只修改元数据 备注
索引相关 创建、添加二级索引 NO YES NO -
索引相关 删除索引 NO YES YES -
索引相关 重命名索引 NO YES YES -
索引相关 添加FULLTEXT索引 NO* NO NO -
索引相关 添加SPATIAL索引 NO NO NO -
索引相关 改变索引类型(USING {BTREE or HASH}) NO YES YES -
主键相关 添加主键 YES* YES NO -
主键相关 删除主键 YES NO NO -
主键相关 删除主键并且又添加主键 YES YES NO -
列操作相关 添加列 YES YES* NO -
列操作相关 删除列 YES YES NO -
列操作相关 重命名列 NO YES* YES -
列操作相关 重新排列列(use FIRST or AFTER) YES YES NO -
列操作相关 设置列的默认值 NO YES YES -
列操作相关 修改列的数据类型 YES NO NO -
列操作相关 扩展varchar列的长度 NO YES YES 0~255 , 256 ~ 256+ 这两个区间可以in-place
列操作相关 删除列的默认值 NO YES YES -
列操作相关 修改auto-increcement的值 NO YES NO* -
列操作相关 使某列修改成NULL YES* YES NO -
列操作相关 使某列修改成NOT NULL YES* YES NO -
列操作相关 修改列定义为ENUM、SET NO YES YES -
表相关操作 optimizing table YES YES NO -
表相关操作 Rebuilding with the FORCE option YES YES NO -
表相关操作 Renaming a table NO YES YES -

三、第三方工具

3.0 第三方工具大致原理

  1. 先创建一个临时表 old_table_tmp
  2. 给临时表变更结构 alter old_table_tmp ...
  3. 然后呢就是关键了: 将增量数据 和 原表的数据 都拷贝到 临时表
  4. 当原表数据拷贝完毕后,对原表加锁,进行切换
  5. 打扫战场,结束

好了,这里pt-online-shema-change 是通过触发器的方式,来同步增量数据的 , gh-ost 是通过模拟slave,监听binlog并应用binlog来完成增量数据同步的,这里是主要区别。

所以,不管哪种方式,这里需要解决一个时序的问题(因为rowcopy和row_apply是并行的,不知道哪个先哪个后),我们暂且认为 拷贝原表数据叫: rowcopy , 拷贝增量数据并应用为 row_apply

由于rowcopy从时序上来说,都是老数据,所以它的优先级是最低的,所以将rowcopy的动作转换为inset ignore,意味着,row apply是可以覆盖rowcopy数据的,这样理解没问题吧

好了,上面的问题解决了,其他的基本就不是问题了

3.1 pt-online-shema-change

  • 优点
1. percona 出品,必属金品

2. 经过多年的生产环境验证,质量可靠

3. 支持并发DML操作
  • 缺点
1. 原表不能有触发器
3. 由于触发器的原因,对master的性能消耗比较大
4. 处理外键有一定的风险,需要特殊处理
5. 原表中至少要有主键或者唯一键
    检查是否具有主键或者唯一索引,如果都没有,这一步会报错
    提示The new table `xx`.`_xx_new` does not have a PRIMARY KEY or a unique index which is required for the DELETE trigger.

6. ddl不能有添加唯一索引的操作
    如果对表增加唯一索引的话,会存在丢数据的风险。
    具体原因是因为pt-osc在copy已有的数据时会使用insert ignore将老表中的数据插入到新表中,因为新表已经增加了unique index,所以重复的数据会被ignore掉
    --check-unique-key-change 可以避免  , 默认yes
  • 原理
1. 创建一张新表
2. alter新表
3. 原表创建insert,update,delete三种触发器
4. 原表开始拷贝数据到新表,且触发器也开始映射到新表
5. 处理外键(如果没有忽略)
6. 重命名新表和原表
7. 清理战场


重要:

insert触发器 =SQL转换=> replace into

update触发器
    =SQL转换=> delete ignore + replace into (大于3.0.2版本)
    =SQL转换=> replace into(低于3.0.2版本,所以这个版本会有问题,如果这时候对老的主键修改,那么修改之前的值不会去掉,从而多了一些异常数据)
delete触发器 =SQL转换=> delete ignore

copy rows    =SQL转换=> insert ignore into


  • 最佳实践
1. innodb_autoinc_lock_mode 设置成 2 , 否则会经常死锁,autoinc锁
2. 如果中途ddl失败,需要先删除触发器,再删除新的临时表

3.2 gh-ost

  • 优点
1. 无触发器设计
2. out-over方案设计
3. 对主机性能级别无影响
4. 可以暂停

  • 缺点
1. 原表不能有外键
2. 原表不能有触发器
3. 强制要求binlog为row格式
4. 原表不能有字母大小不同的同名表
5. 当并发写入多的时候,在应用binlog阶段由于是单线程,所以会非常慢,影响ddl性能和进度
  • 原理
原理基本都一样,这里主要的区别就是row apply这里,pt-osc是触发器,这里是监听master binlog并应用日志,其余的差别不大,这里不再赘述

四、 slave 先ddl,后切换主从

如果其余方式都不行,只能祭出大招slave先ddl,然后主从切换了

  • 优点
1. slave操作,不影响master
  • 缺点
1. 需要主从切换,主从切换越平滑,此方案就越好
2. 有几点需要考虑和处理下:
    2.1 add column after|before , 这样的操作slave先做是否有影响
    2.2 slave先新增字段,可能会导致主从同步停掉,需要设置某些参数

五、 ONLINE DDL 最佳方案选型

    1. 如果是创建索引、修改默认值这样的,online ddl 快速且无影响的操作,尽量优先选择online ddl
    1. 如果当前服务器写入量不高,负载不高,且原表没有触发器,没有外键,且此表有主键,尽量优先选择pt-online-schema-change
    1. 其余情况,选择主从切换
相关实践学习
如何快速连接云数据库RDS MySQL
本场景介绍如何通过阿里云数据管理服务DMS快速连接云数据库RDS MySQL,然后进行数据表的CRUD操作。
全面了解阿里云能为你做什么
阿里云在全球各地部署高效节能的绿色数据中心,利用清洁计算为万物互联的新世界提供源源不断的能源动力,目前开服的区域包括中国(华北、华东、华南、香港)、新加坡、美国(美东、美西)、欧洲、中东、澳大利亚、日本。目前阿里云的产品涵盖弹性计算、数据库、存储与CDN、分析与搜索、云通信、网络、管理与监控、应用服务、互联网中间件、移动服务、视频服务等。通过本课程,来了解阿里云能够为你的业务带来哪些帮助     相关的阿里云产品:云服务器ECS 云服务器 ECS(Elastic Compute Service)是一种弹性可伸缩的计算服务,助您降低 IT 成本,提升运维效率,使您更专注于核心业务创新。产品详情: https://www.aliyun.com/product/ecs
目录
相关文章
|
3月前
|
存储 SQL 关系型数据库
Mysql高可用架构方案
本文阐述了Mysql高可用架构方案,介绍了 主从模式,MHA模式,MMM模式,MGR模式 方案的实现方式,没有哪个方案是完美的,开发人员在选择何种方案应用到项目中也没有标准答案,合适的才是最好的。
285 3
Mysql高可用架构方案
|
10天前
|
监控 关系型数据库 MySQL
Aurora MySQL负载突增应对策略与优化方案
通过以上策略,企业可以有效应对 Aurora MySQL 的负载突增,确保数据库在高负载情况下依然保持高性能和稳定性。这些优化方案涵盖了从架构设计到具体配置和监控的各个方面,能够全面提升数据库的响应速度和处理能力。在实际应用中,应根据具体的业务需求和负载特征,灵活调整和应用这些优化策略。
42 22
|
11天前
|
Java 关系型数据库 MySQL
MySQL 分库分表方案
本文总结了数据库分库分表的相关概念和实践,针对单张表数据量过大及增长迅速的问题,介绍了垂直和水平切分的方式及其适用场景。文章分析了分库分表后可能面临的事务支持、多库结果集合并、跨库join等问题,并列举了几种常见的开源分库分表中间件。最后强调了不建议水平分库分表的原因,帮助读者在规划时规避潜在问题。
54 19
|
15天前
|
SQL 监控 关系型数据库
MySQL如何优雅的执行DDL
在MySQL中优雅地执行DDL操作需要综合考虑性能、锁定和数据一致性等因素。通过使用在线DDL工具、分批次执行、备份和监控等最佳实践,可以在保障系统稳定性的同时,顺利完成DDL操作。本文提供的实践和案例分析为安全高效地执行DDL操作提供了详细指导。
28 14
|
2月前
|
存储 缓存 关系型数据库
【MySQL进阶篇】存储引擎(MySQL体系结构、InnoDB、MyISAM、Memory区别及特点、存储引擎的选择方案)
MySQL的存储引擎是其核心组件之一,负责数据的存储、索引和检索。不同的存储引擎具有不同的功能和特性,可以根据业务需求 选择合适的引擎。本文详细介绍了MySQL体系结构、InnoDB、MyISAM、Memory区别及特点、存储引擎的选择方案。
【MySQL进阶篇】存储引擎(MySQL体系结构、InnoDB、MyISAM、Memory区别及特点、存储引擎的选择方案)
|
2月前
|
SQL 关系型数据库 MySQL
数据库数据恢复—Mysql数据库表记录丢失的数据恢复方案
Mysql数据库故障: Mysql数据库表记录丢失。 Mysql数据库故障表现: 1、Mysql数据库表中无任何数据或只有部分数据。 2、客户端无法查询到完整的信息。
|
3月前
|
关系型数据库 MySQL
mysql 5.7.x版本查看某张表、库的大小 思路方案说明
mysql 5.7.x版本查看某张表、库的大小 思路方案说明
104 5
|
3月前
|
SQL 关系型数据库 MySQL
|
3月前
|
关系型数据库 MySQL
mysql 5.7.x版本查看某张表、库的大小 思路方案说明
mysql 5.7.x版本查看某张表、库的大小 思路方案说明
70 1
|
5月前
|
存储 SQL 关系型数据库
【MySQL调优】如何进行MySQL调优?从参数、数据建模、索引、SQL语句等方向,三万字详细解读MySQL的性能优化方案(2024版)
MySQL调优主要分为三个步骤:监控报警、排查慢SQL、MySQL调优。 排查慢SQL:开启慢查询日志 、找出最慢的几条SQL、分析查询计划 。 MySQL调优: 基础优化:缓存优化、硬件优化、参数优化、定期清理垃圾、使用合适的存储引擎、读写分离、分库分表; 表设计优化:数据类型优化、冷热数据分表等。 索引优化:考虑索引失效的11个场景、遵循索引设计原则、连接查询优化、排序优化、深分页查询优化、覆盖索引、索引下推、用普通索引等。 SQL优化。
795 15
【MySQL调优】如何进行MySQL调优?从参数、数据建模、索引、SQL语句等方向,三万字详细解读MySQL的性能优化方案(2024版)