MySQL · 捉虫动态 · 并行复制外键约束问题二

本文涉及的产品
RDS PostgreSQL Serverless,0.5-4RCU 50GB 3个月
推荐场景:
对影评进行热评分析
云原生数据库 PolarDB 分布式版,标准版 2核8GB
云数据库 RDS SQL Server,基础系列 2核4GB
简介: 背景 并行复制可以大大提高备库的 binlog 应用速度,内核月报也多次对并行复制特性进行介绍,感兴趣的朋友可以回顾下:5.6 并行复制实现分析、5.6 并行复制恢复实现 和 5.6并行复制事件分发机制。 在早期的内核月报,有一篇 并行复制外建约束问题,介绍阿里在 5.5 版本中自己实现并行复制

背景

并行复制可以大大提高备库的 binlog 应用速度,内核月报也多次对并行复制特性进行介绍,感兴趣的朋友可以回顾下:5.6 并行复制实现分析5.6 并行复制恢复实现 和 5.6并行复制事件分发机制

在早期的内核月报,有一篇 并行复制外建约束问题,介绍阿里在 5.5 版本中自己实现并行复制时遇到的外键约束问题,本文接着前作继续介绍并行复制外键约束问题,这次场景不一样,并且目前官方 5.6 最新版本(5.6.30)中也有这个问题。

问题描述

一般情况的复制是 A->B 这样一主一备,本文要描述的场景是 A->B->C 这样一主两备,并且备库级联,其中备库 C 开启了并行复制,B 可以串行也可以并行,binlog_fomat 都是 row。

在主库A上执行如下语句:

CREATE DATABASE db1;
CREATE DATABASE db2;
USE db1;
CREATE TABLE `parent` (
`id` int(11) NOT NULL,
PRIMARY KEY (`id`)
) ENGINE=InnoDB;

USE db2;
CREATE TABLE `child` (
`id` int(11) DEFAULT NULL,
`parent_id` int(11) DEFAULT NULL,
KEY `par_ind` (`parent_id`),
CONSTRAINT `child_ibfk_1` FOREIGN KEY (`parent_id`) REFERENCES `db1`.`parent` (`id`) ON DELETE CASCADE
) ENGINE=InnoDB;

INSERT INTO db1.parent VALUES(1);
INSERT INTO db2.child VALUES(1, 1);

备库 C 上会报错如下,非常明显的一个外键约束的错误:

Last_SQL_Errno: 1452
Last_SQL_Error: Worker 7 failed executing transaction '' at master log mysqld-bin.000001, end_log_pos 1008; Could not execute Write_rows event on table db2.child; Cannot add or update a child row: a foreign key constraint fails (`db2`.`child`, CONSTRAINT `child_ibfk_1` FOREIGN KEY (`parent_id`) REFERENCES `db1`.`parent` (`id`) ON DELETE CASCADE), Error_code: 1452; handler error HA_ERR_NO_REFERENCED_ROW; the event's master log mysqld-bin.000001, end_log_pos 1008

问题分析

如前文并行复制外建约束问题 所述,5.6 并行复制已经解了外键问题,遇到被外键约束的表,会先切为串行,当前事务执行完成后,再开始并行,为什么还会出问题呢?分析这个问题前,我们先来看下,5.6 是怎么解决外键约束问题的。

5.6 并行复制是基于db进行分发的,不同的db分发到不同的 worker 线程,对 row 格式的 binlog,分发信息是体现在 table_map event 中的。5.6 对 table_map 中加了一个专门的 flag TM_REFERRED_FK_DB_F,表示当前表被外键约束(具体参考commit 299ccba1e145c29ed3c242c152ced4cc345328b7),这样备库分发线程(Coordinator)在遇到有这种标志的 table_map,就切换为串行,具体逻辑参考Log_event::get_slave_worker() 和apply_event_and_update_pos()

这个机制是没问题的,如果 flag 能从 A 传到 B 再传到 C,就不会出现这个问题,现在问题的出现是因为备库 B 执行完父表(parent)的更新后,写 binlog 时 flag 没写进去,导致 C 在并行模式下执行 parent 表更新时,没有切换到串行模式,和 child 表的更新同时在跑,如果执行 child 表更新的 worker 先做,那么就会出现外键约束报错。

问题解决

TM_REFERRED_FK_DB_F 这个 flag 是在 Table_map_log_event::Table_map_log_event() 构造函数中设置的,逻辑如下:

/*
Marking event to require sequential execution in MTS
if the query might have updated FK-referenced db.
Unlike Query_log_event where this fact is encoded through
the accessed db list in the Table_map case m_flags is exploited.
*/
uchar dbs= thd->get_binlog_accessed_db_names() ?
thd->get_binlog_accessed_db_names()->elements : 0;
if (dbs == 1)
{
  char *db_name= thd->get_binlog_accessed_db_names()->head();
  if (!strcmp(db_name, ""))
  m_flags |= TM_REFERRED_FK_DB_F;
}

如果当前访问到的 db 个数为1,并且 db 是空字符串 "" 的话,就设置这个 flag。binlog_accessed_db_names 中只有 "" 这一个元素是一个特殊构造的场景,正常情况下db不会是 ""的,构造这样 db 的逻辑在 THD::decide_logging_format,如下:

if (is_write &&
    lex->sql_command != SQLCOM_END /* rows-event applying by slave */)
{
  /*
    Master side of DML in the STMT format events parallelization.
    All involving table db:s are stored in a abc-ordered name list.
    In case the number of databases exceeds MAX_DBS_IN_EVENT_MTS maximum
    the list gathering breaks since it won't be sent to the slave.
  */
  for (TABLE_LIST *table= tables; table; table= table->next_global)
  {
    if (table->placeholder())
      continue;

    DBUG_ASSERT(table->table);

    if (table->table->file->referenced_by_foreign_key())
    {
      /*
         FK-referenced dbs can't be gathered currently. The following
         event will be marked for sequential execution on slave.
      */
      binlog_accessed_db_names= NULL;
      add_to_binlog_accessed_dbs("");
      break;
    }
    if (!is_current_stmt_binlog_format_row())
      add_to_binlog_accessed_dbs(table->db);
  }
}

可以看到,如果有当前表被外键约束的话(table->table->file->referenced_by_foreign_key()),会清掉binlog_accessed_db_names,只放一个空字符串进去。

但是 SQL 线程在应用 row_event 时,不会走到上面的逻辑,因为 lex->sql_command 的值为 SQLCOM_END,所以备库 B 生成的 parent 表的 table_map 就不包含这个 flag。

修复也比较简单,把 lex->sql_command != SQLCOM_END 这个条件去掉即可,或者参考官方 bug 这里提供的修复方法,也是可以的。

相关实践学习
如何在云端创建MySQL数据库
开始实验后,系统会自动创建一台自建MySQL的 源数据库 ECS 实例和一台 目标数据库 RDS。
全面了解阿里云能为你做什么
阿里云在全球各地部署高效节能的绿色数据中心,利用清洁计算为万物互联的新世界提供源源不断的能源动力,目前开服的区域包括中国(华北、华东、华南、香港)、新加坡、美国(美东、美西)、欧洲、中东、澳大利亚、日本。目前阿里云的产品涵盖弹性计算、数据库、存储与CDN、分析与搜索、云通信、网络、管理与监控、应用服务、互联网中间件、移动服务、视频服务等。通过本课程,来了解阿里云能够为你的业务带来哪些帮助     相关的阿里云产品:云服务器ECS 云服务器 ECS(Elastic Compute Service)是一种弹性可伸缩的计算服务,助您降低 IT 成本,提升运维效率,使您更专注于核心业务创新。产品详情: https://www.aliyun.com/product/ecs
目录
相关文章
|
1天前
|
NoSQL 关系型数据库 MySQL
2024Mysql And Redis基础与进阶操作系列(4-2)作者——LJS[含MySQL非空、唯一性、PRIMARY KEY、自增列/自增约束举例说明等详解步骤及常见报错问题对应的解决方法]
24MySQL非空、唯一性、PRIMARY KEY、自增列/自增约束举例说明等详解步骤及常见报错问题对应的解决方法(4-2) 学不会你来砍我!!!
|
26天前
|
Ubuntu 关系型数据库 MySQL
ubuntu使用aliyun源+mysql删除有外键约束的数据+查看特定目录的大小
ubuntu使用aliyun源+mysql删除有外键约束的数据+查看特定目录的大小
32 4
|
2月前
|
SQL 关系型数据库 MySQL
MySQL中外键的使用及外键约束策略
这篇文章讨论了MySQL中使用外键的重要性,包括外键的概念、不使用外键可能导致的问题、如何设置外键约束以及不同的外键约束策略(如CASCADE和SET NULL),并通过示例演示了这些概念。
MySQL中外键的使用及外键约束策略
|
2月前
|
关系型数据库 MySQL 测试技术
MySQL外键使用的考量与建议
综上所述,虽然MySQL的外键提供了一种强大的工具来维护数据之间的一致性和完整性,但在决定是否使用外键时,需要权衡其带来的好处和潜在的性能影响。通过仔细的规划和测试,可以最大化地利用外键的优势,同时避免一些常见的陷阱。
34 3
|
2月前
|
关系型数据库 MySQL 测试技术
MySQL外键使用的考量与建议
综上所述,虽然MySQL的外键提供了一种强大的工具来维护数据之间的一致性和完整性,但在决定是否使用外键时,需要权衡其带来的好处和潜在的性能影响。通过仔细的规划和测试,可以最大化地利用外键的优势,同时避免一些常见的陷阱。
97 1
|
2月前
|
存储 关系型数据库 MySQL
MySQL数据库基础:约束
约束是对数据库表中字段施加的规则,确保数据的正确性、有效性和完整性。主要分为非空约束、唯一约束、默认约束、主键约束和外键约束。非空约束禁止字段值为null;唯一约束确保字段值唯一,允许null值重复;默认约束设定默认值;主键约束结合非空与唯一约束,并可设为自增型;外键约束则通过关联其他表的主键,保证数据一致性。检查约束确保字段值满足特定条件。
42 1
|
3月前
|
数据采集 关系型数据库 MySQL
在 MySQL 中使用约束
【8月更文挑战第11天】
53 0
在 MySQL 中使用约束
|
4月前
|
SQL 关系型数据库 MySQL
实时计算 Flink版产品使用问题之如何进行MySQL到MySQL的动态同步
实时计算Flink版作为一种强大的流处理和批处理统一的计算框架,广泛应用于各种需要实时数据处理和分析的场景。实时计算Flink版通常结合SQL接口、DataStream API、以及与上下游数据源和存储系统的丰富连接器,提供了一套全面的解决方案,以应对各种实时计算需求。其低延迟、高吞吐、容错性强的特点,使其成为众多企业和组织实时数据处理首选的技术平台。以下是实时计算Flink版的一些典型使用合集。
|
5月前
|
SQL 关系型数据库 MySQL
MySQL外键约束行为解析:CASCADE, NO ACTION, RESTRICT, SET NULL
MySQL外键约束行为解析:CASCADE, NO ACTION, RESTRICT, SET NULL
216 0
|
16天前
|
存储 关系型数据库 MySQL
Mysql(4)—数据库索引
数据库索引是用于提高数据检索效率的数据结构,类似于书籍中的索引。它允许用户快速找到数据,而无需扫描整个表。MySQL中的索引可以显著提升查询速度,使数据库操作更加高效。索引的发展经历了从无索引、简单索引到B-树、哈希索引、位图索引、全文索引等多个阶段。
50 3
Mysql(4)—数据库索引

相关产品

  • 云数据库 RDS MySQL 版