MySQL数据库分布式事务XA实现原理分析

本文涉及的产品
云数据库 RDS MySQL,集群系列 2核4GB
推荐场景:
搭建个人博客
RDS MySQL Serverless 基础系列,0.5-2RCU 50GB
云数据库 RDS PostgreSQL,集群系列 2核4GB
简介:

MySQL XA分为两类,内部XA与外部XA;内部XA用于同一实例下跨多个引擎的事务,由大家熟悉的Binlog作为协调者;外部XA用于跨多MySQL实例的分布式事务,需要应用层介入作为协调者(崩溃时的悬挂事务,全局提交还是回滚,需要由应用层决定,对应用层的实现要求较高);

  本文,假设读者已经知道MySQL数据库外部分布式事务XA的使用,而将重点放在MySQL数据库,如何处理外部分布式事务XA的crash recover,以及面对不同的crash recover的情形,应用程序如何处理,才能够保证分布式事务的一致性。最后,本文简单分析一下目前MySQL数据库外部XA支持存在的问题,以及可选的解决方案。

  源代码分析基于MySQL 5.1.49,MySQL 5.5.16。

  MySQL处理流程

  1.MySQL 外部XA – 正常处理流程

  MySQL数据库外部XA的正常处理流程,这里不准备介绍,可以参考[1][2][3]。接下来我重点描述一下MySQL数据库外部分布式事务XA的崩溃恢复流程,毕竟此流程跟应用程序如何正确使用外部XA息息相关。

  2.MySQL外部XA – 崩溃恢复流程

  若一个运行外部XA分布式事务的MySQL数据库节点发生崩溃,那么其重启之后的崩溃恢复,涉及到外部XA处理的流程如下:

  Crash recover:

  // 1. 读取binlog文件,将文件中的xid存入commit_list hash表

  // 顾名思义,所谓的commit_list,就是说此list中对应prepare状态的xid

  // 在崩溃恢复过程中均可以被提交,而不在commit_list中的xid,均须回滚

  // binlog中的xid,都是属于内部xid,由MySQL产生,用于内部XA

  Log.cc::TC_LOG_BINLOG::recover
// 2. 遍历底层所有的事务引擎,收集处于XA_PREPARED状态的所有xid

  // 这些xid列表,既包括内部xid,也包括外部xid,存储引擎内部不做区分

  Handler.cc::ha_recover(commit_list)
// 执行各引擎层面提供的recover方法,收集所有的处于prepared状态的xid

  // 根据xid分类:

  // 3. 若xid属于内部xid,那么在commit_list中查找此xid,

  // 若存在,则提交此xid对应的事务;否则,回滚此事务

  // 4. 若xid属于外部xid,那么则将xid插入xid_cache hash表

  // xid_cache中的所有xid,将会通过xa recover命令返回,等待外部程序决策

  Handler.cc::xarecover_handlerton
// 5. 收集InnoDB存储引擎中,处于prepare状态的所有xid,并返回

  got = hton->recover (innobase_xa_recover)

  my_xid x = info->list[i].get_my_xid();

  if (!x)

  // 若当前为外部xid,那么将xid插入xid_cache hash表

  xid_cache_insert(&xid_cache, x);

  else

  if (x in commit_list)

  // 若当前为内部xid,同时此xid在binlog中存在,则提交

  hton->commit_by_xid();

  else

  // 若当前为内部xid,同时此xid在binlog中不存在,则回滚

  hton->rollback_by_xid();
通过以上的分析,可以总结出:

  MySQL数据库内部,会对xid做区分。内部xid有MySQL数据库自己产生(MySQL内部xid格式,将在本文下面给出),用于多引擎间事务的一致性;外部xid由应用程序给出,用于跨多MySQL实例的分布式事务。但是存储引擎层不做区分(区分在MySQL上层)。

  crash recover时,存储引擎负责将引擎内部,处于prepare状态的事务收集,并返回MySQL上层。

  Binlog作为内部XA的协调者[5],在binlog中出现的内部xid,在crash recover时,由binlog负责提交;在binlog中未出现的xid,由binlog负责回滚。(这是因为,binlog不进行prepare,只进行commit,因此在binlog中出现的内部xid,一定能够保证其在底层各存储引擎中已经完成prepare)。

  外部XA事务的xid,在crash recover过程中仅仅是插入xid_cache中,而不做其他处理。等到用户发起xa recover命令时,将xid_cache中处于prepare状态的xid返回。

  xa recover命令的流程处理如下。

  xa recover命令处理流程:

  sql_parse.cc::mysql_execute_command

  case SQLCOM_XA_RECOVER:

  mysql_xa_recover();

  // 遍历xid_cache,找出其中的状态处于XA_PREPARED的事务,发送客户端

  while (xs = hash_element(&xid_cache,))

  if (xs->xa_state == XA_PREPARED)

  protocol->write();
根据xa recover命令收集到的各MySQL数据库实例返回的xid列表,然后再对比应用程序端日志,决定这些xid,哪些全局commit,哪些rollback。

  由于测试中只有一个MySQL数据库实例,因此此时可以直接选择commit处于prepare状态的xid。

  注:

  MySQL内部xid格式: MYSQL_XID_PREFIX + server_id + my_xid

  MYSQL_XID_PREFIX: MySQLXid (源码写死) 8 bytes

  server_id: MySQL实例的id,ulong, 4 bytes

  my_xid: 内部自增序列,ulonglong, 8 bytes

  例如:”MySQLXid 0004”

  server_id = ‘ ’;my_xid = 4

  因此,使用时应该注意,不要在外部构造这种形式的xid,否则MySQL数据库就会将内部xid与外部xid混淆。

  一般情况下,构造一个内部xid比较困难,由于server_id一般小于4 bytes,不足的部分以ASCI NIL(null)补齐,而应用程序一般都不会构造此类的外部xid。
 








本文转自 wws5201985 51CTO博客,原文链接:http://blog.51cto.com/wws5201985/789451,如需转载请自行联系原作者
相关实践学习
如何在云端创建MySQL数据库
开始实验后,系统会自动创建一台自建MySQL的 源数据库 ECS 实例和一台 目标数据库 RDS。
全面了解阿里云能为你做什么
阿里云在全球各地部署高效节能的绿色数据中心,利用清洁计算为万物互联的新世界提供源源不断的能源动力,目前开服的区域包括中国(华北、华东、华南、香港)、新加坡、美国(美东、美西)、欧洲、中东、澳大利亚、日本。目前阿里云的产品涵盖弹性计算、数据库、存储与CDN、分析与搜索、云通信、网络、管理与监控、应用服务、互联网中间件、移动服务、视频服务等。通过本课程,来了解阿里云能够为你的业务带来哪些帮助     相关的阿里云产品:云服务器ECS 云服务器 ECS(Elastic Compute Service)是一种弹性可伸缩的计算服务,助您降低 IT 成本,提升运维效率,使您更专注于核心业务创新。产品详情: https://www.aliyun.com/product/ecs
目录
相关文章
|
2月前
|
关系型数据库 MySQL 分布式数据库
PolarDB 与传统数据库的性能对比分析
【8月更文第27天】随着云计算技术的发展,越来越多的企业开始将数据管理和存储迁移到云端。阿里云的 PolarDB 作为一款兼容 MySQL 和 PostgreSQL 的关系型数据库服务,提供了高性能、高可用和弹性伸缩的能力。本文将从不同角度对比 PolarDB 与本地部署的传统数据库(如 MySQL、PostgreSQL)在性能上的差异。
87 1
|
7天前
|
Oracle NoSQL 关系型数据库
主流数据库对比:MySQL、PostgreSQL、Oracle和Redis的优缺点分析
主流数据库对比:MySQL、PostgreSQL、Oracle和Redis的优缺点分析
18 2
|
22天前
|
存储 关系型数据库 MySQL
分析MySQL主从复制中AUTO_INCREMENT值不一致的问题
通过对 `AUTO_INCREMENT`不一致问题的深入分析和合理应对措施的实施,可以有效地维护MySQL主从复制环境中数据的一致性和完整性,确保数据库系统的稳定性和可靠性。
54 6
|
23天前
|
存储 关系型数据库 MySQL
分析MySQL主从复制中AUTO_INCREMENT值不一致的问题
通过对 `AUTO_INCREMENT`不一致问题的深入分析和合理应对措施的实施,可以有效地维护MySQL主从复制环境中数据的一致性和完整性,确保数据库系统的稳定性和可靠性。
43 1
|
13天前
|
网络协议 安全 Java
分布式(基础)-RMI的原理
分布式(基础)-RMI的原理
|
1月前
|
SQL Java OLAP
Hologres 入门:实时分析数据库的新选择
【9月更文第1天】在大数据和实时计算领域,数据仓库和分析型数据库的需求日益增长。随着业务对数据实时性要求的提高,传统的批处理架构已经难以满足现代应用的需求。阿里云推出的 Hologres 就是为了解决这个问题而生的一款实时分析数据库。本文将带你深入了解 Hologres 的基本概念、优势,并通过示例代码展示如何使用 Hologres 进行数据处理。
127 2
|
2月前
|
SQL 监控 关系型数据库
使用 pt-query-digest 工具分析 MySQL 慢日志
【8月更文挑战第5天】使用 pt-query-digest 工具分析 MySQL 慢日志
40 3
使用 pt-query-digest 工具分析 MySQL 慢日志
|
2月前
|
存储 JSON 关系型数据库
MySQL与JSON的邂逅:开启大数据分析新纪元
MySQL与JSON的邂逅:开启大数据分析新纪元
|
2月前
|
运维 安全 Cloud Native
核心系统转型问题之分布式数据库和数据访问中间件协作如何解决
核心系统转型问题之分布式数据库和数据访问中间件协作如何解决
|
2月前
|
缓存 关系型数据库 MySQL
在Linux中,如何优化MySQL性能,包括索引优化和查询分析?
在Linux中,如何优化MySQL性能,包括索引优化和查询分析?
下一篇
无影云桌面