MySQL MGR看着很美,却又为什么不敢用?

本文涉及的产品
RDS MySQL Serverless 基础系列,0.5-2RCU 50GB
RDS MySQL Serverless 高可用系列,价值2615元额度,1个月
云数据库 RDS PostgreSQL,高可用系列 2核4GB
简介: MySQL MGR看着很美,却又为什么不敢用?

0. 前言

1. 什么是MySQL MGR

当我在群里说起MySQL MGR时,的确还有人不知道这是啥东东。有群友打趣,说这是:

  • 美国人
  • 卖狗肉
  • 蒙古人

我只能说,你们真的都是天才。

image.png

言归正传。

MySQL MGR是MySQL组复制(Group Replication)的简称。

MGR是一种基于shared-nothing的,更方便实现数据一致性高可用集群方案,此外它还支持故障自动检测多节点并行写等特性。它由一组MySQL实例构成,每个实例都有一份完整的数据,实例间通过组通讯消息系统(GCS)交互通信协同。GCS可保证消息的原子性和消息在所有组成员的整体顺序一致

MGR是MySQL自带的一个插件(plugin),可以灵活部署。

它要求组内每个MySQL实例都要基于ROW格式的binlog,并开启GTID。

MGR架构图如下所示,主要是APIs层、组件层、复制协议模块层和GCS API+Paxos引擎层构成。

屏幕快照 2021-11-19 下午3.03.16.png

屏幕快照 2021-11-19 下午3.04.06.png

事务从Server层经过MGR的APIs接口层分发到组件层,组件层去capture事务相关信息,然后经过复制协议层进行事务传输,最后经过GCS API+Paxos引擎层保证事务在各个节点数据最终一致性。

MGR具备以下技术特点:

  1. MGR是基于Paxos协议和原生复制的分布式集群,多数节点同意即可以通过事务提议(Proposed),实现数据一致性。
  2. 具备高可用、自动故障检测功能,可自动切换。
  3. 可弹性扩展,集群自动的新增和移除节点,集群最多接入9个节点。
  4. 有单主和多主模式。支持多节点写入,具备冲突检测机制,可以适应多种应用场景需求。

MySQL MGR是在2015年就已经首次出现在MySQL 5.7版本中,至今已有多年,仍在不断成熟完善中。

一个反直觉的事实是,其实国内已有数个大中型银行上线MySQL MGR,当然了,现阶段还不是应用在非常核心的系统上。此外,亦有不少其他传统企业也在尝试使用MGR,更别说是互联网企业了,更是走在尝鲜的的前列。

哦,对了,Oracle公有云上的MySQL高可用版本据称也是用MGR架构的。

2. 为什么不敢上MGR

虽然知道MGR有这么多好处,而且也有大胆的同行在使用了,但还有不少人表示不放心,不太敢正式上线。

大家到底在担心什么呢?

从平时和大家交流的反馈来看,大家主要关切的有以下几点:

第一,需求不强烈

对于已经用惯了MySQL传统异步复制,以及后来的半同步复制、增强半同步复制,再配合其他第三方的高可用工具套件,已经可以满足绝大多数场景下的需求,所以大家并不急着用上MGR,还想继续观望。

第二,对新事物的恐惧

虽说MGR也发布数年了,但相对于上述提到的传统复制功能,其架构的复杂性,以及现存BUG的数量,都说明了MGR还是不够成熟,起码还没到足以让大家安心上线的阶段。

此外,由于MGR的架构复杂性,也使得大家在使用过程中遇到问题时,如果想要向官方报告,却苦于难以复现问题场景等客观因素,也打击了用户的信心。

我们从MySQL官方bug库搜到关于MGR的bug数量居然只有区区226个,很难说是不是因为复现太难导致无法报告。另外,这其中只有26个是active状态,个人认为这个数据是不太可信的。

我也查找了InnoDB和传统复制的bug数作为参照(active/all):

  • InnoDB:475/2925
  • Replication:360/2584

第三,生态不成熟

上面我们说到,之所以大家还在坚守传统复制,是因为已有大量第三方工具打配合,就可以满足大部分业务需求了。

而可以和MGR配合的第三方工具生态还不够完善,除了MySQL官方的InnoDB Cluster套件(MySQL Router + MySQL Shell + MGR)之外,几乎没有随手拿来就能用于构建整套高可用架构的解决方案。想要线上更大规模使用MGR,还需要有足够的生态建设才行。

第四,MGR还不够可靠

从各方面多个渠道反馈的情况来看,大家在测试及使用MGR的过程中,或多或少都出现异常宕机、事务挂起、节点异常退出、性能抖动等大大小小的问题。MGR现阶段给大家的感觉,还是不那么可靠、令人放心。

不过我们参考并行复制的进程,也是一开始从database级别并行,再到事务级别并行,现在又支持WRITESET并行,都有个先从0到1,再从1到99的过程,这些都是必经之路,MGR还有一段路需要走。

写在后面

任何新事物被大众所接受都要有个过程,大多数人也会习惯性批判新事物,因为能看懂的毕竟还是少数。

是时候再温习下MySQL官方的产品计划路线图了,以此加强对MGR的信心:


此外,最近业界发布的GreatSQL也给了我们更多上线(起码进一步试用)MGR的信心。GreatSQL是源于Percona server的分支版本,除了Percona server已有的稳定可靠、高效、管理更方便等优势外,特别是进一步提升了MGR(MySQL Group Replication)的性能及可靠性,以及众多bug修复。

还有,我也想趁这个机会了解大家在使用MGR过程中遇到哪些问题、痛点,或者希望MGR在哪些方面做出改善。

相关实践学习
每个IT人都想学的“Web应用上云经典架构”实战
本实验从Web应用上云这个最基本的、最普遍的需求出发,帮助IT从业者们通过“阿里云Web应用上云解决方案”,了解一个企业级Web应用上云的常见架构,了解如何构建一个高可用、可扩展的企业级应用架构。
MySQL数据库入门学习
本课程通过最流行的开源数据库MySQL带你了解数据库的世界。   相关的阿里云产品:云数据库RDS MySQL 版 阿里云关系型数据库RDS(Relational Database Service)是一种稳定可靠、可弹性伸缩的在线数据库服务,提供容灾、备份、恢复、迁移等方面的全套解决方案,彻底解决数据库运维的烦恼。 了解产品详情: https://www.aliyun.com/product/rds/mysql 
相关文章
|
存储 供应链 Oracle
探究ERP系统的云端部署与SaaS模式
探究ERP系统的云端部署与SaaS模式
1266 0
|
Kubernetes 应用服务中间件 Docker
Kubernetes学习-集群搭建篇(二) 部署Node服务,启动JNI网络插件
Kubernetes学习-集群搭建篇(二) 部署Node服务,启动JNI网络插件
|
存储 搜索推荐 数据库
如何选择合适的矢量数据库:选型指南与案例分析
【4月更文挑战第30天】面对众多矢量数据库,如何选择合适的?本文提供了一份选型指南和案例分析。首先,明确业务需求,如推荐系统、图像检索等场景的不同需求;其次,评估数据量,大型项目需选择支持分布式架构的数据库;再者,关注查询性能、技术成熟度和成本。案例中,电商企业选用Faiss实现高效推荐,而互联网公司则因大规模图像检索选择了Milvus,后者以其扩展性和准确性脱颖而出。选择矢量数据库需综合考虑,结合实际以找到最佳匹配。
|
安全 网络安全
网络渗透技术
网络渗透技术
1024 2
|
缓存 前端开发 JavaScript
解决白屏问题:让你的网站重焕生机
解决白屏问题:让你的网站重焕生机
|
存储
fastdfs源码阅读:上传和下载(文件客户端逻辑)
fastdfs源码阅读:上传和下载(文件客户端逻辑)
486 0
|
存储 SQL NoSQL
别再分库分表了,试试TiDB! 下
别再分库分表了,试试TiDB! 下
|
Python
python flask 定义302状态和重定向
python flask 定义302状态和重定向
352 0
|
数据库
什么时候需要使用事务
什么时候需要使用事务
895 0
|
数据可视化 API Python
Seaborn数据可视化(一)
本文其实属于:Python的进阶之道【AIoT阶段一】的一部分内容,本篇把这部分内容单独截取出来,方便大家的观看,本文介绍Seaborn数据可视化,读本文之前,如果没有 Matplotlib基础建议先看博客:Matplotlib数据可视化入门,Matplotlib数据可视化高级,Matplotlib数据可视化进阶(进阶中有Seaborn讲解,这里单独截出来)。
211 0
Seaborn数据可视化(一)