【阿里数据库面试题解】MySQL高可用原理(下)

本文涉及的产品
RDS MySQL Serverless 基础系列,0.5-2RCU 50GB
云数据库 RDS MySQL,集群系列 2核4GB
推荐场景:
搭建个人博客
云数据库 RDS MySQL,高可用系列 2核4GB
简介: 在一个主备关系中,每个备库接收主库的binlog并执行。 正常情况下,只要主库执行更新生成的所有binlog,都可以传到备库并被正确执行,备库就能达到跟主库一致的状态,这就是最终一致性。

策略

可靠性优先策略

比如一开始的双M架构,切换过程如下:

  1. 判断备库B现在的SBM,若小于某值(比如5s)继续下一步,否则持续重试该步
  2. 把主库A改成只读状态,即把readonly设置为true
  1. 判断备库B的SBM值,直到该值=0
  2. 把备库B改成可读写状态:把readonly 设置为false
  3. 把业务请求切到备库B

切换一般由HA系统完成。

MySQL可靠性优先主备切换流程


该切换流程中有不可用时间。因为在step2后,A、B都readonly,此时系统不可写,直到step5完成后才恢复。


在这个不可用过程,较耗时的是step3,可能耗费几s。这也是为什么要在step1先做判断,确保SBM足够小。


倘若一开始主备延迟就长如30min,而不先做判断直接切换,系统的不可用时间就会长达30min,一般业务都是不能接受的。


系统的不可用时间,是由该数据可靠性优先的策略决定的。也可选择可用性优先的策略,来把这个不可用时间几乎降为0。

可用性优先策略

如果我强行把步骤4、5调整到最开始执行,也就是说不等主备数据同步,直接把连接切到备库B,并且让备库B可以读写,那么系统几乎就没有不可用时间了。

我们把这个切换流程,暂时称作可用性优先流程。这个切换流程的代价,就是可能出现数据不一致的情况。

接下来,我就和你分享一个可用性优先流程产生数据不一致的例子。假设有一个表 t:

CREATE TABLE `t` (
  `id` int(11) unsigned NOT NULL AUTO_INCREMENT,
  `c` int(11) unsigned DEFAULT NULL,
  PRIMARY KEY (`id`)
) ENGINE=InnoDB;
insert into t(c) values(1),(2),(3);

初始化数据后,主库和备库上都是3行数据。接下来,业务人员要继续在表t上执行两条插入语句的命令,依次是:

insert into t(c) values(4);
insert into t(c) values(5);

假设,现在主库上其他的数据表有大量更新,导致主备延迟达到5s。在插入一条c=4的语句后,发起了主备切换。


可用性优先策略,且binlog_format=mixed时的切换流程和数据结果。


step2:主库A执行完insert,插入了一行数据(4,4),之后开始进行主备切换


step3:由于主备之间5s延迟,所以备库B还没来得及应用“插入c=4”这个中转日志,就开始接收客户端“插入 c=5”的命令


step4:备库B插入数据(4,5),并把该binlog发给主库A


step5:备库B执行“插入c=4”这个中转日志,插入一行数据(5,4)。而直接在备库B执行的“插入c=5”这个语句,传到主库A,就插入一行新数据(5,5)。


最终,A、B上出现两行不一致数据,是由可用性优先流程导致。


若我还是想用可用性优先策略,但设置binlog_format=row,会咋样?


row格式在记录binlog时,会记录新插入的行的所有字段值,所以最后只会有一行不一致。而且两边主备同步的应用线程会报错duplicate key error并停止。即这种情况,B的(5,4)和A的(5,5)这两行数据,都不会被对方执行:


可用性优先策略,且binlog_format=row

所以使用row格式,数据不一致更容易被发现。而使用mixed、statement,数据很可能悄悄地就不一致。若你过很久才发现数据不一致,那可能只能删库跑路了。


主备切换的可用性优先策略会导致数据不一致。所以更推荐使用可靠性优先策略。毕竟对数据服务,数据的可靠性 > 可用性。


有没有哪种情况数据的可用性优先级就是更高呢?

有个库的作用是记录操作日志。这时,若数据不一致,可通过binlog修复,而这短暂不一致也不会引发业务问题。

同时,业务系统依赖于这个日志的写入逻辑,若该库不可写,会导致线上业务操作无法执行。

这时候,你可能需要先强行切换,事后再补数据。

事后复盘,想到个改进措施:让业务逻辑不要依赖于这类日志的写入。即日志写入这个逻辑模块应该可降级,比如写到本地文件或另外一个临时库。


这种场景就可以使用可靠性优先策略了。


按可靠性优先,异常切换会是什么效果?

假设,主库A和备库B间的主备延迟是30min,这时主库A掉电,HA系统要切换B作为主库。在主动切换时,可以等到主备延迟小于5s时,再启动切换,但这时已经别无选择了。


可靠性优先策略,主库不可用

采用可靠性优先策略,必须得等到备库B的SBM=0后,才能切换。但现在比刚刚更严重,并不是系统只读、不可写,而是系统处于完全不可用。因为,主库A掉电后,我们的连接还没有切到备库B。


能否直接切换到备库B,但保持B只读?

不行。因为,这段时间内,中转日志还没有应用完成,若直接发起主备切换,客户端查询看不到之前执行完成的事务,会认为有“数据丢失”。

虽然随着中转日志的继续应用,这些数据会恢复回来,但对于一些业务,查询到“暂时丢失数据的状态”不能被接受。


在满足数据可靠性的前提下,MySQL高可用系统的可用性,依赖于主备延迟。延迟越小,在主库故障时,服务恢复需要时间越短,可用性越高。


相关实践学习
如何快速连接云数据库RDS MySQL
本场景介绍如何通过阿里云数据管理服务DMS快速连接云数据库RDS MySQL,然后进行数据表的CRUD操作。
全面了解阿里云能为你做什么
阿里云在全球各地部署高效节能的绿色数据中心,利用清洁计算为万物互联的新世界提供源源不断的能源动力,目前开服的区域包括中国(华北、华东、华南、香港)、新加坡、美国(美东、美西)、欧洲、中东、澳大利亚、日本。目前阿里云的产品涵盖弹性计算、数据库、存储与CDN、分析与搜索、云通信、网络、管理与监控、应用服务、互联网中间件、移动服务、视频服务等。通过本课程,来了解阿里云能够为你的业务带来哪些帮助     相关的阿里云产品:云服务器ECS 云服务器 ECS(Elastic Compute Service)是一种弹性可伸缩的计算服务,助您降低 IT 成本,提升运维效率,使您更专注于核心业务创新。产品详情: https://www.aliyun.com/product/ecs
目录
相关文章
|
10天前
|
存储 SQL 关系型数据库
MySQL进阶突击系列(03) MySQL架构原理solo九魂17环连问 | 给大厂面试官的一封信
本文介绍了MySQL架构原理、存储引擎和索引的相关知识点,涵盖查询和更新SQL的执行过程、MySQL各组件的作用、存储引擎的类型及特性、索引的建立和使用原则,以及二叉树、平衡二叉树和B树的区别。通过这些内容,帮助读者深入了解MySQL的工作机制,提高数据库管理和优化能力。
|
3天前
|
人工智能 容灾 关系型数据库
【AI应用启航workshop】构建高可用数据库、拥抱AI智能问数
12月25日(周三)14:00-16:30参与线上闭门会,阿里云诚邀您一同开启AI应用实践之旅!
|
3天前
|
存储 Oracle 关系型数据库
数据库传奇:MySQL创世之父的两千金My、Maria
《数据库传奇:MySQL创世之父的两千金My、Maria》介绍了MySQL的发展历程及其分支MariaDB。MySQL由Michael Widenius等人于1994年创建,现归Oracle所有,广泛应用于阿里巴巴、腾讯等企业。2009年,Widenius因担心Oracle收购影响MySQL的开源性,创建了MariaDB,提供额外功能和改进。维基百科、Google等已逐步替换为MariaDB,以确保更好的性能和社区支持。掌握MariaDB作为备用方案,对未来发展至关重要。
13 3
|
3天前
|
安全 关系型数据库 MySQL
MySQL崩溃保险箱:探秘Redo/Undo日志确保数据库安全无忧!
《MySQL崩溃保险箱:探秘Redo/Undo日志确保数据库安全无忧!》介绍了MySQL中的三种关键日志:二进制日志(Binary Log)、重做日志(Redo Log)和撤销日志(Undo Log)。这些日志确保了数据库的ACID特性,即原子性、一致性、隔离性和持久性。Redo Log记录数据页的物理修改,保证事务持久性;Undo Log记录事务的逆操作,支持回滚和多版本并发控制(MVCC)。文章还详细对比了InnoDB和MyISAM存储引擎在事务支持、锁定机制、并发性等方面的差异,强调了InnoDB在高并发和事务处理中的优势。通过这些机制,MySQL能够在事务执行、崩溃和恢复过程中保持
19 3
|
3天前
|
SQL 关系型数据库 MySQL
数据库灾难应对:MySQL误删除数据的救赎之道,技巧get起来!之binlog
《数据库灾难应对:MySQL误删除数据的救赎之道,技巧get起来!之binlog》介绍了如何利用MySQL的二进制日志(Binlog)恢复误删除的数据。主要内容包括: 1. **启用二进制日志**:在`my.cnf`中配置`log-bin`并重启MySQL服务。 2. **查看二进制日志文件**:使用`SHOW VARIABLES LIKE 'log_%';`和`SHOW MASTER STATUS;`命令获取当前日志文件及位置。 3. **创建数据备份**:确保在恢复前已有备份,以防意外。 4. **导出二进制日志为SQL语句**:使用`mysqlbinlog`
22 2
|
17天前
|
关系型数据库 MySQL 数据库
Python处理数据库:MySQL与SQLite详解 | python小知识
本文详细介绍了如何使用Python操作MySQL和SQLite数据库,包括安装必要的库、连接数据库、执行增删改查等基本操作,适合初学者快速上手。
117 15
|
10天前
|
SQL 关系型数据库 MySQL
数据库数据恢复—Mysql数据库表记录丢失的数据恢复方案
Mysql数据库故障: Mysql数据库表记录丢失。 Mysql数据库故障表现: 1、Mysql数据库表中无任何数据或只有部分数据。 2、客户端无法查询到完整的信息。
|
11天前
|
缓存 关系型数据库 MySQL
MySQL 索引优化与慢查询优化:原理与实践
通过本文的介绍,希望您能够深入理解MySQL索引优化与慢查询优化的原理和实践方法,并在实际项目中灵活运用这些技术,提升数据库的整体性能。
41 5
|
17天前
|
关系型数据库 MySQL 数据库
数据库数据恢复—MYSQL数据库文件损坏的数据恢复案例
mysql数据库文件ibdata1、MYI、MYD损坏。 故障表现:1、数据库无法进行查询等操作;2、使用mysqlcheck和myisamchk无法修复数据库。
|
21天前
|
SQL 关系型数据库 MySQL
MySQL导入.sql文件后数据库乱码问题
本文分析了导入.sql文件后数据库备注出现乱码的原因,包括字符集不匹配、备注内容编码问题及MySQL版本或配置问题,并提供了详细的解决步骤,如检查和统一字符集设置、修改客户端连接方式、检查MySQL配置等,确保导入过程顺利。

推荐镜像

更多