【阿里最新数据库面试题】MySQL主从一致性(上)

本文涉及的产品
云数据库 RDS MySQL,集群系列 2核4GB
推荐场景:
搭建个人博客
RDS MySQL Serverless 基础系列,0.5-2RCU 50GB
公共DNS(含HTTPDNS解析),每月1000万次HTTP解析
简介: 为什么备库执行了binlog就可以跟主库保持一致?

为什么备库执行了binlog就可以跟主库保持一致?

MySQL主备的基本原理

  • 基本的主备切换流程
  • 10.png

上部分状态:客户端的读写都直接访问A,B是A的备库,只是将A的更新都同步过来,到本地执行。这样可以保持B和A的数据相同。


当需要切换时,就切成下部分状态:客户端读写访问的都是B,A是B的备库。


上部分状态,虽然节点B没有被直接访问,但推荐把B(备库)设成只读(readonly),考虑如下:

  • 有时候一些运营类的查询语句会被放到备库上去查,设置为只读可以防止误操作
  • 防止切换逻辑有bug,比如切换过程中出现双写,造成主备不一致
  • 可以用readonly状态,来判断节点的角色。


把备库设置成只读了,还能和主库保持同步更新吗?

用于同步更新的线程,拥有超级权限。 readonly设置对超级(super)权限用户无效。

A到B这条线的内部流程是什么样的?下图中画出的就是一个update语句在节点A执行,然后同步到节点B的完整流程图

  • 主备流程图
    TODO

主库接收到客户端的更新请求后,执行内部事务的更新逻辑,同时写binlog。

备库B跟主库A之间维持了一个长连接。主库A内部有一个线程,专门用于服务备库B的这个长连接。一个事务日志同步的过程:

  1. 在备库B通过change master命令,设置主库A的IP、端口、用户名、密码,以及要从哪个位置开始请求binlog,这个位置包含文件名和日志偏移量
  2. 在备库B上执执行start slave命令,这时备库会启动io_threadsql_threadio_thread负责与主库建立连接
  3. 主库A校验完用户名、密码后,开始按照备库B传过来的位置,从本地读取binlog,发给B
  4. 备库B拿到binlog后,写到本地文件,称为中转日志(relay log)
  1. sql_thread读取中转日志,解析出日志里的命令,并执行

后来由于多线程复制方案的引入,sql_thread演化成为了多个线程。

binlog里到底是什么

为什么备库拿过去可以直接执行。

  • 创建个表并初始化数据
  • image.png
  • 要在表中删除一行,这个delete语句的binlog是怎么记录的。

注意,下面这个语句包含注释,如果你用MySQL客户端来做这个实验的话,要记得加-c参数,否则客户端会自动去掉注释。

delete
from ttt -c /*comment*/
where a >= 4
  and t_modified <= '2018-11-10'
limit 1;

当binlog_format=statement时,binlog里面记录的就是SQL语句的原文。你可以用

  • 查看binlog内容,上面是 ROW 格式,下面是 statement 格式。
mysql> show binlog events in 'binlog.000034';
+---------------+------+----------------+-----------+-------------+--------------------------------------------------------------------------------------------+
| Log_name      | Pos  | Event_type     | Server_id | End_log_pos | Info                                                                                       |
+---------------+------+----------------+-----------+-------------+--------------------------------------------------------------------------------------------+
| binlog.000034 |  786 | Anonymous_Gtid |         1 |         865 | SET @@SESSION.GTID_NEXT= 'ANONYMOUS'                                                       |
| binlog.000034 |  865 | Query          |         1 |         977 | BEGIN                                                                                      |
| binlog.000034 |  977 | Query          |         1 |        1151 | use `common_mistakes`; delete from ttt where a >= 4 and t_modified <= '2018-11-10' limit 1 |
| binlog.000034 | 1151 | Query          |         1 |        1264 | COMMIT                                                                                     |
+---------------+------+----------------+-----------+-------------+--------------------------------------------------------------------------------------------+
16 rows in set (0.00 sec)

BEGIN和最后的COMMIT匹配,表示中间是个事务

第三行就是真实执行的语句。在真实执行的delete命令之前,还有一个use命令。这条命令是MySQL根据当前要操作的表所在的数据库而自行添加的。这么做,可以保证日志传到备库去执行时,不论当前工作线程在哪个库,都能够正确更新到common_mistakes库的ttt表。

后面的delete 语句,就是SQL原语句

最后一行是一个COMMIT写着xid。

当前binlog设置的是statement格式,并且语句中有limit,该命令可能是unsafe的。因为delete 带limit,可能出现主备数据不一致。比如上面这个例子:


若delete使用的是索引a,则会根据索引a找到第一个满足条件的行,即删除的是a=4这一行

但若使用的是索引t_modified,则删除的就是 t_modified='2018-11-09',即a=5这行

由于statement格式下,记录到binlog里的是原语句,可能发生:在主库执行该SQL时,用的是索引a;而在备库执行该SQL时,却使用索引t_modified。因此,这样写是有风险的。


若把binlog改为ROW 格式,是不是就没这问题了?


row格式binlog

mysql> show binlog events in 'binlog.000034';
+---------------+------+----------------+-----------+-------------+--------------------------------------------------------------------------------------------+
| Log_name      | Pos  | Event_type     | Server_id | End_log_pos | Info                                                                                       |
+---------------+------+----------------+-----------+-------------+--------------------------------------------------------------------------------------------+
| binlog.000034 |  156 | Anonymous_Gtid |         1 |         235 | SET @@SESSION.GTID_NEXT= 'ANONYMOUS'                                                       |
| binlog.000034 |  235 | Query          |         1 |         329 | BEGIN                                                                                      |
| binlog.000034 |  329 | Table_map      |         1 |         392 | table_id: 102 (common_mistakes.ttt)                                                        |
| binlog.000034 |  392 | Delete_rows    |         1 |         440 | table_id: 102 flags: STMT_END_F                                                            |
| binlog.000034 |  440 | Xid            |         1 |         471 | COMMIT /* xid=71 */

BEGIN和COMMIT是一样的。但row格式的binlog里没有原SQL语句,而两个event:

  • Table_map event
    说明接下来要操作的表是test库的表t
  • Delete_rows event
    定义删除的行为

其实还需要借助mysqlbinlog工具,用下面的命令解析和查看binlog内容。因为图5中的信息显示,这个事务的binlog是从8900这个位置开始的,所以可以用start-position参数来指定从这个位置的日志开始解析。

/usr/local/Cellar/mysql/8.0.21_1/bin/mysqlbinlog  
-vv /usr/local/var/mysql/binlog.000034 
--start-position=156;

row格式binlog 示例的详细信息

BEGIN
/*!*/;
# at 329
#210606 14:11:44 server id 1  end_log_pos 392 CRC32 0xe8d79800  Table_map: `common_mistakes`.`ttt` mapped to number 102
# at 392
#210606 14:11:44 server id 1  end_log_pos 440 CRC32 0x8b3b43d1  Delete_rows: table id 102 flags: STMT_END_F
BINLOG '
IGe8YBMBAAAAPwAAAIgBAAAAAGYAAAAAAAEAD2NvbW1vbl9taXN0YWtlcwADdHR0AAMDAxEBAAIB
AQAAmNfo
IGe8YCABAAAAMAAAALgBAAAAAGYAAAAAAAEAAgAD/wAEAAAABAAAAFvlrwDRQzuL
'/*!*/;
### DELETE FROM `common_mistakes`.`ttt`
### WHERE
###   @1=4 /* INT meta=0 nullable=0 is_null=0 */
###   @2=4 /* INT meta=0 nullable=1 is_null=0 */
###   @3=1541779200 /* TIMESTAMP(0) meta=0 nullable=0 is_null=0 */
# at 440
#210606 14:11:44 server id 1  end_log_pos 471 CRC32 0x8e0dab1d  Xid = 71
COMMIT/*!*/;
  • server id 1
    该事务在server_id=1的库上执行
  • 每个event都有CRC32值,因为binlog_checksum是CRC32

image.png

  • Table_map event
    显示了接下来要打开的表,map到数字226。现在我们这条SQL语句只操作了一张表,若操作多表呢?每个表都有一个对应的Table_map event、都会map到一个单独的数字,用于区分对不同表的操作。
  • -vv参数是为了把内容都解析出来,所以从结果里面可以看到各个字段的值(比如,@1=4、 @2=4这些值)
  • binlog_row_image
  • image.png
  • 默认配置是FULL,因此Delete_event里面,包含了删掉的行的所有字段的值。若把binlog_row_image设置为MINIMAL,则只会记录必要的信息。在该例,就只会记录id=4。
  • Xid event
    表示事务被正确提交了。

可见,当binlog_format=row,binlog记录了真实删除行的主键id,这样binlog传到备库时,就肯定会删除id=4的行,不会有主备删除不同行的问题。

相关实践学习
如何快速连接云数据库RDS MySQL
本场景介绍如何通过阿里云数据管理服务DMS快速连接云数据库RDS MySQL,然后进行数据表的CRUD操作。
全面了解阿里云能为你做什么
阿里云在全球各地部署高效节能的绿色数据中心,利用清洁计算为万物互联的新世界提供源源不断的能源动力,目前开服的区域包括中国(华北、华东、华南、香港)、新加坡、美国(美东、美西)、欧洲、中东、澳大利亚、日本。目前阿里云的产品涵盖弹性计算、数据库、存储与CDN、分析与搜索、云通信、网络、管理与监控、应用服务、互联网中间件、移动服务、视频服务等。通过本课程,来了解阿里云能够为你的业务带来哪些帮助 &nbsp; &nbsp; 相关的阿里云产品:云服务器ECS 云服务器 ECS(Elastic Compute Service)是一种弹性可伸缩的计算服务,助您降低 IT 成本,提升运维效率,使您更专注于核心业务创新。产品详情: https://www.aliyun.com/product/ecs
目录
相关文章
|
10天前
|
存储 SQL 关系型数据库
MySQL进阶突击系列(03) MySQL架构原理solo九魂17环连问 | 给大厂面试官的一封信
本文介绍了MySQL架构原理、存储引擎和索引的相关知识点,涵盖查询和更新SQL的执行过程、MySQL各组件的作用、存储引擎的类型及特性、索引的建立和使用原则,以及二叉树、平衡二叉树和B树的区别。通过这些内容,帮助读者深入了解MySQL的工作机制,提高数据库管理和优化能力。
|
3天前
|
存储 Oracle 关系型数据库
数据库传奇:MySQL创世之父的两千金My、Maria
《数据库传奇:MySQL创世之父的两千金My、Maria》介绍了MySQL的发展历程及其分支MariaDB。MySQL由Michael Widenius等人于1994年创建,现归Oracle所有,广泛应用于阿里巴巴、腾讯等企业。2009年,Widenius因担心Oracle收购影响MySQL的开源性,创建了MariaDB,提供额外功能和改进。维基百科、Google等已逐步替换为MariaDB,以确保更好的性能和社区支持。掌握MariaDB作为备用方案,对未来发展至关重要。
13 3
|
3天前
|
安全 关系型数据库 MySQL
MySQL崩溃保险箱:探秘Redo/Undo日志确保数据库安全无忧!
《MySQL崩溃保险箱:探秘Redo/Undo日志确保数据库安全无忧!》介绍了MySQL中的三种关键日志:二进制日志(Binary Log)、重做日志(Redo Log)和撤销日志(Undo Log)。这些日志确保了数据库的ACID特性,即原子性、一致性、隔离性和持久性。Redo Log记录数据页的物理修改,保证事务持久性;Undo Log记录事务的逆操作,支持回滚和多版本并发控制(MVCC)。文章还详细对比了InnoDB和MyISAM存储引擎在事务支持、锁定机制、并发性等方面的差异,强调了InnoDB在高并发和事务处理中的优势。通过这些机制,MySQL能够在事务执行、崩溃和恢复过程中保持
19 3
|
3天前
|
SQL 关系型数据库 MySQL
数据库灾难应对:MySQL误删除数据的救赎之道,技巧get起来!之binlog
《数据库灾难应对:MySQL误删除数据的救赎之道,技巧get起来!之binlog》介绍了如何利用MySQL的二进制日志(Binlog)恢复误删除的数据。主要内容包括: 1. **启用二进制日志**:在`my.cnf`中配置`log-bin`并重启MySQL服务。 2. **查看二进制日志文件**:使用`SHOW VARIABLES LIKE &#39;log_%&#39;;`和`SHOW MASTER STATUS;`命令获取当前日志文件及位置。 3. **创建数据备份**:确保在恢复前已有备份,以防意外。 4. **导出二进制日志为SQL语句**:使用`mysqlbinlog`
22 2
|
17天前
|
关系型数据库 MySQL 数据库
Python处理数据库:MySQL与SQLite详解 | python小知识
本文详细介绍了如何使用Python操作MySQL和SQLite数据库,包括安装必要的库、连接数据库、执行增删改查等基本操作,适合初学者快速上手。
117 15
|
10天前
|
SQL 关系型数据库 MySQL
数据库数据恢复—Mysql数据库表记录丢失的数据恢复方案
Mysql数据库故障: Mysql数据库表记录丢失。 Mysql数据库故障表现: 1、Mysql数据库表中无任何数据或只有部分数据。 2、客户端无法查询到完整的信息。
|
17天前
|
关系型数据库 MySQL 数据库
数据库数据恢复—MYSQL数据库文件损坏的数据恢复案例
mysql数据库文件ibdata1、MYI、MYD损坏。 故障表现:1、数据库无法进行查询等操作;2、使用mysqlcheck和myisamchk无法修复数据库。
|
21天前
|
SQL 关系型数据库 MySQL
MySQL导入.sql文件后数据库乱码问题
本文分析了导入.sql文件后数据库备注出现乱码的原因,包括字符集不匹配、备注内容编码问题及MySQL版本或配置问题,并提供了详细的解决步骤,如检查和统一字符集设置、修改客户端连接方式、检查MySQL配置等,确保导入过程顺利。
|
29天前
|
关系型数据库 MySQL 数据库
GBase 数据库如何像MYSQL一样存放多行数据
GBase 数据库如何像MYSQL一样存放多行数据
|
1月前
|
SQL 关系型数据库 MySQL
12 PHP配置数据库MySQL
路老师分享了PHP操作MySQL数据库的方法,包括安装并连接MySQL服务器、选择数据库、执行SQL语句(如插入、更新、删除和查询),以及将结果集返回到数组。通过具体示例代码,详细介绍了每一步的操作流程,帮助读者快速入门PHP与MySQL的交互。
40 1

推荐镜像

更多