解析MYSQL BINLOG二进制格式(10)--问题解答

本文涉及的产品
云数据库 RDS MySQL,集群系列 2核4GB
推荐场景:
搭建个人博客
RDS MySQL Serverless 基础系列,0.5-2RCU 50GB
云数据库 RDS PostgreSQL,集群系列 2核4GB
简介: 原创转发请注明出处 上接 http://blog.itpub.net/7728585/viewspace-2133188/ 解析MYSQL BINLOG 二进制格式(1)--准备工作  http://blog.

原创转发请注明出处
上接
http://blog.itpub.net/7728585/viewspace-2133188/ 解析MYSQL BINLOG 二进制格式(1)--准备工作 
http://blog.itpub.net/7728585/viewspace-2133189/ 解析MYSQL BINLOG 二进制格式(2)--FORMAT_DESCRIPTION_EVENT 
http://blog.itpub.net/7728585/viewspace-2133321/ 解析MYSQL BINLOG 二进制格式(3)--QUERY_EVENT 
http://blog.itpub.net/7728585/viewspace-2133429/ 解析MYSQL BINLOG 二进制格式(4)--TABLE_MAP_EVENT 
http://blog.itpub.net/7728585/viewspace-2133463/ 解析MYSQL BINLOG 二进制格式(5)--WRITE_ROW_EVENT 
http://blog.itpub.net/7728585/viewspace-2133469/ 解析MYSQL BINLOG 二进制格式(6)--UPDATE_ROW_EVENT/DELETE_ROW_EVENT  
http://blog.itpub.net/7728585/viewspace-2133502/ 解析MYSQL BINLOG 二进制格式(7)--Xid_log_event/XID_EVENT 
http://blog.itpub.net/7728585/viewspace-2133506/ 解析MYSQL BINLOG二进制格式(8)--GTID_LOG_EVENT/ANONYMOUS_GTID_LOG_EVENT及其他 
http://blog.itpub.net/7728585/viewspace-2133534/ 解析MYSQL BINLOG二进制格式(9)--infobin解析binlog帮助文档

本文解析全部使用工具infobin 
参考
http://blog.itpub.net/7728585/viewspace-2133534/ 解析MYSQL BINLOG二进制格式(9)--infobin解析binlog帮助文档

最后我们来回答最开始提出的问题

1、为什么说row格式较statement更占空间
   在前面所述 因为row格式记录了真正的数据,比单纯的语句要大得多,
   其binlog生成量大约为修改数据量的2/3。如果是update则更大,因为有
   前后印象大约为修改数据量的4/3
2、为什么说row格式的binlog更加安全
   在前面所述,因为row格式加入了map event,使用table_id进行复制,同时
   记录是真正的记录,那么复制是解析的其真正的数据做到了更加安全,
   换句话说他是真正的二进制的包含了修改的数据
3、INSERT/UPDATE/DELETE是生成的row binlog如何直接看懂二进制格式
   如前面各个文章所描述,并且程序我已经写好了,可以使用参考前面的文章
4、DDL生成的binlog是怎么样的
   DDL生成的binlog是语句模式,只有DML操作可以记录行格式。
5、INSERT SELECT/CREATE TABLE 如何生成的row binlog
   insert select 生成是binlog是一个事物中的多个event,但是并不是每条数据一个event
   而是多条数据生成一个event,一个event大小大约为8K左右。
 但是这也有例外就是一行数据本来就超过了8K如下:
 insert into testb values(repeat('A',19999));
------>Insert Event:Pos:563(0X233) N_pos:20600(0X5078) Time:1487042557 Event_size:20037(bytes) 
   create table as 生成的binlog比insert selcet多了一个create table的过程,但是在开启
   gtid的情况是不能使用的create table as。
我做了语句:
mysql> insert into testkk select * from test limit 40000;
Query OK, 40000 rows affected (2.52 sec)
Records: 40000  Duplicates: 0  Warnings: 0

如下:
使用
 ./infobin test.000202|more

>Gtid Event:Pos:356(0X164) N_pos:421(0X1a5) Time:1487040273 Event_size:65(bytes) 
Gtid:4a6f2a67-5d87-11e6-a6bd-0c29a879a3:1100471
-->Query Event:Pos:421(0X1a5) N_Pos:493(0X1ed) Time:1487040273 Event_size:72(bytes) 
Exe_time:0  Use_db:test Statment(35b-trun):BEGIN /*!Trx begin!*/ Gno:1100471
---->Map Event:Pos493(0X1ed) N_pos:666(0X29a) Time:1487040273 Event_size:173(bytes) 
TABLE_ID:350 DB_NAME:test TABLE_NAME:testkk Gno:1100471
------>Insert Event:Pos:666(0X29a) N_pos:8822(0X2276) Time:1487040273 Event_size:8156(bytes) 
Dml on table: test.testkk  table_id:350 Gno:1100471 
------>Insert Event:Pos:8822(0X2276) N_pos:16982(0X4256) Time:1487040273 Event_size:8160(bytes) 
Dml on table: test.testkk  table_id:350 Gno:1100471 
------>Insert Event:Pos:16982(0X4256) N_pos:25143(0X6237) Time:1487040273 Event_size:8161(bytes) 
Dml on table: test.testkk  table_id:350 Gno:1100471 
------>Insert Event:Pos:25143(0X6237) N_pos:33304(0X8218) Time:1487040273 Event_size:8161(bytes) 
Dml on table: test.testkk  table_id:350 Gno:1100471 
------>Insert Event:Pos:33304(0X8218) N_pos:41455(0Xa1ef) Time:1487040273 Event_size:8151(bytes) 
Dml on table: test.testkk  table_id:350 Gno:1100471 
------>Insert Event:Pos:41455(0Xa1ef) N_pos:49572(0Xc1a4) Time:1487040273 Event_size:8117(bytes) 
....
------>Insert Event:Pos:5602407(0X557c67) N_pos:5610568(0X559c48) Time:1487040273 Event_size:8161(bytes) 
Dml on table: test.testkk  table_id:350 Gno:1100471 
------>Insert Event:Pos:5610568(0X559c48) N_pos:5618719(0X55bc1f) Time:1487040273 Event_size:8151(bytes) 
Dml on table: test.testkk  table_id:350 Gno:1100471 
------>Insert Event:Pos:5618719(0X55bc1f) N_pos:5624075(0X55d10b) Time:1487040273 Event_size:5356(bytes) 
Dml on table: test.testkk  table_id:350 Gno:1100471 
>Xid Event:Pos:5624075(0X55d10b) N_Pos:5624106(0X55d12a) Time:1487040273 Event_size:31(bytes) 
COMMIT; /*!Trx end*/ Gno:1100471

可以看到大小大约为8K,当然如果不嫌麻烦用mysqlbinlog也行但是event_size需要自己减一下。

6、如果一个delete大表先开始,然后不断有insert小表进入,他是如何生成binlog的。gtid又是按什么顺序生成

我通过分析 delete大表的binlog会在commit后写到binlog中,之前binlog记录在缓存或者临时文件中
但是binlog中的时间记录为事务开始时间为delete发起时间,其gtid生成顺序
是按照commit的时候生成的,同时一个事物的binlog一定是连续的。
如下:
>Gtid Event:Pos:120314(0X1d5fa) N_pos:120379(0X1d63b) Time:1487032811 Event_size:65(bytes)  --小事物开始
Gtid:4a6f2a67-5d87-11e6-a6bd-0c29a879a3:1000922
-->Query Event:Pos:120379(0X1d63b) N_Pos:120451(0X1d683) Time:1487032811 Event_size:72(bytes) 
Exe_time:0  Use_db:test Statment(35b-trun):BEGIN /*!Trx begin!*/ Gno:1000922
---->Map Event:Pos120451(0X1d683) N_pos:120503(0X1d6b7) Time:1487032811 Event_size:52(bytes) 
TABLE_ID:343 DB_NAME:test TABLE_NAME:testloop1 Gno:1000922
------>Insert Event:Pos:120503(0X1d6b7) N_pos:120543(0X1d6df) Time:1487032811 Event_size:40(bytes) 
Dml on table: test.testloop1  table_id:343 Gno:1000922 
>Xid Event:Pos:120543(0X1d6df) N_Pos:120574(0X1d6fe) Time:1487032811 Event_size:31(bytes) 
COMMIT; /*!Trx end*/ Gno:1000922 --小事物结束
>Gtid Event:Pos:120574(0X1d6fe) N_pos:120639(0X1d73f) Time:1487032783 Event_size:65(bytes) --大事物开始
Gtid:4a6f2a67-5d87-11e6-a6bd-0c29a879a3:1000923
-->Query Event:Pos:120639(0X1d73f) N_Pos:120711(0X1d787) Time:1487032783 Event_size:72(bytes) 
Exe_time:0  Use_db:test Statment(35b-trun):BEGIN /*!Trx begin!*/ Gno:1000923
---->Map Event:Pos120711(0X1d787) N_pos:120888(0X1d838) Time:1487032783 Event_size:177(bytes) 
TABLE_ID:342 DB_NAME:test TABLE_NAME:test100009 Gno:1000923
------>Delete Event:Pos:120888(0X1d838) N_pos:129044(0X1f814) Time:1487032783 Event_size:8156(bytes) 
Dml on table: test.test100009  table_id:342 Gno:1000923 
------>Delete Event:Pos:129044(0X1f814) N_pos:137204(0X217f4) Time:1487032783 Event_size:8160(bytes) 
Dml on table: test.test100009  table_id:342 Gno:1000923 
------>Delete Event:Pos:137204(0X217f4) N_pos:145365(0X237d5) Time:1487032783 Event_size:8161(bytes) 
Dml on table: test.test100009  table_id:342 Gno:1000923 
.................
Dml on table: test.test100009  table_id:342 Gno:1000923 
------>Delete Event:Pos:102028245(0X614d3d5) N_pos:102036403(0X614f3b3) Time:1487032783 Event_size:8158(bytes) 
Dml on table: test.test100009  table_id:342 Gno:1000923 
------>Delete Event:Pos:102036403(0X614f3b3) N_pos:102040255(0X61502bf) Time:1487032783 Event_size:3852(bytes) 
Dml on table: test.test100009  table_id:342 Gno:1000923 
>Xid Event:Pos:102040255(0X61502bf) N_Pos:102040286(0X61502de) Time:1487032783 Event_size:31(bytes) 
COMMIT; /*!Trx end*/ Gno:1000923 ---大事物结束
>Gtid Event:Pos:102040286(0X61502de) N_pos:102040351(0X615031f) Time:1487032811 Event_size:65(bytes) --小事物开始
Gtid:4a6f2a67-5d87-11e6-a6bd-0c29a879a3:1000924
-->Query Event:Pos:102040351(0X615031f) N_Pos:102040423(0X6150367) Time:1487032811 Event_size:72(bytes) 
Exe_time:0  Use_db:test Statment(35b-trun):BEGIN /*!Trx begin!*/ Gno:1000924
---->Map Event:Pos102040423(0X6150367) N_pos:102040475(0X615039b) Time:1487032811 Event_size:52(bytes) 
TABLE_ID:343 DB_NAME:test TABLE_NAME:testloop1 Gno:1000924
------>Insert Event:Pos:102040475(0X615039b) N_pos:102040515(0X61503c3) Time:1487032811 Event_size:40(bytes) 
Dml on table: test.testloop1  table_id:343 Gno:1000924 
>Xid Event:Pos:102040515(0X61503c3) N_Pos:102040546(0X61503e2) Time:1487032811 Event_size:31(bytes) 
COMMIT; /*!Trx end*/ Gno:1000924 --小事物结束


      会话 A                                                                                                       会话B
delete 事物 1487032783开始                                     
        +                                                                                             insert 事物开始 1487032811 
        +                                                                                            commit gtid:4a6f2a67-5d87-11e6-a6bd-0c29a879a3:1000922 
        +
delete 事物结束commit 生成
commit gtid:4a6f2a67-5d87-11e6-a6bd-0c29a879a3:1000923
                                                                                                      insert 事物开始 1487032811
                                                                                                     commit gtid:4a6f2a67-5d87-11e6-a6bd-0c29a879a3:1000924
                                                       


实际上记录binlog的顺序为
insert   commit gtid:4a6f2a67-5d87-11e6-a6bd-0c29a879a3:1000922 
delete commit gtid:4a6f2a67-5d87-11e6-a6bd-0c29a879a3:1000923
insert  commit gtid:4a6f2a67-5d87-11e6-a6bd-0c29a879a3:1000924


也就是说delete记录到了第一个insert之后,按照是commit的顺序来记录和分配gtid的
也就是上面解析出来的结果。

至此mysql binlog 二进制格式解析系列文章告于段落

相关实践学习
如何在云端创建MySQL数据库
开始实验后,系统会自动创建一台自建MySQL的 源数据库 ECS 实例和一台 目标数据库 RDS。
全面了解阿里云能为你做什么
阿里云在全球各地部署高效节能的绿色数据中心,利用清洁计算为万物互联的新世界提供源源不断的能源动力,目前开服的区域包括中国(华北、华东、华南、香港)、新加坡、美国(美东、美西)、欧洲、中东、澳大利亚、日本。目前阿里云的产品涵盖弹性计算、数据库、存储与CDN、分析与搜索、云通信、网络、管理与监控、应用服务、互联网中间件、移动服务、视频服务等。通过本课程,来了解阿里云能够为你的业务带来哪些帮助     相关的阿里云产品:云服务器ECS 云服务器 ECS(Elastic Compute Service)是一种弹性可伸缩的计算服务,助您降低 IT 成本,提升运维效率,使您更专注于核心业务创新。产品详情: https://www.aliyun.com/product/ecs
相关文章
|
6天前
|
监控 关系型数据库 MySQL
MySQL自增ID耗尽应对策略:技术解决方案全解析
在数据库管理中,MySQL的自增ID(AUTO_INCREMENT)属性为表中的每一行提供了一个唯一的标识符。然而,当自增ID达到其最大值时,如何处理这一情况成为了数据库管理员和开发者必须面对的问题。本文将探讨MySQL自增ID耗尽的原因、影响以及有效的应对策略。
20 3
|
7天前
|
存储 关系型数据库 MySQL
MySQL 字段类型深度解析:VARCHAR(50) 与 VARCHAR(500) 的差异
在MySQL数据库中,`VARCHAR`类型是一种非常灵活的字符串存储类型,它允许存储可变长度的字符串。然而,`VARCHAR(50)`和`VARCHAR(500)`之间的差异不仅仅是长度的不同,它们在存储效率、性能和使用场景上也有所不同。本文将深入探讨这两种字段类型的区别及其对数据库设计的影响。
16 2
|
11天前
|
存储 关系型数据库 MySQL
PHP与MySQL动态网站开发深度解析####
本文作为技术性文章,深入探讨了PHP与MySQL结合在动态网站开发中的应用实践,从环境搭建到具体案例实现,旨在为开发者提供一套详尽的实战指南。不同于常规摘要仅概述内容,本文将以“手把手”的教学方式,引导读者逐步构建一个功能完备的动态网站,涵盖前端用户界面设计、后端逻辑处理及数据库高效管理等关键环节,确保读者能够全面掌握PHP与MySQL在动态网站开发中的精髓。 ####
|
19天前
|
存储 关系型数据库 MySQL
MySQL MVCC深度解析:掌握并发控制的艺术
【10月更文挑战第23天】 在数据库领域,MVCC(Multi-Version Concurrency Control,多版本并发控制)是一种重要的并发控制机制,它允许多个事务并发执行而不产生冲突。MySQL作为广泛使用的数据库系统,其InnoDB存储引擎就采用了MVCC来处理事务。本文将深入探讨MySQL中的MVCC机制,帮助你在面试中自信应对相关问题。
55 3
|
19天前
|
缓存 关系型数据库 MySQL
MySQL执行计划深度解析:如何做出最优选择
【10月更文挑战第23天】 在数据库查询性能优化中,执行计划的选择至关重要。MySQL通过查询优化器来生成执行计划,但有时不同的执行计划会导致性能差异。理解如何选择合适的执行计划,以及为什么某些计划更优,对于数据库管理员和开发者来说是一项必备技能。
28 2
|
2月前
|
canal 消息中间件 关系型数据库
Canal作为一款高效、可靠的数据同步工具,凭借其基于MySQL binlog的增量同步机制,在数据同步领域展现了强大的应用价值
【9月更文挑战第1天】Canal作为一款高效、可靠的数据同步工具,凭借其基于MySQL binlog的增量同步机制,在数据同步领域展现了强大的应用价值
618 4
|
3月前
|
SQL 关系型数据库 MySQL
【揭秘】MySQL binlog日志与GTID:如何让数据库备份恢复变得轻松简单?
【8月更文挑战第22天】MySQL的binlog日志记录数据变更,用于恢复、复制和点恢复;GTID为每笔事务分配唯一ID,简化复制和恢复流程。开启binlog和GTID后,可通过`mysqldump`进行逻辑备份,包含binlog位置信息,或用`xtrabackup`做物理备份。恢复时,使用`mysql`命令执行备份文件,或通过`innobackupex`恢复物理备份。GTID模式下的主从复制配置更简便。
373 2
|
3月前
|
SQL 关系型数据库 MySQL
【MySQL】根据binlog日志获取回滚sql的一个开发思路
【MySQL】根据binlog日志获取回滚sql的一个开发思路
|
10天前
|
存储 SQL 关系型数据库
mysql 的ReLog和BinLog区别
MySQL中的重做日志(Redo Log)和二进制日志(Binary Log)是两种重要的日志系统。重做日志主要用于保证事务的持久性和原子性,通过记录数据页的物理修改信息来恢复未提交的事务更改。二进制日志则记录了数据库的所有逻辑变化操作,用于数据的复制、恢复和审计。两者在写入时机、存储方式、配置参数和使用范围上有所不同,共同确保了数据库的稳定性和可靠性。
|
2月前
|
消息中间件 canal 关系型数据库
Maxwell:binlog 解析器,轻松同步 MySQL 数据
Maxwell:binlog 解析器,轻松同步 MySQL 数据
299 11

推荐镜像

更多