MySQL Q&A 解析binlog的两个问题-阿里云开发者社区

开发者社区> 数据库> 正文

MySQL Q&A 解析binlog的两个问题

简介:

连续碰到两个同学问类似的问题,必须要记录一下。

 

问题:

    一个作解析binlog应用的同学发现不论用utf8还是gbk来解析binlog都可能会碰到无法解析的语句,因为有些用户会用utf8,有些用gbk。尤其在处理Query类型的SQL语句中的中文字符,比如建表语句中的中文注释。

     于是他想到用mysqlbinlog来看看binlog里面的内容。

     Mysqlbinlog这个工具的结果带来了新的疑问。

       开一个客户端,执行序列如下:

      set names utf8;

      create table a(c int);

      create table b(c int);

      set names gbk;

      drop table a;

      create table a(c int)comment='测试字符集';

  mysqlbinlog解析结果如下

    binlog的结果与预期相同。从结果看,可以通过

SET @@session.character_set_client=33,@@session.collation_connection=33,@@session.collation_server=28/*!*/;

 

    这句话的原始信息中得到当前使用的字符集,那么解析后续的binlog语句就没有问题。可以看到在drop table a之前我们修改了字符集,同样在binlog解析结果中可以看到一个设置字符集的语句。

 

     问题追问:但是解析工具是可以指定起始位置的。如果指定从drop table a这个语句的位置之后开始解析,那是不是就无法得知当前的字符集信息(gbk)?是不是只能到MySQL server里面才能得到这个表的正确建表语句?

 

    显然不会这么复杂,否则MySQL的从库上执行一个change master 改变同步位置的时候,从库应该使用什么字符集呢?碰到的问题是相同的。

    实际上,对于statement格式的binlog(类型为QUERY_EVENT)每个event中都记录了当前使用的字符集编号。无论主库、从库还是mysqlbinlog,都保存相同的一份编号到字符集的对应,能够决定使用什么字符集来解析binlog中的字符串。

    这里也可以得到为什么官方无法保证从库版本低于主库版本的主从结构正确性的一个原因。

     至于为什么mysqlbinlog工具不会每行都输出当前使用的字符集?其实有点洁癖的程序员都会这么干的吧,当前的语句与上一个语句使用相同的环境变量,就不重复输出了。

 

问题2mysqlbinlog结果中有use一个db以后,执行多个语句,此时mysqlbinlog的结果中看到,只会在切换的时候显示一次use db。那如果从之后的第二个语句开始解析binlog,会不会导致这些语句执行到另外一个库去?

同理。

版权声明:本文内容由阿里云实名注册用户自发贡献,版权归原作者所有,阿里云开发者社区不拥有其著作权,亦不承担相应法律责任。具体规则请查看《阿里云开发者社区用户服务协议》和《阿里云开发者社区知识产权保护指引》。如果您发现本社区中有涉嫌抄袭的内容,填写侵权投诉表单进行举报,一经查实,本社区将立刻删除涉嫌侵权内容。

分享:
数据库
使用钉钉扫一扫加入圈子
+ 订阅

分享数据库前沿,解构实战干货,推动数据库技术变革

其他文章