MySQL——binlog

本文涉及的产品
RDS MySQL DuckDB 分析主实例,集群系列 4核8GB
简介:

一、binlog简介:


1、什么是binlog:

   binlog日志用于记录所有更新了数据或者已经潜在更新了数据(例如,没有匹配任何行的一个DELETE)的所有语句。语句以“事件”的形式保存,它描述数据更改。


2、binlog的记录格式:

Mysql binlog日志有三种格式,分别为:Statement ,MiXED ,和ROW;

  (在MySQL5.7.7版本之后,把binlog_format的默认值修改成了ROW。master将修改表的event写入binlog中,并且master将binlog信息发送到slave,slave重放binlog中event。基于ROW格式复制是最安全的复制,slave需要的行锁更少;但是也有一些缺点,那就是基于ROW格式的复制,binlog会记录更多的数据。并且无法在slave上看到从master上获取的语句,因为都是event。但是在ROW格式下,可以开启binlog_rows_query_log_events参数,这会让binlog在记录events同时,也记录原始的sql语句,以方便后续的查询;)


①:Statement:每一条会修改数据的sql都会记录在binlog中。


优点:不需要记录每一行的变化,减少了binlog日志量,节约了IO,提高性能。(相比row能节约多少性能与日志量,这个取决于应用的SQL情况,正常同一条记录修改或者插入row格式所产生的日志量还小于Statement产生的日志量,但是考虑到如果带条件的update操作,以及整表删除,alter表等操作,ROW格式会产生大量日志,因此在考虑是否使用ROW格式日志时应该跟据应用的实际情况,其所产生的日志量会增加多少,以及带来的IO性能问题。)


缺点:由于记录的只是执行语句,为了这些语句能在slave上正确运行,因此还必须记录每条语句在执行的时候的一些相关信息,以保证所有语句能在slave得到和在master端执行时候相同 的结果。另外mysql 的复制,像一些特定函数功能,slave可与master上要保持一致会有很多相关问题(如sleep()函数, last_insert_id(),以及user-defined functions(udf)会出现问题).


使用以下函数的语句也无法被复制:

* LOAD_FILE()

* UUID()

* USER()

* FOUND_ROWS()

* SYSDATE() (除非启动时启用了 --sysdate-is-now 选项)


------同时在INSERT ...SELECT 会产生比 RBR 更多的行级锁


②:Row: 不记录sql语句上下文相关信息,仅保存哪条记录被修改。


优点: binlog中可以不记录执行的sql语句的上下文相关的信息,仅需要记录那一条记录被修改成什么了。所以row level的日志内容会非常清楚的记录下每一行数据修改的细节。而且不会出现某些特定情况下的存储过程,或function,以及trigger的调用和触发无法被正确复制的问题


缺点: 所有的执行的语句当记录到日志中的时候,都将以每行记录的修改来记录,这样可能会产生大量的日志内容,比如一条update语句,修改多条记录,则binlog中每一条修改都会有记录,这样造成binlog日志量会很大,特别是当执行alter table之类的语句的时候,由于表结构修改,每条记录都发生改变,那么该表每一条记录都会记录到日志中。


③:Mixedlevel: 是以上两种level的混合使用,

  一般的语句修改使用statment格式保存binlog,如一些函数,statement无法完成主从复制的操作,则采用row格式保存binlog,MySQL会根据执行的每一条具体的sql语句来区分对待记录的日志形式,也就是在Statement和Row之间选择一种.新版本的MySQL中队row level模式也被做了优化,并不是所有的修改都会以row level来记录,像遇到表结构变更的时候就会以statement模式来记录。至于update或者delete等修改数据的语句,还是会记录所有行的变更。



二、Binlog基本配制与格式设定


1、基本配制


Mysql BInlog日志格式可以通过mysql的my.cnf文件的属性binlog_format指定。如以下:

1
2
3
4
binlog_format = ROW             ---binlog日志格式
log_bin = /mysql/mysql-bin .log        ---binlog日志名
expire_logs_days = 7            ---binlog过期清理时间
max_binlog_size 100m            ---binlog每个日志文件大小

2.Binlog日志格式选择


Mysql默认是使用Statement日志格式,推荐使用ROW.


  由于一些特殊使用,可以考虑使用ROWED,如自己通过binlog日志来同步数据的修改,这样会节省很多相关操作。对于binlog数据处理会变得非常轻松,相对mixed,解析也会很轻松(当然前提是增加的日志量所带来的IO开销在容忍的范围内即可)。


3.mysqlbinlog格式选择


mysql对于日志格式的选定原则:如果是采用 INSERT,UPDATE,DELETE 等直接操作表的情况,则日志格式根据 binlog_format 的设定而记录,如果是采用 GRANT,REVOKE,SET PASSWORD 等管理语句来做的话,那么无论如何 都采用 SBR 模式记录。



三、binlog的相关参数:

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
--log_bin:
设置此参数表示启用binlog功能,并指定路径名称
 
--log_bin_index
设置此参数是指定二进制索引文件的路径与名称
 
--binlog_do_db
此参数表示只记录指定数据库的二进制日志
 
--binlog_ignore_db
此参数表示不记录指定的数据库的二进制日志
 
--max_binlog_cache_size
此参数表示binlog使用的内存最大的尺寸
 
--binlog_cache_size
此参数表示binlog使用的内存大小,可以通过状态变量binlog_cache_use和binlog_cache_disk_use来帮助测试。
     binlog_cache_use:使用二进制日志缓存的事务数量
     binlog_cache_disk_use:使用二进制日志缓存但超过binlog_cache_size值并使用临时文件来保存事务中的语句的事务数量
 
--max_binlog_size
Binlog最大值,最大和默认值是1GB,该设置并不能严格控制Binlog的大小,尤其是Binlog比较靠近最大值而又遇到一个比较大事务时,为了保证事务的完整性,不可能做切换日志的动作,只能将该事务的所有SQL都记录进当前日志,直到事务结束
 
--sync_binlog
这个参数直接影响mysql的性能和完整性
 
--sync_binlog=0:
当事务提交后,Mysql仅仅是将binlog_cache中的数据写入Binlog文件,但不执行fsync之类的磁盘        同步指令通知文件系统将缓存刷新到磁盘,而让Filesystem自行决定什么时候来做同步,这个是性能最好的。
 
--sync_binlog=n,在进行n次事务提交以后,Mysql将执行一次fsync之类的磁盘同步指令,同志文件系统将Binlog文件缓存刷新到磁盘。
注意:Mysql中默认的设置是sync_binlog=0,即不作任何强制性的磁盘刷新指令,这时性能是最好的,但风险也是最大的。一旦系统绷Crash,在文件系统缓存中的所有Binlog信息都会丢失


四、binlog的删除:

  binlog的删除可以手工删除或自动删除


1、自动删除binlog

1
2
3
4
通过binlog参数(expire_logs_days )来实现mysql自动删除binlog
mysql> show binary logs;
mysql> show variables like  'expire_logs_days' ;
mysql>  set  global expire_logs_days=3;


2、手工删除binlog

1
2
3
4
5
6
7
8
9
mysql> reset master;       ----删除master的binlog
mysql> reset slave;        ----删除slave的中继日志
mysql> purge master logs before  '2017-03-30 17:20:00' ;   -----删除指定日期以前的日志索引中binlog日志文件
mysql> purge master logs to  'binlog.000002' ;     ----删除指定日志文件的日志索引中binlog日志文件或者直接用操作系统命令直接删除
mysql>  set  sql_log_bin=1 /0 ;    ----如果用户有super权限,可以启用或禁用当前会话的binlog记录
mysql> show master logs;     ---查看master的binlog日志 
mysql> show binary logs;     ---查看master的binlog日志
mysql> show master status;   ---用于提供master二进制日志文件的状态信息
mysql> show slave hosts;     ---显示当前注册的slave的列表。不以--report-host=slave_name选项为开头的slave不会显示在本列表中


3、binglog的查看

通过mysqlbinlog命令可以查看binlog的内容

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
[root@localhost ~] # mysqlbinlog  /home/mysql/binlog/binlog.000003  | more
/*!40019 SET @@session.max_insert_delayed_threads=0*/;
/*!50003 SET @OLD_COMPLETION_TYPE=@@COMPLETION_TYPE,COMPLETION_TYPE=0*/;
DELIMITER /*!*/;
# at 4
#120330 16:51:46 server id 1  end_log_pos 98    Start: binlog v 4, server v 5.0.45-log created 120330 1
6:51:46
# Warning: this binlog was not closed properly. Most probably mysqld crashed writing it.
# at 196
#120330 17:54:15 server id 1  end_log_pos 294   Query   thread_id=3     exec_time=2     error_code=0
SET TIMESTAMP=1333101255/*!*/;
insert into tt7  select  * from tt7/*!*/;
# at 294
#120330 17:54:46 server id 1  end_log_pos 388   Query   thread_id=3     exec_time=28    error_code=0
SET TIMESTAMP=1333101286/*!*/;
alter table tt7 engine=innodb/*!*/;


3.1、解析binlog格式


--位置

位于文件中的位置,“at 196”说明“事件”的起点,是以第196字节开始;“end_log_pos 294”说明以第294字节结束


--时间戳

事件发生的时间戳:“120330 17:54:46”


--事件执行时间

事件执行花费的时间:"exec_time=28"


--错误码

错误码为:“error_code=0”


--服务器的标识

服务器的标识id:“server id 1”



注意:

1、binlog事件中的时间戳是从语句那里继承过来的,一条语句产生多个事件,那这些事件的时间戳都是一样的,而且都是和第一个事件一致的;

2、有时候我们会在binlog中发现执行语句和提交时间不一致的情况,是因为有些事务是自动提交的,在这个事务中只有一条语句执行了一定的时间;


innodb中rowid对binlog的影响:

1、在galera cluster上面最好不要让一个事务更新太多的数据,可以适当控制在1万行以内,都是么有问题的,因为galera cluster的验证和提交都是串行    的,一个事务太大,会导致集群其他事务都等待这个事务完成造成集群假死现象;

2、在innodb中如果没有指定主键,就会创建一个rowid,但是MySQL的binlog是server层,而innodb中的rowid是存储引擎的东西,server层根本感知不到      rowid的存在;

3、rowid是innodb自己定义的一个列,只有在表中没有定义主键的时候,系统才会给这个表加上这一列,但这一列只是为了存储,构成一个聚簇索引,但不    会暴露给逻辑层,并且上层也用不到它,所以直接忽略它即可;

4、在MySQL数据库的使用中,一定要定义主键,如果没有主键,并且是row模式的复制,就必然会造成这样的问题,而不像其他数据库一样,如果没有主键,    还可以使用rowid来操作表;

5、在galera cluster中,更要定义主键。如果没有定义,必然会造成故障,这不是galera cluster的问题,只是它会把这个问题放大而已;














本文转自一个笨小孩51CTO博客,原文链接http://blog.51cto.com/fengfeng688/1951160: ,如需转载请自行联系原作者




相关实践学习
每个IT人都想学的“Web应用上云经典架构”实战
本实验从Web应用上云这个最基本的、最普遍的需求出发,帮助IT从业者们通过“阿里云Web应用上云解决方案”,了解一个企业级Web应用上云的常见架构,了解如何构建一个高可用、可扩展的企业级应用架构。
MySQL数据库入门学习
本课程通过最流行的开源数据库MySQL带你了解数据库的世界。   相关的阿里云产品:云数据库RDS MySQL 版 阿里云关系型数据库RDS(Relational Database Service)是一种稳定可靠、可弹性伸缩的在线数据库服务,提供容灾、备份、恢复、迁移等方面的全套解决方案,彻底解决数据库运维的烦恼。 了解产品详情: https://www.aliyun.com/product/rds/mysql 
相关文章
|
3月前
|
SQL 运维 关系型数据库
深入探讨MySQL的二进制日志(binlog)选项
总结而言,对MySQL binlogs深度理解并妥善配置对数据库运维管理至关重要;它不仅关系到系统性能优化也是实现高可靠性架构设计必须考虑因素之一。通过精心规划与周密部署可以使得该机能充分发挥作用而避免潜在风险带来影响。
144 6
|
4月前
|
存储 SQL 关系型数据库
MySQL中binlog、redolog与undolog的不同之处解析
每个都扮演回答回溯与错误修正机构角色: BinLog像历史记载员详细记载每件大大小小事件; RedoLog则像紧急救援队伍遇见突發情況追踪最后活动轨迹尽力补救; UndoLog就类似时间机器可倒带历史让一切归位原始样貌同时兼具平行宇宙观察能让多人同时看见各自期望看见历程而互不干扰.
253 9
|
5月前
|
存储 SQL 关系型数据库
MySQL的Redo Log与Binlog机制对照分析
通过合理的配置和细致的管理,这两种日志机制相互配合,能够有效地提升MySQL数据库的可靠性和稳定性。
209 10
|
7月前
|
SQL 监控 关系型数据库
MySQL日志分析:binlog、redolog、undolog三大日志的深度探讨。
数据库管理其实和写小说一样,需要规划,需要修订,也需要有能力回滚。理解这些日志的作用与优化,就像把握写作工具的使用与运用,为我们的数据库保驾护航。
332 23
|
8月前
|
SQL 运维 关系型数据库
MySQL Binlog 日志查看方法及查看内容解析
本文介绍了 MySQL 的 Binlog(二进制日志)功能及其使用方法。Binlog 记录了数据库的所有数据变更操作,如 INSERT、UPDATE 和 DELETE,对数据恢复、主从复制和审计至关重要。文章详细说明了如何开启 Binlog 功能、查看当前日志文件及内容,并解析了常见的事件类型,包括 Format_desc、Query、Table_map、Write_rows、Update_rows 和 Delete_rows 等,帮助用户掌握数据库变化历史,提升维护和排障能力。
|
9月前
|
存储 SQL 关系型数据库
mysql的undo log、redo log、bin log、buffer pool
MySQL的undo log、redo log、bin log和buffer pool是确保数据库高效、安全和可靠运行的关键组件。理解这些组件的工作原理和作用,对于优化数据库性能和保障数据安全具有重要意义。通过适当的配置和优化,可以显著提升MySQL的运行效率和数据可靠性。
198 4
|
9月前
|
SQL 存储 关系型数据库
简单聊聊MySQL的三大日志(Redo Log、Binlog和Undo Log)各有什么区别
在MySQL数据库管理中,理解Redo Log(重做日志)、Binlog(二进制日志)和Undo Log(回滚日志)至关重要。Redo Log确保数据持久性和崩溃恢复;Binlog用于主从复制和数据恢复,记录逻辑操作;Undo Log支持事务的原子性和隔离性,实现回滚与MVCC。三者协同工作,保障事务ACID特性。文章还详细解析了日志写入流程及可能的异常情况,帮助深入理解数据库日志机制。
1156 0
|
3月前
|
缓存 关系型数据库 BI
使用MYSQL Report分析数据库性能(下)
使用MYSQL Report分析数据库性能
168 3
|
3月前
|
关系型数据库 MySQL 数据库
自建数据库如何迁移至RDS MySQL实例
数据库迁移是一项复杂且耗时的工程,需考虑数据安全、完整性及业务中断影响。使用阿里云数据传输服务DTS,可快速、平滑完成迁移任务,将应用停机时间降至分钟级。您还可通过全量备份自建数据库并恢复至RDS MySQL实例,实现间接迁移上云。
|
3月前
|
关系型数据库 MySQL 数据库
阿里云数据库RDS费用价格:MySQL、SQL Server、PostgreSQL和MariaDB引擎收费标准
阿里云RDS数据库支持MySQL、SQL Server、PostgreSQL、MariaDB,多种引擎优惠上线!MySQL倚天版88元/年,SQL Server 2核4G仅299元/年,PostgreSQL 227元/年起。高可用、可弹性伸缩,安全稳定。详情见官网活动页。
836 152

推荐镜像

更多