前言
MySQL自带主从同步机制,安装了MySQL的设备可以通过设置相关参数来实现主从数据库的同步功能。
设置MySQL主从有什么好处?
- 类似于集群的好处,提高可用性、性能、容错性等。
- 读写分离
- 负载均衡
主从用什么模式?
通常一主一从,或者一主多从。
主服务器只负责写,而从服务器只负责读,从而提高了效率减轻压力。
主从复制原理
- 主数据库更新 ,即执行update、 insert、 delete操作 时,主数据库会通过 io-thread将操作逻辑写到 binlog;
- 从库会向主库请求读取 binlog,主库会通过 log dump线程将binlog内容发给从库。
- 从库即通过io-thread线程将收到更新的binlog写入从库本地 relay-log(中继日志)中;
- 从库最终会通过 sql-thread 读取 relay-log,解析其中的内容成具体的操作执行,最终保证主从数据一致;
数据同步方式
在同步过程中传递的binlog数据可以有两种方式:语句和行数据两种。
语句复制
即 整个主从复制流程中传递的是操作记录,而不是数据库数据。因此在复杂到从数据库后还需要从数据库执行一遍操作指令,才能最终将数据结果同步到磁盘中。
优点:
- 可以减少数据传输量和复制延迟,提高主从复制的效率(因为传数据的话需要传整个库)。
- 设表里有一百万条数据,一条sql更新了所有表,基于语句的复制仅需要发送一条sql,而基于行的复制需要发送一百万条更新记录
缺点:
- 可能出现警告导致不能被正确复制
- Insert … select语句会执行大量的行级锁表
- Update语句会执行大量的行级锁表来扫描整个表
在mysql5.6中默认使用的是语句复制模式
行数据复制
即更新实际库中的每一行数据。这样导致复制的压力比较大,日志占用的空间大,传输带宽占用大。但是这种方式比基于语句的复制要更加精确。
优点:
- 不需要执行查询计划。
- 不知道执行的到底是什么语句。
- 例如一条更新用户总积分的语句,需要统计用户的所有积分再写入用户表。如果是基于语句复制的话,从库需要再一次统计用户的积分,而基于行复制就直接更新记录,无需再统计用户积分。
缺点:
- 日志会很大
同步模式
MySQL支持异步复制、同步复制、半同步复制。
异步复制
这种模式下,主节点不会主动推送数据到从节点,主库在执行完客户端提交的事务后会立即将结果返给给客户端,并不关心从库是否已经接收并处理。
这样就会有一个问题,主节点如果崩溃掉了,此时主节点上已经提交的事务可能并没有传到从节点上,如果此时,强行将从提升为主,可能导致新主节点上的数据不完整。
同步复制
在 MySQL cluster 中特有的复制方式。
当主库执行完一个事务,然后所有的从库都复制了该事务并成功执行完才返回成功信息给客户端。
因为需要等待所有从库执行完该事务才能返回成功信息,所以全同步复制的性能必然会收到严重的影响。
半同步复制
在异步复制的基础上,确保任何一个主库上的事物在提交之前至少有一个从库已经收到该事物并日志记录下来。
介于异步复制和全同步复制之间,主库在执行完客户端提交的事务后不是立刻返回给客户端,而是等待至少一个从库接收到并写到 relay log 中才返回成功信息给客户端(只能保证主库的 Binlog 至少传输到了一个从节点上),否则需要等待直到超时时间然后切换成异步模式再提交。
相对于异步复制,半同步复制提高了数据的安全性,一定程度的保证了数据能成功备份到从库,同时它也造成了一定程度的延迟,但是比全同步模式延迟要低,这个延迟最少是一个 TCP/IP 往返的时间。所以,半同步复制最好在低延时的网络中使用。
详细内容参考