一 主从复制概念介绍
1,mysq支持的复制类型
(1)STATEMENT:基于语句的复制。在服务器上执行sql语句,在从服务器上执行同样的语句,mysql默认采用基于语句的复制,执行效率高。
(2)ROW:基于行的复制。把改变的内容复制过去,而不是把命令在从服务器上执行一遍。
(3)MIXED:混合类型的复制。默认采用基于语句的复制,一旦发现基于语句无法精确复制时,就会采用基于行的复制。
2,主从复制原理
为什么复制?保证数据的完整性
谁复制谁 ?slave角色复制 master角色的数据
数据放在什么地方? 二进制文件 mysql-bin-000001--->记录完整的sql slave复制二进制文件到本地节点,保存为中继日志文件方式 最后基于这个中继日志 进行恢复 操作 将执行的sql 同步到自己的数据库当中,达到与master 数据一致性
3, 主从复制过程
3.1主从复制架构图
3.2 文字描述
(1)Master节点将数据的改变记录成二进制日志(bin log),当Master上的数据发生改变时,则将其改变写入二进制日志中。
(2)Slave节点会在一定时间间隔内对Master的二进制日志进行探测其是否发生改变,如果发生改变,则开始一个I/O线程请求 Master的二进制事件。
(3)同时Master节点为每个I/O线程启动一个dump线程,用于向其发送二进制事件,并保存至Slave节点本地的中继日志(Relay log)中,Slave节点将启动SQL线程从中继日志中读取二进制日志,在本地重放,即解析成 sql 语句逐一执行,使得其数据和 Master节点的保持一致,最后I/O线程和SQL线程将进入睡眠状态,等待下一次被唤醒。
注:
●中继日志通常会位于 OS 缓存中,所以中继日志的开销很小。
●复制过程有一个很重要的限制,即复制在 Slave上是串行化的,也就是说 Master上的并行更新操作不能在 Slave上并行操作。
3.3 简单理解
两个日志 三个线程
二进制日志(主): 存增删改查
中继日志(从):专门存主服务器过来的二进制日志
dump 线程(主) :会探测二进制文件是否更新 若更新 会告知 从服务器 io 线程
io 线程(从):从服务器io 线程发送请求 dump 线程把二进制日志搬 过去
sql 线程(从):ql 线程读取 中继日志 存放到磁盘
4,MySQL主从复制延迟 原因
①,master服务器高并发,形成大量事务
②、网络延迟
③、主从硬件设备导致
(cpu主频、内存io、硬盘io)
④、本来就不是同步复制、而是异步复制
5,解决MySQL主从复制延迟
① 从库优化Mysql参数。比如增大innodb_buffer_pool_size,(缓存的意思)让更多操作在Mysql内存中完成,减少磁盘操作。
②,从库使用高性能主机。包括cpu强悍、内存加大。避免使用虚拟云主机,使用物理主机,这样提升了i/o方面性。
③,从库使用SSD磁盘
④,网络优化,避免跨机房实现同步
二 读写分离概念介绍
1,什么是读写分离
读写分离,基本的原理是让主数据库处理事务性增、改、删操作(INSERT、UPDATE、DELETE),而从数据库处理SELECT查询操作。数据库复制被用来把事务性操作导致的变更同步到集群中的从数据库。
(主服务器只写 一台或多台从服务器做读)
2,为什么要读写分离
因为数据库的“写”(写10000条数据可能要3分钟)操作是比较耗时的。
但是数据库的“读”(读10000条数据可能只要5秒钟)。
所以读写分离,解决的是,数据库的写入,影响了查询的效率。
3,什么时候要读写分离
数据库不一定要读写分离,如果程序使用数据库较多时,而更新少,查询多的情况下会考虑使用。利用数据库主从同步,再通过读写分离可以分担数据库压力,提高性能。
4,生产环境的必要性
在实际的生产环境中,对数据库的读和写都在同一个数据库服务器中,是不能满足实际需求的。无论是在安全性、高可用性还是高并发等各个方面都是完全不能满足实际需求的。因此,通过主从复制的方式来同步数据,再通过读写分离来提升数据库的并发负载能力。有点类似于rsync,但是不同的是rsync是对磁盘文件做备份,mysql主从复制是对数据库中的数据、语句做备份。
5,目前较为常见的 MySQL 读写分离
1)基于程序代码内部实现
在代码中根据 select、insert 进行路由分类,这类方法也是目前生产环境应用最广泛的。
优点是性能较好,因为在程序代码中实现,不需要增加额外的设备为硬件开支;缺点是需要开发人员来实现,运维人员无从下手。
但是并不是所有的应用都适合在程序代码中实现读写分离,像一些大型复杂的Java应用,如果在程序代码中实现读写分离对代码改动就较大。
2)基于中间代理层实现
代理一般位于客户端和服务器之间,代理服务器接到客户端请求后通过判断后转发到后端数据库,有以下代表性程序。
(1)MySQL-Proxy。MySQL-Proxy 为 MySQL 开源项目,通过其自带的 lua 脚本进行SQL 判断。
(2)Atlas。是由奇虎360的Web平台部基础架构团队开发维护的一个基于MySQL协议的数据中间层项目。它是在mysql-proxy 0.8.2版本的基础上,对其进行了优化,增加了一些新的功能特性。360内部使用Atlas运行的mysql业务,每天承载的读写请求数达几十亿条。支持事物以及存储过程。
(3)Amoeba。由陈思儒开发,作者曾就职于阿里巴巴。该程序由Java语言进行开发,阿里巴巴将其用于生产环境。但是它不支持事务和存储过程。
(4)mycat(生产环境用的比较多)
6,中间键Amoeba 的优势
由于使用MySQL Proxy 需要写大量的Lua脚本,这些Lua并不是现成的,而是需要自己去写。这对于并不熟悉MySQL Proxy 内置变量和MySQL Protocol 的人来说是非常困难的。
Amoeba是一个非常容易使用、可移植性非常强的软件。因此它在生产环境中被广泛应用于数据库的代理层。
三 实验模拟mysql 主从复制
1,实验环境
99机器 为主 服务器 77,88 为两台从服务器
2,实验步骤
2.1 做好实验准备
第一步关闭所有机器防火墙
第二步将三台主机改名方便识别
2.2 主从服务器时间同步
99主服务器:
安装时间同步 软件
写配置文件 (末尾添加)
启动 ntpd
77,88从服务器:
下载 ntpdate
进行时间同步 先开启ntpd
再绝对路径执行ntpdate 加 主服务器的ip
做计划任务 让从一直时间同步
crontab -e
2.3 更改主服务器的 mysql配置文件
99主服务器
vim /etc/my.cn
2.4 创建从服务器 账号并授权
99 服务器
给从服务器授权 注意网段
刷新权限
显示主服务器 状态
2.5 更改从服务器的 mysql配置文件
77,88 从服务器
第一步
写配置文件 vim /etc/my.cnf
第二步
systemctl restart mysqld
第三步
登录mysql 配置同步 注意 master_log_file 和 master_log_pos 的值要与Master查询的一致
偏移量要和主服务器查询的一致 二进制文件名也是
解释:连接主人
(主人是谁 用户什么 拿什么文件 偏移量)
第四步
#启动同步,如有报错执行 reset slave;
第五步
show slave status\G #查看 Slave 状态
//确保 IO 和 SQL 线程都是 Yes,代表同步正常。
2.6 验证主从复制效果
99 服务机 创建一个库
在从 服务器能看到
四 实验模拟msql 读写分离
1, 实验环境
99 为mysql 主服务器 77,88 为mysql 从服务器 66为Amoeba 服务器
55 为客户机
2,66 服务器安装Amoeba
2.1 先安装jdk
获得两个安装包
安装jdk (java 软件的虚拟环境)
cp jdk-6u14-linux-x64.bin /usr/local/ #把二进制jdk 拖到 usr/bin cd /usr/local/ chmod +x jdk-6u14-linux-x64 #加执行权限 ./jdk-6u14-linux-x64.bin #按yes,按enter 开始安装 mv jdk1.6.0_14/ /usr/local/jdk1.6 #改名 方便后续操作
vim /etc/profile
环境变量
刷新环境变量
查看java虚拟环境版本
2.2 再安装amoeba
解压压缩包
加权限 并执行 如显示amoeba start|stop说明安装成功
2.3 开放 Amoeba访问数据库权限
在Master、Slave1、Slave2 的mysql上开放权限给 Amoeba 访问
2.4 配置 Amoeba读写分离,两个 Slave 读负载均衡
(修改amoebap配置文件与数据库配置文件)
找到amoeba 的配置文件 先备份
vim amoeba.xml #修改amoeba配置文件
修改 30 32行 注意这边很容易改错
修改115 117 行
java软件配置文件中 <!-- --> 中间的内容是注释
备份数据库配置文件
修改数据库配置文件
将23行注释 改26行
28到30行 去掉注释 修改密码
45--修改,设置主服务器的名Master 并写上主服务器ip
52--修改,设置从服务器的名slave1 -55--修改,设置从服务器1的地址
同理 写上设置从服务器的名slave2 和他的地址
-65行--修改 71行--修改
后台启动 并查看8066端口是否开启,默认端口为TCP 8066
3 测试读写分离
3.1 55 客户机安装mariadb
yum install -y mariadb-server mariadb
systemctl start mariadb.service
通过maridb 登录mysql
//通过amoeba服务器代理访问mysql ,在通过客户端连接mysql后写入的数据只有主服务会记录,然后同步给从--从服务器
3.2 主服务器插数据
在99主服务器上:创建一个表并插入数据3
3.3 从服务器 关闭同步并插数据
在两台从服务器上:
stop slave; #关闭同步
分别插入数据
3.4 显示读写分离
客户端服务器:
select * from test; //客户端会分别向slave1和slave2读取数据,显示的只有在两个从服务器上添加的数据,没有在主服务器上添加的数据
3.5 显示同步
在两个从服务器上执行 start slave; 即可实现同步在主服务器上添加的数据
五 实验总结
主服务器 用来写数据 从服务器用来读数据 主服务器会把数据同步给从服务器
当关闭同步 只能看到从服务器的数据,说明读写分离
当开启同步, 能看到主服务器加写在从服务器的数据 说明主服务器会把数据同步给从服务器
一般 Slave_IO_Running: No 的可能性
1、网络不通
2、my.cnf配置有问题
3、密码、file文件名、pos偏移量不对
4、防火墙没有关闭
5,主 服务器和从服务器编号有冲突
六 总结
1、主从同步复制原理
(1)Master节点将数据的改变记录成二进制日志(bin log),当Master上的数据发生改变时,则将其改变写入二进制日志中。
(2)Slave节点会在一定时间间隔内对Master的二进制日志进行探测其是否发生改变,如果发生改变,则开始一个I/O线程请求 Master的二进制事件。
(3)同时Master节点为每个I/O线程启动一个dump线程,用于向其发送二进制事件,并保存至Slave节点本地的中继日志(Relay log)中,Slave节点将启动SQL线程从中继日志中读取二进制日志,在本地重放,即解析成 sql 语句逐一执行,使得其数据和 Master节点的保持一致,最后I/O线程和SQL线程将进入睡眠状态,等待下一次被唤醒。
2,读写分离常用使用什么方式?
amoeba 代理 mycat 代码 sql_proxy
通过amoeba代理服务器,实现只在主服务器上写,只在从服务器上读;
主数据库处理事务性查询,从数据库处理select 查询;
数据库复制被用来把事务查询导致的变更同步的集群中的从数据库
3,如何查看主从同步状态是否成功
在从服务器上内输入 show slave status\G 查看主从信息查看里面有IO线程的状态信息,还有master服务器的IP地址、端口事务开始号。
当 Slave_IO_Running和Slave_SQL_Running都是YES时 ,表示主从同步状态成功
4,如果I/O不是yes呢,如何排查?
首先排查网络问题,使用ping 命令查看从服务器是否能与主服务器通信
再查看防火墙和核心防护是否关闭(增强功能)
接着查看从服务slave是否开启
两个从服务器的server-id 是否相同导致只能连接一台
master_log_file master_log_pos的值跟master值是否一致
5,show slave status能看到哪些信息
IO线程的状态信息
master服务器的IP地址、端口、事务开始的位置
最近一次的错误信息和错误位置
最近一次的I/O报错信息和ID
最近一次的SQL报错信息和id
6,主从复制慢(延迟)会有哪些可能?怎么解决?
主服务器的负载过大,被多个睡眠或 僵尸线程占用 导致系统负载过大,从库硬件比主库差,导致复制延迟
主从复制单线程,如果主库写作并发太大,来不及传送到从库,就会到导致延迟
慢sql语句过多
网络延迟
7,mysql主从复制 版本问题
若主从版本不一致,从的版本一定要高于主,保证可以向下兼容
因为若主的版本更新,低版本的从无法兼容的。
七 mysql 备份与主从复制
笔者在配置 从服务器的配置文件后,有一步操作
这是 在从服务器上 同步主服务器的步骤
此处有指定的二进制文件 000001
此时我会疑惑,如果主 服务器发生备份,二进制文件会生成新的00002 00003 等等
那dump 线程还能正确的将数据传给从服务器吗? (因为这边只指定了00001)
开始实验:
刷新主服务器的 二进制文件 可以看到有新的二进制文件生成
主 服务器插入一个新的数据 备注002
然后我们再 用客户机访问 可以发现哪怕主备份了 不影响主从复制 和读写分离