mysql 主从复制与读写分离

本文涉及的产品
RDS MySQL Serverless 基础系列,0.5-2RCU 50GB
RDS MySQL Serverless 高可用系列,价值2615元额度,1个月
简介: mysql 主从复制与读写分离

一      主从复制概念介绍

1,mysq支持的复制类型

(1)STATEMENT:基于语句的复制。在服务器上执行sql语句,在从服务器上执行同样的语句,mysql默认采用基于语句的复制,执行效率高。

(2)ROW:基于行的复制。把改变的内容复制过去,而不是把命令在从服务器上执行一遍。

(3)MIXED:混合类型的复制。默认采用基于语句的复制,一旦发现基于语句无法精确复制时,就会采用基于行的复制。

2,主从复制原理

为什么复制?保证数据的完整性

谁复制谁 ?slave角色复制 master角色的数据

数据放在什么地方? 二进制文件 mysql-bin-000001--->记录完整的sql    slave复制二进制文件到本地节点,保存为中继日志文件方式       最后基于这个中继日志 进行恢复 操作 将执行的sql 同步到自己的数据库当中,达到与master 数据一致性

3, 主从复制过程

3.1主从复制架构图

3.2  文字描述

(1)Master节点将数据的改变记录成二进制日志(bin log),当Master上的数据发生改变时,则将其改变写入二进制日志中。

(2)Slave节点会在一定时间间隔内对Master的二进制日志进行探测其是否发生改变,如果发生改变,则开始一个I/O线程请求 Master的二进制事件。

(3)同时Master节点为每个I/O线程启动一个dump线程,用于向其发送二进制事件,并保存至Slave节点本地的中继日志(Relay log)中,Slave节点将启动SQL线程从中继日志中读取二进制日志,在本地重放,即解析成 sql 语句逐一执行,使得其数据和 Master节点的保持一致,最后I/O线程和SQL线程将进入睡眠状态,等待下一次被唤醒。

注:

●中继日志通常会位于 OS 缓存中,所以中继日志的开销很小。
●复制过程有一个很重要的限制,即复制在 Slave上是串行化的,也就是说 Master上的并行更新操作不能在 Slave上并行操作。

3.3 简单理解

两个日志  三个线程

二进制日志(主): 存增删改查

中继日志(从):专门存主服务器过来的二进制日志

dump  线程(主) :会探测二进制文件是否更新 若更新    会告知 从服务器 io 线程

io 线程(从):从服务器io 线程发送请求  dump 线程把二进制日志搬 过去

sql 线程(从):ql 线程读取      中继日志       存放到磁盘

4,MySQL主从复制延迟 原因

①,master服务器高并发,形成大量事务

②、网络延迟

③、主从硬件设备导致

(cpu主频、内存io、硬盘io)

④、本来就不是同步复制、而是异步复制

5,解决MySQL主从复制延迟

① 从库优化Mysql参数。比如增大innodb_buffer_pool_size,(缓存的意思)让更多操作在Mysql内存中完成,减少磁盘操作。

②,从库使用高性能主机。包括cpu强悍、内存加大。避免使用虚拟云主机,使用物理主机,这样提升了i/o方面性。

③,从库使用SSD磁盘

④,网络优化,避免跨机房实现同步

 

二      读写分离概念介绍

1,什么是读写分离

读写分离,基本的原理是让主数据库处理事务性增、改、删操作(INSERT、UPDATE、DELETE),而从数据库处理SELECT查询操作。数据库复制被用来把事务性操作导致的变更同步到集群中的从数据库。

(主服务器只写  一台或多台从服务器做读)

2,为什么要读写分离

因为数据库的“写”(写10000条数据可能要3分钟)操作是比较耗时的。

但是数据库的“读”(读10000条数据可能只要5秒钟)。

所以读写分离,解决的是,数据库的写入,影响了查询的效率。

3,什么时候要读写分离

数据库不一定要读写分离,如果程序使用数据库较多时,而更新少,查询多的情况下会考虑使用。利用数据库主从同步,再通过读写分离可以分担数据库压力,提高性能。

4,生产环境的必要性

在实际的生产环境中,对数据库的读和写都在同一个数据库服务器中,是不能满足实际需求的。无论是在安全性、高可用性还是高并发等各个方面都是完全不能满足实际需求的。因此,通过主从复制的方式来同步数据,再通过读写分离来提升数据库的并发负载能力。有点类似于rsync,但是不同的是rsync是对磁盘文件做备份,mysql主从复制是对数据库中的数据、语句做备份。

5,目前较为常见的 MySQL 读写分离

1)基于程序代码内部实现

在代码中根据 select、insert 进行路由分类,这类方法也是目前生产环境应用最广泛的。

优点是性能较好,因为在程序代码中实现,不需要增加额外的设备为硬件开支;缺点是需要开发人员来实现,运维人员无从下手。

但是并不是所有的应用都适合在程序代码中实现读写分离,像一些大型复杂的Java应用,如果在程序代码中实现读写分离对代码改动就较大。

2)基于中间代理层实现

代理一般位于客户端和服务器之间,代理服务器接到客户端请求后通过判断后转发到后端数据库,有以下代表性程序。

(1)MySQL-Proxy。MySQL-Proxy 为 MySQL 开源项目,通过其自带的 lua 脚本进行SQL 判断。

(2)Atlas。是由奇虎360的Web平台部基础架构团队开发维护的一个基于MySQL协议的数据中间层项目。它是在mysql-proxy 0.8.2版本的基础上,对其进行了优化,增加了一些新的功能特性。360内部使用Atlas运行的mysql业务,每天承载的读写请求数达几十亿条。支持事物以及存储过程。

(3)Amoeba。由陈思儒开发,作者曾就职于阿里巴巴。该程序由Java语言进行开发,阿里巴巴将其用于生产环境。但是它不支持事务和存储过程。

(4)mycat(生产环境用的比较多)

6,中间键Amoeba 的优势

由于使用MySQL Proxy 需要写大量的Lua脚本,这些Lua并不是现成的,而是需要自己去写。这对于并不熟悉MySQL Proxy 内置变量和MySQL Protocol 的人来说是非常困难的。

Amoeba是一个非常容易使用、可移植性非常强的软件。因此它在生产环境中被广泛应用于数据库的代理层。

 

三     实验模拟mysql 主从复制

1,实验环境

99机器 为主 服务器   77,88 为两台从服务器

2,实验步骤

2.1 做好实验准备

第一步关闭所有机器防火墙

第二步将三台主机改名方便识别

2.2 主从服务器时间同步

99主服务器:

安装时间同步 软件

写配置文件 (末尾添加)

启动 ntpd

77,88从服务器:

下载 ntpdate

进行时间同步  先开启ntpd

再绝对路径执行ntpdate 加 主服务器的ip

做计划任务  让从一直时间同步

crontab -e

2.3 更改主服务器的 mysql配置文件

99主服务器

vim /etc/my.cn

2.4  创建从服务器 账号并授权

99 服务器

给从服务器授权  注意网段

刷新权限

显示主服务器 状态

2.5  更改从服务器的 mysql配置文件

77,88 从服务器

第一步

写配置文件 vim /etc/my.cnf

第二步

systemctl restart mysqld

第三步

登录mysql  配置同步 注意 master_log_file 和 master_log_pos 的值要与Master查询的一致

偏移量要和主服务器查询的一致  二进制文件名也是

解释:连接主人

(主人是谁 用户什么 拿什么文件 偏移量)

第四步

#启动同步,如有报错执行 reset slave;

第五步

show slave status\G                    #查看 Slave 状态

//确保 IO 和 SQL 线程都是 Yes,代表同步正常。

2.6  验证主从复制效果

99 服务机 创建一个库

在从  服务器能看到

四     实验模拟msql  读写分离

1, 实验环境

99 为mysql 主服务器      77,88 为mysql 从服务器    66为Amoeba 服务器

55 为客户机

2,66 服务器安装Amoeba

2.1 先安装jdk

获得两个安装包

安装jdk   (java 软件的虚拟环境)

cp jdk-6u14-linux-x64.bin /usr/local/
#把二进制jdk 拖到 usr/bin
 
cd /usr/local/
chmod +x jdk-6u14-linux-x64
#加执行权限
 
./jdk-6u14-linux-x64.bin
#按yes,按enter   开始安装
 
mv jdk1.6.0_14/ /usr/local/jdk1.6
#改名  方便后续操作

vim /etc/profile

环境变量

刷新环境变量  

查看java虚拟环境版本

2.2 再安装amoeba

解压压缩包

加权限 并执行     如显示amoeba start|stop说明安装成功

2.3  开放 Amoeba访问数据库权限

Master、Slave1、Slave2 的mysql上开放权限给 Amoeba 访问

2.4  配置 Amoeba读写分离,两个 Slave 读负载均衡

(修改amoebap配置文件与数据库配置文件)

找到amoeba 的配置文件    先备份

vim amoeba.xml  #修改amoeba配置文件

修改 30  32行   注意这边很容易改错

修改115 117 行

java软件配置文件中 <!--    --> 中间的内容是注释

备份数据库配置文件

修改数据库配置文件

将23行注释   改26行

28到30行 去掉注释 修改密码

45--修改,设置主服务器的名Master   并写上主服务器ip

52--修改,设置从服务器的名slave1  -55--修改,设置从服务器1的地址

同理 写上设置从服务器的名slave2  和他的地址

-65行--修改     71行--修改

后台启动   并查看8066端口是否开启,默认端口为TCP 8066

3  测试读写分离

3.1     55 客户机安装mariadb

yum install -y mariadb-server mariadb

systemctl start mariadb.service

 

通过maridb    登录mysql

//通过amoeba服务器代理访问mysql ,在通过客户端连接mysql后写入的数据只有主服务会记录,然后同步给从--从服务器

3.2  主服务器插数据

在99主服务器上:创建一个表并插入数据3

3.3 从服务器 关闭同步并插数据

在两台从服务器上:

stop slave;                                            #关闭同步

分别插入数据

3.4 显示读写分离

客户端服务器:

select * from test;        //客户端会分别向slave1和slave2读取数据,显示的只有在两个从服务器上添加的数据,没有在主服务器上添加的数据

3.5 显示同步

在两个从服务器上执行 start slave; 即可实现同步在主服务器上添加的数据

五  实验总结

主服务器 用来写数据   从服务器用来读数据   主服务器会把数据同步给从服务器

当关闭同步   只能看到从服务器的数据,说明读写分离

当开启同步, 能看到主服务器加写在从服务器的数据  说明主服务器会把数据同步给从服务器

一般 Slave_IO_Running: No 的可能性

1、网络不通
2、my.cnf配置有问题
3、密码、file文件名、pos偏移量不对
4、防火墙没有关闭

5,主 服务器和从服务器编号有冲突

六  总结

1、主从同步复制原理

(1)Master节点将数据的改变记录成二进制日志(bin log),当Master上的数据发生改变时,则将其改变写入二进制日志中。

(2)Slave节点会在一定时间间隔内对Master的二进制日志进行探测其是否发生改变,如果发生改变,则开始一个I/O线程请求 Master的二进制事件。

(3)同时Master节点为每个I/O线程启动一个dump线程,用于向其发送二进制事件,并保存至Slave节点本地的中继日志(Relay log)中,Slave节点将启动SQL线程从中继日志中读取二进制日志,在本地重放,即解析成 sql 语句逐一执行,使得其数据和 Master节点的保持一致,最后I/O线程和SQL线程将进入睡眠状态,等待下一次被唤醒。

2,读写分离常用使用什么方式?

amoeba 代理 mycat 代码 sql_proxy

通过amoeba代理服务器,实现只在主服务器上写,只在从服务器上读;

主数据库处理事务性查询,从数据库处理select 查询;

数据库复制被用来把事务查询导致的变更同步的集群中的从数据库

 

3,如何查看主从同步状态是否成功

在从服务器上内输入 show slave status\G 查看主从信息查看里面有IO线程的状态信息,还有master服务器的IP地址、端口事务开始号。

当 Slave_IO_Running和Slave_SQL_Running都是YES时 ,表示主从同步状态成功

 

4,如果I/O不是yes呢,如何排查?

首先排查网络问题,使用ping 命令查看从服务器是否能与主服务器通信

再查看防火墙和核心防护是否关闭(增强功能)

接着查看从服务slave是否开启

两个从服务器的server-id 是否相同导致只能连接一台

master_log_file master_log_pos的值跟master值是否一致

 

5,show slave status能看到哪些信息

IO线程的状态信息
master服务器的IP地址、端口、事务开始的位置
最近一次的错误信息和错误位置
最近一次的I/O报错信息和ID
最近一次的SQL报错信息和id

 

6,主从复制慢(延迟)会有哪些可能?怎么解决?

主服务器的负载过大,被多个睡眠或 僵尸线程占用  导致系统负载过大,从库硬件比主库差,导致复制延迟

主从复制单线程,如果主库写作并发太大,来不及传送到从库,就会到导致延迟

慢sql语句过多

网络延迟

7,mysql主从复制 版本问题

若主从版本不一致,从的版本一定要高于主,保证可以向下兼容

因为若主的版本更新,低版本的从无法兼容的。

 

七   mysql 备份与主从复制

笔者在配置    从服务器的配置文件后,有一步操作

这是  在从服务器上    同步主服务器的步骤

此处有指定的二进制文件 000001  

此时我会疑惑,如果主 服务器发生备份,二进制文件会生成新的00002 00003 等等

那dump 线程还能正确的将数据传给从服务器吗?  (因为这边只指定了00001)

开始实验:

刷新主服务器的   二进制文件  可以看到有新的二进制文件生成

主  服务器插入一个新的数据  备注002

然后我们再  用客户机访问   可以发现哪怕主备份了   不影响主从复制  和读写分离

相关实践学习
基于CentOS快速搭建LAMP环境
本教程介绍如何搭建LAMP环境,其中LAMP分别代表Linux、Apache、MySQL和PHP。
全面了解阿里云能为你做什么
阿里云在全球各地部署高效节能的绿色数据中心,利用清洁计算为万物互联的新世界提供源源不断的能源动力,目前开服的区域包括中国(华北、华东、华南、香港)、新加坡、美国(美东、美西)、欧洲、中东、澳大利亚、日本。目前阿里云的产品涵盖弹性计算、数据库、存储与CDN、分析与搜索、云通信、网络、管理与监控、应用服务、互联网中间件、移动服务、视频服务等。通过本课程,来了解阿里云能够为你的业务带来哪些帮助 &nbsp; &nbsp; 相关的阿里云产品:云服务器ECS 云服务器 ECS(Elastic Compute Service)是一种弹性可伸缩的计算服务,助您降低 IT 成本,提升运维效率,使您更专注于核心业务创新。产品详情: https://www.aliyun.com/product/ecs
相关文章
|
7天前
|
SQL 运维 关系型数据库
MySQL数据库运维第一篇(日志与主从复制)
MySQL数据库运维第一篇(日志与主从复制)
|
21天前
|
SQL 负载均衡 关系型数据库
mysql主从复制,从搭建到使用
mysql主从复制,从搭建到使用
26 1
|
21天前
|
SQL 监控 关系型数据库
探秘MySQL主从复制的多种实现方式
探秘MySQL主从复制的多种实现方式
14 0
|
8天前
|
存储 关系型数据库 MySQL
Java大佬必知必会——MySQL主从复制
如果你现在有两台MySQL,一台版本是03年的MySQL5.0,另一台是18年的MySQL8.0.11。新版本可以作为老版本的从服务器,但反过来是不可行的。如果二进制文件包含了已存在的数据,就会造成数据重复了。如果从服务器复制该二进制文件后的数据库状态是混乱无序的,那整个复制的过程就没有意义了。如果主、从服务器存储数据的顺序不一样,就会导致每次执行删除的数据都是不同的。,老版本可能无法解析新版本的新特性,甚至复制的文件格式都差异太大。MySQL从库只会复制它本身缺失的最新数据,利用二进制文件里的。
107 3
Java大佬必知必会——MySQL主从复制
|
1天前
|
SQL 关系型数据库 MySQL
MySQL高可用架构设计:从主从复制到分布式集群
MySQL高可用性涉及主从复制、半同步复制和Group/InnoDB Cluster。主从复制通过二进制日志同步数据,保证故障时可切换。半同步复制确保事务在至少一个从服务器确认后才提交。Group Replication是多主复制,支持自动故障切换。InnoDB Cluster是8.0的集成解决方案,简化集群管理。使用这些技术能提升数据库的稳定性和可靠性。
89 2
|
4天前
|
关系型数据库 MySQL
mysql-proxy实现mysql的读写分离
mysql-proxy实现mysql的读写分离
|
7天前
|
负载均衡 关系型数据库 MySQL
MySQL 主主复制与主从复制对比
MySQL的主主复制和主从复制是两种常见的数据库复制配置方式,各有优缺点和适用场景。以下是对这两种复制方式的详细对比: ### 主从复制 (Master-Slave Replication) **特点:** 1. **单向复制**:数据从主服务器复制到一个或多个从服务器。从服务器只能从主服务器接收数据更新,不能向主服务器发送数据。 2. **读写分离**:主服务器处理写操作(INSERT、UPDATE、DELETE),从服务器处理读操作(SELECT),可以分担读负载,提高系统的整体性能。 3. **数据一致性**:数据在主服务器上是最新的,从服务器上可能会有一定的延迟。 **优点:**
|
1月前
|
运维 负载均衡 关系型数据库
MySQL高可用解决方案演进:从主从复制到InnoDB Cluster架构
MySQL高可用解决方案演进:从主从复制到InnoDB Cluster架构
|
1月前
|
SQL canal 运维
MySQL高可用架构探秘:主从复制剖析、切换策略、延迟优化与架构选型
MySQL高可用架构探秘:主从复制剖析、切换策略、延迟优化与架构选型
|
1月前
|
负载均衡 关系型数据库 MySQL
MySQL读写分离技术深度解析
在高并发、大数据量的互联网应用环境中,数据库作为数据存储的核心组件,其性能直接影响着整个系统的运行效率。MySQL作为最常用的开源关系型数据库之一,虽然功能强大,但在处理大量并发读写请求时,单点服务器的性能瓶颈逐渐显现。为了解决这一问题,MySQL读写分离技术应运而生,成为提升数据库性能、实现负载均衡的有效手段。