状态快照转移:一种MySQL Galera集群较优的备份方法

本文涉及的产品
RDS MySQL Serverless 基础系列,0.5-2RCU 50GB
云数据库 RDS MySQL,集群系列 2核4GB
推荐场景:
搭建个人博客
RDS MySQL Serverless 高可用系列,价值2615元额度,1个月
简介:


作者介绍

王晶中国移动DBA,负责“移动云”业务系统的数据库集成架构设计、运维、优化等工作;擅长技术领域MySQL,获Oracle颁发的“MySQL DBA”官方认证,熟悉MySQL复制结构、MHA、cluster等多种架构及运维优化。

 

MySQL Galera Cluster是一套基于WSREP进行同步复制的集群解决方案,配置和使用相对简单,具有多节点同时提供读写、可用性高、强一致性和快速扩展的特点。由于它能够分担读写压力,且具有较强的数据一致性,因此在很多企业的生产环境得以应用。本文旨在说明一种适用于MySQL Galera集群的备份方案。

 

Galera集群说到底也是MySQL,因此也可以普通的数据库备份方法来备份cluster的节点数据。但普通的备份方法缺少GTID,也无法把MySQL节点恢复到预设某个时间点的状态。而且,一些备份程序运行时可能会阻断集群的正常业务操作。所以对于MySQL Galera集群,官网推荐采用状态快照转移的方式来备份。

 

从数据库本身的角度来说,通过state snapshot transfer对galera cluster的一个节点做备份和对单实例做一个完整的数据备份是非常相似的。这两种情况下,数据库节点都使用相同的机制,联合GTID和database状态来创建一个库内容的全备份。而所说的快照转移的方式备份,本质上就是用类似于快照转移的方式来触发一个脚本,这个脚本可以同时实现以上备份过程和galera仲裁者守护进程。(示例来自官网)

 

\

 

这条命令触发了donor节点,也就是备份的来源节点,去调用wsrep_sst_backup.sh脚本,通过环境变量的配置, mysqld进程可以找到这个脚本。donor节点会选取数据库没有任何变更进行的时候跑这个备份脚本,传递当前状态对应的GTID。上面的示例中‘gmcast.listen_addr=tcp://0.0.0.0:4444‘是一个仲裁监听socket地址,用来与cluster通讯的,默认是0.0.0.0:4567 。

 

当然,也可以不使用galera默认提供的这个脚本,当你不满足于这些进程提供的默认操作时(当一个节点发送或接收一个状态快照转移时,是通过跑一个独立于database server的外部进程来管理它的),galera cluster提供一个接口给用户shell 脚本来管理节点上的状态快照转移,自身也同时提供了一个普通脚本用于管理状态快照转移,你可以用它来作为创建自己脚本的基础起点。该脚本的文件名为wsrep_sst_common.sh。Linux下默认安装在/usr/bin。

 

wsrep_sst_common.sh这个SST脚本提供解析参数列表、错误记录等的现成功能。并且没有对参数顺序和数量的约束,可以根据自身情况增加或忽略某些参数。

 

它假定只有在状态转移之后,接收节点的存储引擎初始化才进行。意味着它直接拷贝源数据内容到目的数据目录。

 

当Galera cluster启动一个外部进程做状态快照转移时,会传递一些参数来配置状态转移脚本。常见的参数有以下几类:

 

1.通用参数:这些参数所有的状态转移脚本都会用到,无论发送还是接受节点。

 

  • role:区别donor或joiner

  • address:joiner的IP地址,joiner可以用wsrep_sst_receive_address这个参数来配

  • auth:权限信息,可通过wsrep_sst_auth参数来配

  • datadir:脚本所需的数据目录来源于mysql_real_data_home这个参数

  • defaults-file:my.cnf的路径

 

2.donor特有的参数:这些参数只被用于donor

 

  • gtid:节点给出的GTID来自于state UUID和sequence number或seqno

  • socket:如果需要,可以配置本地server的socket用于通信

  • bypass:节点用于甄别是否跳过实际数据的传输,只传递GTID,也就是说该节点是否应该启动增量状态传输

 

3.逻辑状态转移特有的参数:这些参数只被传递到发送和接收端的wsrep_sst_mysqldump.sh脚本中。

 

  • user:用来连接joiner和donor的数据库的用户,两边都应该一致,用wsrep_sst_auth参数来定义

  • password:用来连接joiner和donor的数据库的用户,两边都应该一致,用wsrep_sst_auth参数来定义

  • host:joiner的IP地址

  • port:joiner的端口

  • local-port:发送状态转移的端口

     

不管用默认的自带脚本,还是自己写脚本,启动的过程都是一样的。文件名必须是wsrep_sst_<name>.sh。name是wsrep_sst_methord参数的值。receiver接收并应用transfer完成之后,会输出接受节点的标准GTID,退出脚本,返回状态0,说明状态转移成功。sender在完成传输后,会发送一个done\n的信号,当脚本收到这个信号之后,会返回0值退出。

 

通过状态快照转移机制来调用buckups有以下几点好处:

 

  1. 节点可以在一个特定的时间点来启动备份,这个时间无需人工选择干预,数据库会自动选择一个没有任何影响数据库的变更执行的时间点。

  2. 这种备份方式会把GTID和备份相关联,对于可能发生的潜在数据丢失或损坏故障,便于使用GTID进行修复。

  3. 备份时节点与cluster不再保持同步,避免做备份时影响带宽性能,备份进程更不会阻断节点。

  4. 集群能够自主判断某个节点正在执行备份,就不会选这个节点再作为另一个节点的donor。

本文来自云栖社区合作伙伴"DBAplus",原文发布时间:2016-09-01

相关实践学习
如何在云端创建MySQL数据库
开始实验后,系统会自动创建一台自建MySQL的 源数据库 ECS 实例和一台 目标数据库 RDS。
全面了解阿里云能为你做什么
阿里云在全球各地部署高效节能的绿色数据中心,利用清洁计算为万物互联的新世界提供源源不断的能源动力,目前开服的区域包括中国(华北、华东、华南、香港)、新加坡、美国(美东、美西)、欧洲、中东、澳大利亚、日本。目前阿里云的产品涵盖弹性计算、数据库、存储与CDN、分析与搜索、云通信、网络、管理与监控、应用服务、互联网中间件、移动服务、视频服务等。通过本课程,来了解阿里云能够为你的业务带来哪些帮助 &nbsp; &nbsp; 相关的阿里云产品:云服务器ECS 云服务器 ECS(Elastic Compute Service)是一种弹性可伸缩的计算服务,助您降低 IT 成本,提升运维效率,使您更专注于核心业务创新。产品详情: https://www.aliyun.com/product/ecs
目录
相关文章
|
2月前
|
存储 关系型数据库 MySQL
环比、环比增长率、同比、同比增长率 ,占比,Mysql 8.0 实例(最简单的方法之一)(sample database classicmodels _No.2 )
环比、环比增长率、同比、同比增长率 ,占比,Mysql 8.0 实例(最简单的方法之一)(sample database classicmodels _No.2 )
131 1
|
2月前
|
分布式计算 关系型数据库 MySQL
大数据-88 Spark 集群 案例学习 Spark Scala 案例 SuperWordCount 计算结果数据写入MySQL
大数据-88 Spark 集群 案例学习 Spark Scala 案例 SuperWordCount 计算结果数据写入MySQL
54 3
|
2月前
|
消息中间件 分布式计算 关系型数据库
大数据-140 - ClickHouse 集群 表引擎详解5 - MergeTree CollapsingMergeTree 与其他数据源 HDFS MySQL
大数据-140 - ClickHouse 集群 表引擎详解5 - MergeTree CollapsingMergeTree 与其他数据源 HDFS MySQL
56 0
|
1月前
|
关系型数据库 MySQL Linux
Linux环境下MySQL数据库自动定时备份实践
数据库备份是确保数据安全的重要措施。在Linux环境下,实现MySQL数据库的自动定时备份可以通过多种方式完成。本文将介绍如何使用`cron`定时任务和`mysqldump`工具来实现MySQL数据库的每日自动备份。
80 3
|
1月前
|
监控 关系型数据库 MySQL
Linux环境下MySQL数据库自动定时备份策略
在Linux环境下,MySQL数据库的自动定时备份是确保数据安全和可靠性的重要措施。通过设置定时任务,我们可以每天自动执行数据库备份,从而减少人为错误和提高数据恢复的效率。本文将详细介绍如何在Linux下实现MySQL数据库的自动定时备份。
39 3
|
1月前
|
关系型数据库 MySQL
Mysql 中日期比较大小的方法有哪些?
在 MySQL 中,可以通过多种方法比较日期的大小,包括使用比较运算符、NOW() 函数、DATEDIFF 函数和 DATE 函数。这些方法可以帮助你筛选出特定日期范围内的记录,确保日期格式一致以避免错误。
|
2月前
|
SQL 分布式计算 关系型数据库
Hadoop-24 Sqoop迁移 MySQL到Hive 与 Hive到MySQL SQL生成数据 HDFS集群 Sqoop import jdbc ETL MapReduce
Hadoop-24 Sqoop迁移 MySQL到Hive 与 Hive到MySQL SQL生成数据 HDFS集群 Sqoop import jdbc ETL MapReduce
96 0
|
2月前
|
SQL 分布式计算 关系型数据库
Hadoop-23 Sqoop 数据MySQL到HDFS(部分) SQL生成数据 HDFS集群 Sqoop import jdbc ETL MapReduce
Hadoop-23 Sqoop 数据MySQL到HDFS(部分) SQL生成数据 HDFS集群 Sqoop import jdbc ETL MapReduce
43 0
|
2月前
|
SQL 分布式计算 关系型数据库
Hadoop-22 Sqoop 数据MySQL到HDFS(全量) SQL生成数据 HDFS集群 Sqoop import jdbc ETL MapReduce
Hadoop-22 Sqoop 数据MySQL到HDFS(全量) SQL生成数据 HDFS集群 Sqoop import jdbc ETL MapReduce
56 0
|
8天前
|
关系型数据库 MySQL 数据库
Python处理数据库:MySQL与SQLite详解 | python小知识
本文详细介绍了如何使用Python操作MySQL和SQLite数据库,包括安装必要的库、连接数据库、执行增删改查等基本操作,适合初学者快速上手。
71 15