开发者社区> tplinux> 正文

基于MGR高可用异地多活方案

简介: 主要目的实现MySQL高可用解决方案,实现异地多活。
+关注继续查看

一.概述
主要目的实现MySQL高可用解决方案,实现异地多活。
二.实现构思
_1

基于MGR实现高可用异地多活
首先要基于位置信息进行分片,例如华北 华中,华南,程序层要进行ip过滤和判断,
针对不同的ip 写入到不同的分片集合中,每张表需要有一个地理位置字段。
例如获得ip为华北,
Create table xx(
id int,
Name varchar(111),
Position int)
华北 表示为0
华中表示为1
华南表示为2
根据Position 字段进行分片。
其次可以根据时间维度或者用户id,或者其他分片规则进行二次分片。
要具备二次分片的能力

每个分片节点需要提供2个slave。用于分担读请求的压力。

三.故障处理

_2

假设 NODE1节点故障
首先NODE1节点下面的slave 停止工作,
此前通过DNS记录把NODE1的ip在指向相近的节点为NODE2
NODE2节点提供本身的华中的读写请求,并再次同时也接管了NODE1的读写请求。

实现方式 基于consul的提供服务发现和健康检查,并提供DNS切换的功能。

NODE1 故障后的恢复
首先提供最近的节点NODE2节点进行基于binlog的恢复。等数据追平,在进行slave1和slave2的数据同步,等全部同步完成后在对外提供服务。
假设 NODE2的binlog已经清理,
首先通过NODE2的slave1或者slave2上获取一份全备在NODE1节点进行恢复。
等待恢复后,则通过主从的方式把数据追平。然后在添加到MGR集群环境中。
等待数据追平,在挂着NODE1下面的slave1和slave2 等待数据追平后在提供服务

NODE1和NODE2同时故障
整个集群会停止服务,MGR集群则无法继续工作。并触发s1级别告警。
修复方法 首先修复NODE2 然后在修复NODE1
可参考NODE1故障恢复方案进行恢复

四 难点
1.首先需要中间件要支持MGR,并支持二次分片
2.需要提供全局自增id,实现。每次insert 首先要获得一个全局的自增id,避免分片的合并造成的主键冲突,和产生自增锁
3.基于consul的dns的重新指向,或者使用其他的dns api服务通过脚本来实现,但需要实现分布式的健康检查和监控。
4.目前MGR并不成熟 需要等待官方成熟的MGR 可提供生产环境,预计今年的下半年。
5.瓶颈在于网络,可以同城,不建议跨城。

版权声明:本文内容由阿里云实名注册用户自发贡献,版权归原作者所有,阿里云开发者社区不拥有其著作权,亦不承担相应法律责任。具体规则请查看《阿里云开发者社区用户服务协议》和《阿里云开发者社区知识产权保护指引》。如果您发现本社区中有涉嫌抄袭的内容,填写侵权投诉表单进行举报,一经查实,本社区将立刻删除涉嫌侵权内容。

相关文章
稳定性与高可用保障的工作思路
稳定性与高可用保障的工作思路
25 0
【高可用架构】高可用性架构模式
随着企业客户部署的任务关键型基于web的服务的数量不断增加,对设计最佳网络可用性解决方案的深入理解的需求前所未有地重要。高可用性(HA)已成为此类系统开发的关键方面。高可用性简单地指的是一个组件或系统持续运行一段时间。
69 0
【系统概念】容错、高可用和灾备
容错,高可用、灾备这三个词的使用环境极易被混淆。很多时候以为这三个词的意思是相同的。
75 0
高可用怎么设计呢
《高可用》系列
70 0
【服务器系列】高可用方案
高可用的一些解决方案冷备双机热备同城双活异地双活异地多活。
178 0
在CCE中实现高可用部署
在CCE中实现高可用部署
311 0
阿里云高可用-容灾解决方案
阿里云高可用-容灾解决方案
1491 0
OceanBase异地容灾或多活怎么做?数据怎么同步?
OceanBase异地容灾或多活怎么做?数据怎么同步?
1629 0
高可用架构常见场景
高可用架构常见场景 一、 前言:         “高可用性”(High Availability)通常来描述一个系统经过专门的设计,从而减少停工时间,而保持其服务的高度可用性。所以当我们一说到高可用,我们满脑子都是以负载均衡为主心骨搭建的拓扑图,以他为中心,从单节点拓展为多节点,消灭单点故障。
5077 0
+关注
tplinux
云和恩墨 MySQL DBA
文章
问答
视频
文章排行榜
最热
最新
相关电子书
更多
千万QPS分布式系统架构设计和高效运维
立即下载
低代码开发师(初级)实战教程
立即下载
阿里巴巴DevOps 最佳实践手册
立即下载
相关实验场景
更多