利用阿里云实现异地容灾的解决方案

简介: 利用阿里云实现异地容灾的解决方案

一、异地灾备防范于未然

2001年的911事件”中,没有远程备份的企业都遭受了巨大损失,甚至部分公司因为核心业务部署在公司大楼而又没有远程备份导致公司业务无法继续运营而倒闭美国“911事件”后,全球用户提升了对灾备的重视程度,异地灾备建设一时成为趋势。

异地容灾备份一般指在与生产机房有一定距离的异地建立与生产机房类似的信息平台(备份中心),并采用特定的技术将生产中心的数据传输到该备份中心,从而在生产中心发生较大的灾难如火灾或地质灾害时,仍能对生产数据进行保护的容灾系统。异地灾备中心的选址还必须做到“三不”,即不 在同一地震带,不在同一电网,不在同一江河流域。

传统的异地灾备中两地三中心是最为稳固的、保护等级最高,也是成本最高的灾备方案两地三中心是一个生产数据中心、一个同城灾备中心再加一个异地灾备中心组成。且要求本地的生产中心和灾备中心相距100km以上,进行应用级业务级容灾保护,在300km 以外的异地建立灾备中心,进行数据级应用级容灾保护。

1.png


二、异地灾备方案构建成本高

传统异地灾备中心建设成本要考虑以下几个部分

1)场地费用包括灾备机房基础设施费用,灾备中心人员费用等。

2)设备费用包括购买的灾备存储、交换机、路由器、协议转换器、主机等各种设备的费用。

3)传输网络费用这一部分费用随着灾备技术路线的不同更是差距明显传输距离越远传输费用越高

4)运维费用这部分的费用包括向厂商购买的每年服务和应急的专业服务费用,还包括高级别的系统维护人员的费用。

与同城灾备相比传统异地灾备方案考虑到灾备中心的数量和距离因素以上介绍的几个成本因素会成倍增加甚至可以达到几十倍的成本差异。

显然大部分中小型企业是难以承担如此高昂的灾备费用的

但中小型企业也有高业务连续性的需求比如电商企业的订单交易系统期望7*24h持续运行一旦发生宕机企业遭受的成本损失无法估量

我们可以利用阿里云实现异地灾备成本问题就迎刃而解了

三、云容灾成本优势

不同于传统的灾备方式,需要建立相同的一套架构来对应生产中心可能的故障失效,可能要花费数月甚至数年的建设时间。而云容灾模式,允许用户将传统的采购模式转化为按服务付使用的方式,云数据中心的各种资源即开即用,能够快速部署,大幅缩短了云容灾建设的进程,让云容灾成为一种普惠型的服务。

容灾实现的等级与前期投入相关,等级越高,前期投资就越大。云容灾不仅初期成本的投入降低,而且在容灾过程中,合理的使用云原生特性,能够大幅度降低用于容灾的云资源成本。例如:在容灾过程中,可以使用块存储或对象存储资源进行数据存储,而需要业务接管时,再恢复业务。在日常容灾过程中,用户只需要为存储资源买单,在演练或接管时则按量付费,大幅度降低了容灾资源的成本。

传统运维业务系统复杂,需要大量的专业运维人员。而云上资源的可编排性以及自助化的容灾使用体验,降低了对人员技术能力要求,直接降低了运维的复杂度。

四、云上可以实现异地灾备吗

为了适应云和大数据时代利用云容灾技术来实现异地灾备方案不仅可以提高业务连续性还有利于降低灾备成本这里介绍一下在信通院发布的2022云容灾白皮书提到的两个利用云实现异地灾备的场景云双活多活

4.1云双活

云双活在技术上更关注数据同步与流量管理能力。该架构要求两个生产中心之间的数据同步须保持实时性、一致性,并且外部能够通过调度策略、流量控制实现全局流量管理,各访问请求利用配置策略分发,避免单点故障。常见的应用场景包括两地三中心。

两地三中心的异地灾备场景一个生产数据中心、一个同城灾备中心再加一个异地灾备中心组成。其中同城灾备与异地灾备相比,在 RTO RPO 上有一定的提升,但实际功能类似,对业务连续性没有质的提高。因此,更应该将同城灾备改造成同城双活,形成同城双活、异地灾备的两地三中心模式。既能实现数据零丢失和故障自动切换,又能应对区域性重大灾难(如自然灾害、战争、城市骨干线路中断等)的发生,有效提升数据中心的可用率。

2.png

4.2云多活

云多活是指同一套业务系统分别部署在两个地域以上的多个数据中心,同时对外提供服务的业务场景。云多活主要体现在多地域多活两个概念上。多地域是指地域划分,如不同省市地区或者不同国家地区;多活则是指多个地域部署同一套业务系统同时提供业务服务,都处于生产状态。能力要求上更侧重于具备异地双活以及多活的能力,由于长距离传输的时延问题,各业务场景下对实时性、一致性、可用性等要求不尽相同。

3.png

五、用HyperBDR云容灾低成本实现阿里云异地灾备

由于云服务具有多区域和多可用区的特点,并且在多区域和多可用区之间提供高带宽和低时延的网络连接,因此可以在云的异地可用区实现异地容灾

这里推荐用万博智云的HyperBDR云容灾工具低成本构建阿里云异地容灾方案

为了攻克资源冗余的问题,HyperBDR在容灾思路上有一个革新。使用HyperBDR云容灾工具构建灾备方案平时只需要为数据备份消耗的云硬盘付费要在云端1:1预启动实例,只在恢复业务才需要启动ECS

HyperBDR解决了两个问题,一个是备份,这个是大部分企业的基本需求一个是容灾,这是一小部分客户的需求,且发生灾难的概率较低。用户的容灾成本大部分用在日常备份上,而关键时刻的容灾费用占比很低,用备份的价格达到了容灾的效果,等于客户买了一个双保险。

5.1HyperBDR云容灾的核心优势

目前,HyperBDR云容灾已完成20+朵云的自动化API对接这就意味着,HyperBDR打通了异构平台的壁垒实现了数据在云之间的流转对于企业来说可以根据自身情况自由地选择容灾到哪个云平台不再受IT资源架构差异的限制

HyperBDR采用的Boot in cloud技术可以在发生灾难时一键拉起业务,保障核心业务连续性并且无需云端1:1预启动实例,只需要在恢复时启动ECS减少了云资源的消耗大幅度降低了成本。

5.2HyperBDR云容灾整体架构

万博智云HyperBDR容灾软件通过调用云平台自身提供的原生API接口,以及通过调度源端Agent、或Agentless无代理方式(视不同源端环境)来捕获全量、差异数据,通过点到点加密网络传输至目标云侧「云存储网关」,本地没有数据留存,安全高效。

5.3容灾上阿里云具体实现

这里以10VMware虚拟机,两套业务系统容灾至阿里云为例

基础条件

(1)需要容灾的主机:10

(2)根据主机数量1:1购买license:10

(3)有阿里云资源,有阿里平台的管理权限。

5.3.1 配置生产平台 (VMware)

第一步:点击菜单栏 生产平台设置,点击 VMware 选择框。

第二步:点击 +添加 按钮,安装源端hamal无代理组件的安装部署;

首次添加VMware需要安装hamal组件。

第三步:按照界面指引安装hamal。

第四步:弹框中填写相关信息

4.png

完成配置vCenter/ESXI 被成功加入到容灾生产平台中,重复以上步骤可以添加多个vCenter(按需)。

完成生产平台VMware配置,可进行添加容灾主机。

左侧菜单选择 资源容灾 -> 主机容灾 之后,右侧点击 +添加主机 ,点击 VMware 选项。

5.png

选择其中一个VMware源端连接,并点击 下一步 按钮。

在VCenter/ESXi的所有VMware主机列表中 勾选要容灾的主机,并点击 确定 按钮

如果主机较多,可以右上角搜索,并执行批量勾选添加。

在容灾界面可以看到 待容灾的VMware主机清单,勾选要操作的主机,点击 下一步 按钮,进入 容灾配置 操作。

5.3.2配置容灾平台

(1)左侧菜单栏点击 容灾平台设置,在左侧点击选择阿里云选项。

(2)按步骤填写信息,创建<云同步网关>组件。

云同步网关万博智云自主开发的云平台适配模块,此处主要作为同步数据过程中接收生产平台的数据使用

6.png

确认名称和状态可用后,等待“启动代理实例”完成后,点击 完成 按钮。

5.3.3同步数据

进入容灾工具 HyperBDR 界面。

容灾配置步骤一:指定容灾平台,选择容灾主机所在容灾平台的配置信息,并点击 下一步 按钮。

容灾平台信息为空,则表示暂未添加容灾平台,需要 配置容灾平台 ,再进行后续操作。

容灾配置步骤二:指定云同步网关,选择容灾主机并加入到云同步网关,并点击 下一步 按钮。

容灾配置步骤三:指定卷类型,选择容灾主机在目标容灾平台所使用的卷类型,如果有多个卷,可以按照系统卷和数据卷进行分别设置,设置完成后,并点击 下一步 按钮。

容灾配置步骤四:计算资源配置,选择容灾主机在目标容灾平台使用的规格、系统类型、是否重置密码及是否使用密钥对,设置完成后,并点击 下一步 按钮。

容灾配置步骤五:网络配置,选择容灾主机在目标容灾平台所使用的网络、子网以及启动时是否指定IP、配置公网IP和安全组,设置完成后,并点击 下一步 按钮。

容灾配置步骤六:启动配置,选择容灾主机在目标容灾平台所使用的启动设置,设置完成后,并点击 确定 按钮。

容灾配置步骤设置完成后,可以勾选容灾配置完成的单个或多个容灾主机,并点击 下一步 按钮。

在 开始容灾 步骤,可以勾选单个或多个容灾主机,并点击 立即同步 按钮直接进行数据同步,也可以将已经完成 容灾配置 的容灾主机加入到资源组,对 资源组容灾 进行同步数据操作。

7.png

确认需要同步的容灾机器,并点击 确定 按钮。

首次点击,将同步全量数据,后续点击将同步增量数据,这里也可以勾选全量数据同步,则表示本次数据同步会全量。

5.3.4容灾接管/演练

等待数据同步完成(同步快照完成),勾选需要容灾演练/容灾接管主机,并选择 容灾演练/容灾接管 按钮。

容灾演练/容灾接管功能保持一致,此功能则表示将容灾主机在容灾平台进行启动,启动后即可进行相关验证和接管工作。

8.png

选择容灾主机启动时数据同步时间点(快照),并点击 确定 按钮,开始主机实例启动。

大多数情况下,企业的使用场景是持续备份关键系统数据,而仅在灾难发生时,做云端业务拉起的动作,我们在实践过程中会发现,除了备份会需要消耗一定的云存储外,演练或容灾阶段的费用是极低的。不再需要1:1准备计算资源也能云商恢复,这让企业可以以备份的成本享受到容灾体验。

平时更多用到的是容灾演练。容灾演练通过假设灾难场景,进行应急演练,可以验证灾备方案是否合理,是否能够达到预期;同时演练环境也可以作为系统升级测试验证的环境,尤其是研发型企业,在系统升级、iT环境变化时,容灾演练环境其实就是一个临时测试环境。

相关文章
|
3天前
|
Linux 开发工具 C语言
Centos8下编译安装最新版ffmpeg解决方案(含Centos8换源阿里云)
Centos8下编译安装最新版ffmpeg解决方案(含Centos8换源阿里云)
186 3
|
6月前
|
运维 网络协议 容灾
阿里云云解析DNS产品升级,融合DNS解决方案发布
阿里云云解析DNS产品升级,融合DNS解决方案发布
阿里云云解析DNS产品升级,融合DNS解决方案发布
|
3天前
|
弹性计算 运维 安全
2024年阿里云一键搭建部署幻兽帕鲁服务器解决方案
幻兽帕鲁火了,为了确保畅快体验游戏,构建高效、稳定的游戏服务器至关重要。幸运的是,阿里云为您提供了快速、简便的服务器搭建解决方案,即使您对技术知识了解有限,也能在短短一分钟内轻松完成《幻兽帕鲁》游戏的联机服务器搭建!
1492 4
|
3天前
|
自然语言处理 架构师 搜索推荐
一文详解瓴羊×阿里云上的Salesforce联合解决方案
一文详解瓴羊×阿里云上的Salesforce联合解决方案
61 1
|
3天前
|
存储 弹性计算 编解码
阿里云赵大川:弹性计算推理解决方案拯救AIGC算力危机
阿里云弹性计算高级技术专家赵大川在【人工智能基础设施】专场中带来了题为《弹性计算推理解决方案拯救AIGC算力危机》的主题演讲,围绕弹性计算推理解决方案DeepGPU实例如何支持Stable Diffusion文生图推理、Stable Diffusion推理演示示例等相关话题展开。
69938 205
|
3天前
|
监控 容灾 安全
规划阿里云RDS跨区迁移并构建容灾与备份策略
规划阿里云RDS(Relational Database Service)跨区迁移并构建容灾与备份策略
115 2
|
3天前
|
存储 编解码 弹性计算
阿里云网盘与相册开发版提供了丰富的功能和全面的加速解决方案
阿里云网盘与相册开发版提供了丰富的功能和全面的加速解决方案【1月更文挑战第13天】【1月更文挑战第63篇】
32 2
|
3天前
|
人工智能 搜索推荐 数据挖掘
瓴羊X阿里云上的Salesforce联合解决方案正式发布
瓴羊X阿里云上的Salesforce联合解决方案正式发布
|
3天前
|
NoSQL 安全 MongoDB
|
3天前
|
存储 人工智能 安全
阿里云企业成长解决方案,含通用、企业上云、企业服务、教育等多场景
在数字化时代,企业的成长离不开云计算技术的支持。阿里云作为领先的云服务提供商,推出了全面的企业成长解决方案,涵盖通用场景、企业上云、新零售、企业服务、教育、游戏、医疗健康、文化传媒和工业制造等多个行业。这些解决方案旨在帮助企业轻松应对各种挑战,实现数字化转型和升级。
阿里云企业成长解决方案,含通用、企业上云、企业服务、教育等多场景

热门文章

最新文章