1.传统灾备中心建设成本高
灾备,可以在灾难发生时,为生产系统数据的安全和业务连续性提供保障。
通常金融、医疗等行业的大型企业,可以建设传统灾备中心来保障核心业务的安全,但是每年在灾备上的花费都是一笔不小的数目。
而大部分中小型企业也有灾备需求,例如一家电商公司,在病毒勒索、设备老化等不确定因素的威胁下,需要确保自己的订单系统可以24h运行。碍于传统灾备中心建设成本高的问题,很大一部分中小型企业无法建立自己的灾备中心,未能实现有效的灾备方案。
建设传统灾备中心的成本,涉及到以下几个方面:
1、iT基础设施费用
2、机房场地费用
3、运维人员费用
4、网络传输费用
显然,在云计算作为未来数字经济发展底座的今天,建设传统灾备中心对很多企业来说,并不是灾备方案的最优解了。
2.云容灾的成本优势
云容灾是以云计算的服务模式,为企业提供业务容灾的灾备方案,相比传统容灾具备了多方面的优势。
云容灾允许用户将传统的采购模式转化为按服务交付使用的方式,云数据中心的各种资源即开即用,能够快速部署,大幅缩短了灾备中心建设的进程,节约了建设传统灾备中心的时间和金钱成本。让云容灾成为一种普惠型的灾备服务,中小型企业也可以享受到灾备服务,让大型企业可以摆脱传统灾备的高成本负担。
3.用HyperBDR云容灾低成本构建阿里云灾备方案
为了满足中小型企业的灾备需求、节省大型企业的灾备成本,我们可以选择在国内的主流云商阿里云上构建灾备方案。
利用HyperBDR业务级云原生容灾工具,可以低成本构建阿里云灾备方案。
3.1HyperBDR云容灾的核心优势
目前,HyperBDR云容灾已完成20+朵云的自动化API对接。这就意味着,HyperBDR打通了异构平台的壁垒,实现了数据在云之间的流转。对于企业来说,可以根据自身情况,自由地选择容灾到哪个云平台,不再受iT资源架构差异的限制。
而HyperBDR采用的Boot in cloud技术,可以在发生灾难时一键拉起业务,保障核心业务连续性;并且无需在云端1:1预启动实例,只需要在恢复时启动ECS,减少了云资源的消耗,大幅度降低了成本。
3.2HyperBDR云容灾整体架构
万博智云HyperBDR容灾软件通过调用云平台自身提供的原生API接口,以及通过调度源端Agent、Agentless程序来捕获全量、差异数据,通过点到点加密网络传输至目标云侧「云存储网关」,本地没有数据留存,安全高效。
架构如下:
3.3容灾上阿里云具体实现
这里以10台VMware虚拟机,两套业务系统,容灾至阿里云为例。
基础条件:
(1)需要容灾的主机:10台。
(2)根据主机数量1:1购买license:10个。
(3)有阿里云资源,有阿里云平台的管理权限。
3.3.1 配置生产平台 (VMware)
第一步:点击菜单栏 生产平台设置,点击 VMware 选择框。
第二步:点击 +添加 按钮,安装源端hamal无代理组件的安装部署;
首次添加VMware需要安装hamal组件。
第三步:按照界面指引安装hamal。
第四步:弹框中填写相关信息
完成配置vCenter/ESXI 被成功加入到容灾生产平台中,重复以上步骤可以添加多个vCenter(按需)。
完成生产平台VMware配置,可进行添加容灾主机。
左侧菜单选择 资源容灾 -> 主机容灾 之后,右侧点击 +添加主机 ,点击 VMware 选项。
选择其中一个VMware源端连接,并点击 下一步 按钮。
在VCenter/ESXi的所有VMware主机列表中 勾选要容灾的主机,并点击 确定 按钮。
如果主机较多,可以右上角搜索,并执行批量勾选添加。
在容灾界面可以看到 待容灾的VMware主机清单,勾选要操作的主机,点击 下一步 按钮,进入 容灾配置 操作。
3.3.2配置容灾平台
(1)左侧菜单栏点击 容灾平台设置,在左侧点击选择阿里云选项。
(2)按步骤填写信息,创建<云同步网关>组件。
云同步网关是万博智云自主开发的云平台适配模块,此处主要作为同步数据过程中,接收生产平台的数据使用。
确认名称和状态可用后,等待“启动代理实例”完成后,点击 完成 按钮。
3.3.3同步数据
进入容灾工具 HyperBDR 界面。
容灾配置步骤一:指定容灾平台,选择容灾主机所在容灾平台的配置信息,并点击 下一步 按钮。
容灾平台信息为空,则表示暂未添加容灾平台,需要 配置容灾平台 ,再进行后续操作。
容灾配置步骤二:指定云同步网关,选择容灾主机并加入到云同步网关,并点击 下一步 按钮。
容灾配置步骤三:指定卷类型,选择容灾主机在目标容灾平台所使用的卷类型,如果有多个卷,可以按照系统卷和数据卷进行分别设置,设置完成后,并点击 下一步 按钮。
容灾配置步骤四:计算资源配置,选择容灾主机在目标容灾平台使用的规格、系统类型、是否重置密码及是否使用密钥对,设置完成后,并点击 下一步 按钮。
容灾配置步骤五:网络配置,选择容灾主机在目标容灾平台所使用的网络、子网以及启动时是否指定IP、配置公网IP和安全组,设置完成后,并点击 下一步 按钮。
容灾配置步骤六:启动配置,选择容灾主机在目标容灾平台所使用的启动设置,设置完成后,并点击 确定 按钮。
容灾配置步骤设置完成后,可以勾选容灾配置完成的单个或多个容灾主机,并点击 下一步 按钮。
在 开始容灾 步骤,可以勾选单个或多个容灾主机,并点击 立即同步 按钮直接进行数据同步,也可以将已经完成 容灾配置 的容灾主机加入到资源组,对 资源组容灾 进行同步数据操作。
确认需要同步的容灾机器,并点击 确定 按钮。
首次点击,将同步全量数据,后续点击将同步增量数据,这里也可以勾选全量数据同步,则表示本次数据同步会全量。
3.3.4容灾接管/演练
等待数据同步完成(同步快照完成),勾选需要容灾演练/容灾接管主机,并选择 容灾演练/容灾接管 按钮。
容灾演练/容灾接管功能保持一致,此功能则表示将容灾主机在容灾平台进行启动,启动后即可进行相关验证和接管工作。
选择容灾主机启动时数据同步时间点(快照),并点击 确定 按钮,开始主机实例启动。
大多数情况下,企业的使用场景是持续备份关键系统数据,而仅在灾难发生时,做云端业务拉起的动作,我们在实践过程中会发现,除了备份会需要消耗一定的云存储外,演练或容灾阶段的费用是极低的。不再需要1:1准备计算资源也能云商恢复,这让企业可以以备份的成本享受到容灾体验。
平时更多用到的是容灾演练。容灾演练通过假设灾难场景,进行应急演练,可以验证灾备方案是否合理,是否能够达到预期;同时演练环境也可以作为系统升级测试验证的环境,尤其是研发型企业,在系统升级、iT环境变化时,容灾演练环境其实就是一个临时测试环境。
4.总结
整个容灾流程走下来,给我最直观的感受是:简单、丝滑。所有容灾流程都在HyperBDR一个工具上操作,不需要频繁切换工具组合使用,包括可以在阿里云上直接创建实例这一点,也是我一开始没有预想到的方便。
对于大多数使用公有云并希望能够快速低成本的搭建容灾业务的,这个产品真的可以一试,我相信一些和我一样的行业内的服务商,对这样的工具也能快速上手,提供公有云容灾解决方案给到企业客户。