由于种种原因,阿里云的用户除了使用云上的ECS,还会有一些本地数据中心。对于用户本地的数据中心,一旦发生故障,很有可能导致业务中断。并且如果没有合理完整的灾备策略的话,业务中断的时间很可能会拉长到按天计的级别,在这段时间内造成的损失很可能无法估量。
利用阿里云关键业务型容灾(Business Critical Disaster Recovery, BCDR)服务,我们可以把数据中心内的核心业务实时复制上阿里云,利用阿里云这个强力的后盾来减少业务中断造成的损失,BCDR服务可以提供秒级的RPO以及分钟级的RTO,这意味着在出现故障的时候,我们可以用很小的代价快速在阿里云恢复我们的核心业务系统。
下面我们就来看看如何用BCDR服务来保护一台VMware环境中的Windows 虚拟机:
在正式使用前,最好先对需要容灾的业务做个评估和规划,以保证用合理的开销获得最完善的保障
在控制台创建站点对及网关
进入混合云容灾服务控制台,点击“创建容灾站点对”
在弹出的窗口设置站点对的名字,以及所在的region和vpc(关于这两个设置项的说明,请参照如何搭建容灾云上网络
创建完成后,我们进入这个站点对,点击创建网关
在这里可以选择网关部署的环境,如果是已经购买了灾备一体机的用户选择“灾备一体机”即可,否则的话可以根据自己的虚拟化平台来做选择。这里我们以VMware为例
创建成功之后,可以点击下载容灾网关镜像(对于VMware平台,下载的是一个OVA镜像,对于Hyper-V平台,下载的是一个Zip包,可以直接导入Hyper-V中
网关部署与激活
等待OVA镜像下载完毕后,可以参考安装文档来进行部署,这个文档非常详细,链接在下载的页面也可以找到,此处不再细表
需要注意的是,对于VMware环境,目前仅支持通过5.5,6.0以及6.5的VCenter进行OVA的部署
在完成网关的部署之后, 访问http://[网关ip]:8080,进入激活页面
输入阿里云账号的ak之后,激活码可以在刚才的控制台下载镜像的页面上获取,也可以在网关页面获取
在点击“确认”激活成功后,我们可以直接下载服务安装包
在被保护服务器上安装容灾服务
在被保护服务器上双击服务安装包进行安装,首先会进行一些预检(磁盘大小等)
预检通过后输入网关的ip以及激活时设置的密码
选择安装的位置,默认位置即可
点击安装
由于安装了驱动程序,在安装完成后会提示重启,如果担心重启对业务有影响,可以等到业务低峰或者维护的时间再重启
等到重启完成之后,在控制台看到被保护服务器的状态是绿色的“已注册”,此时就完成了全部的部署工作。
容灾复制与演练
选中被保护的服务器,点击“启动复制”
选择复制网络与恢复网络之后,点击启动,即可开始进行数据的复制
在数据复制第一阶段,容灾服务进行全量复制,会读出磁盘上有数据的部分,进行高效的压缩加密后上传到阿里云上,在阿里云上用一个极小的ECS承载复制的数据。在这一阶段可以看到复制的进度
在全量复制完成之后,就是持续不断的增量复制了。此时线下这台被保护的服务器实际上已经被BCDR服务强力的保护起来了。在这一阶段容灾服务会实时抓取被保护服务器上所有写入磁盘的io,进行高效的压缩加密在同步到云上的ECS。
在进入实时复制阶段后,我们就可以进行容灾演练,来验证一下我们的被保护服务器是否能在ecs上正常拉起了,点击“容灾演练”
设置好恢复的服务器需要的参数,在选择一个恢复点(目前是每个一个小时有一个恢复点),点启动,稍等片刻就可以看到演练成功!
点击ECS实例的ID即可进入恢复出来的ECS的详情页,通过VNC控制台可以登录验证上面的数据是否完整。
在验证之后点击“清理演练环境”,便可以清理掉这个演练的ECS了。
后话
到了这一步,实际上我们对本地服务器的保护已经完成,本地服务器的数据已经实时同步到阿里云上了。如果后续服务器遇到了故障,我们就可以直接像容灾演练一样简单的做一次容灾切换,瞬间就可以把出现问题的服务器在ECS上拉起来,在配合阿里云的其他服务可以让业务中断的时间控制在分钟级,从而实现对本地数据中心的极致保护。