数据交给云服务商就万事大吉?备份与容灾一个也不能少丨科技云·视角

简介: “也许很多企业很幸运,从来没有经历过数据丢失。但是,一旦发生企业关键数据的丢失,就会很大程度上影响业务发展,同时造成严重经济损失。 ” 现在很多企业的数据都选择上云。然而,即便是将业务数据存放在国内外知名的云平台,也免不了掉链子。

也许很多企业很幸运,从来没有经历过数据丢失。但是,一旦发生企业关键数据的丢失,就会很大程度上影响业务发展,同时造成严重经济损失。

5839a3c92894722fe2d5f21bcbd7465e48ccd0e8

2018年8月,腾讯云“数据丢失事件”在业界引起极大的关注,因腾讯云发生故障和人为操作失误,直接导致创业公司“前沿数控”数据全部丢失,公司面临业务停摆的威胁。

在腾讯云的复盘中发现,该故障缘起于因磁盘静默错误导致的单副本数据错误,再加上数据迁移过程中的两次不规范的操作,导致云盘的三副本安全机制失效,并最终导致客户数据完整性受损。

事实上,腾讯云并不是唯一出现过故障的云平台。2018年6月,阿里云因bug禁用内部IP导致链路不通,造成1000+公司业务瘫痪,损失过亿;2017年4月,全球知名云平台AWS发生大规模存储故障,导致大量全球知名业务中断。

以上是云平台自身原因引起的灾难性故障,其实还有外部因素导致的问题:

2017年5月,全球爆发的Wannacry勒索病毒,给网络带来了未有的挑战,云平台也不能完全幸免;2018年1月,Intel芯片设计缺陷,给整个IT架构带来灾难性影响,云平台性能和安全受到极大的挑战。

除了公有云暴露出的这些严重故障外,几乎每天都能听到发生在企业内部的私有云,因为软件缺陷、人员、电力异常等各种原因导致的业务中断、数据丢失,企业正常的生产受到极大的影响,损失无法估量。

这些内部、外部因素叠加在一起,实际上带来了几乎无法规避的现实:云也会宕机,也会丢失数据。

09be34bc6f786c8eefe69749825cf84facb86792

很多企业对于云服务存在一定误解,认为将数据放到云平台上就万无一失了。从云计算的本质来看,它为企业提供的是一个低成本的计算资源共享池,它能帮助企业提升效率,减少成本,但这不代表它是一个不会出问题的服务。

目前,云服务商在提供服务时都会明确知会客户,因为当前人类技术水平的限制,服务商能够提供的服务的可用性、可靠性都做不到100%,大致能做到几个9(如99.9999%)。

因此,为了在此基础上继续提高数据的安全性,一般的解决方案是,同时使用该服务商不同区域的服务器,这样出问题的概率就会更低。此外,对于重要数据,不管是个人用户还是企业用户,都需要定期做好备份。如果使用云服务,快照、灾备、离线备份等多种方式都可实现数据备份。

做好灾备,提高数据安全性

数据备份的任务与意义就在于,当事故发生后,通过备份的数据完整、快速、简捷、可靠地恢复原有系统,而备份数据可用性的高低是企业灾难恢复的根本。

目前来看,主要的数据备份方式如下:

定期磁带备份:包括远程磁带库、光盘库备份和远程关键数据+磁带备份。

数据库备份:就是在与主数据库所在生产机相分离的备份机上建立主数据库的一个拷贝。

网络数据:这种方式是对生产系统的数据库数据和所需跟踪的重要目标文件的更新进行监控与跟踪,并将更新日志实时通过网络传送到备份系统,备份系统则根据日志对磁盘进行更新。

远程镜像:通过高速光纤通道线路和磁盘控制技术将镜像磁盘延伸到远离生产机的地方,镜像磁盘数据与主磁盘数据完全一致,更新方式为同步或异步。

这些措施能够在系统发生故障后进行系统恢复,但是这些措施一般只能处理计算机单点故障,对区域性、毁灭性灾难比如地震、火灾等则束手无策,也不具备灾难恢复能力。

所以,我们就需要建立异地容灾中心,做数据的远程备份,在灾难发生之后要确保原有的数据不会丢失或者遭到破坏。建立的异地容灾中心可以简单地把它理解成一个远程的数据备份中心。

9888cb21134d0d00f50ea24959599cba94e7f999

数据容灾的恢复时间比较长,但是相比其他容灾级别来讲它的费用比较低,而且构建实施也相对简单。主要的实施方法如下:

实时复制:当主中心的数据库内容被修改时,备份中心的数据库内容实时地被修改,此种复制方式对网络可靠性要求高。

定时复制:当主中心的数据库内容被修改时,备份中心的数据库内容会按照时间间隔,周期性地按照主中心的更新情况进行刷新,时间间隔可长(几天或几个月)可短(几分钟或几秒钟)。

存储转发复制:当主中心的数据库内容被修改时,主中心的数据库服务器会先将修改操作Log存储于本地,待时机成熟再转发给备份中心。

综上所述,业界一般提到的灾备技术,就是指在一个数据中心发生故障或灾难的情况下,其他数据中心可以正常运行并对关键业务或全部业务实现接管,达到互为备份的效果。好的灾备技术可以实现用户的“故障无感知”。

在国外,DRaaS(灾难恢复即服务)已经十分盛行。Forrester的数据显示,2014年,国外23%的中小企业已经在使用DRaaS,提供DRaaS服务的玩家也比较多。IDC预测,到2020年,中国的DRaaS市场将达到百亿元的规模。

中国DRaaS市场的爆发点很难预测,因为它与公有云的成熟度密切相关。只有公有云的生态体系逐渐成熟和完善,DRaaS的价值才能真正体现出来。

除了灾备系统,灾备演练不可少

那么是否灾备系统的建设就可以大功告成了呢?大多数企业其实忽略了灾备演练这个重要环节。

现在很多灾备公司都不太重视灾备的演练,很多一年也没有做到一次,不能完全发现灾备中心的缺陷。

容灾系统的业务连续性是企业的关键业务在灾难发生时的应对能力和恢复能力,即通过尽可能快速的、全面的企业业务恢复运作,将因灾难造成的损失降低到最小程度。

灾备演练是验证灾难发生时,业务系统能否有效联动切换的极为重要的手段。没有灾备的演练计划和手段,往往无法预知灾难发生时生产中心和灾备中心的数据一致性,也无法预知灾备中心是否具有了业务接管的一切必要条件。灾备的演练计划有以下几种方式:

计划性测试/演练

灾难恢复计划要求建立业务连续性管理团队,不仅涉及IT部门,而且关联众多业务部门,为减少演练对于生产的影响,可以将恢复计划细化到很小的单位或者模块,逐个应用进行接管验证。当模块都成功通过测试后,测试的范围可以扩充到更多的模块。

突发演练

在灾备系统全面完成并且制定了全面的恢复计划后,可以在进行了一定备份的情况下安排突发性的测试。当然,业务连续性管理小组需要确保业务不会因为突发性测试造成不可接受的损失和业务中断。

演练对于提高团队的恢复经验和协作能力以及确保灾难恢复计划的可行性是至关重要的。所有的演练结果都要进行评估、记录、并且生成到容灾流程里。


原文发布时间为:2018-09-19

本文作者:科技云报道

本文来自云栖社区合作伙伴“科技云报道”,了解相关信息可以关注“科技云报道”。

相关文章
|
1月前
|
存储 云安全 人工智能
带你读《阿里云安全白皮书》(二十四)——云上安全建设最佳实践(2)
本文介绍了阿里云在AI大模型云上安全方面的最佳实践,涵盖数据安全、模型安全、内容安全和合规性四大关键挑战。阿里云通过数据加密、私有链接传输、机密计算等技术手段,确保数据和模型的安全性;同时,提供内容安全检测、Prompt问答护栏等功能,保障生成内容的合法合规。此外,阿里云还帮助企业完成算法及模型备案,助力客户在AI大模型时代安全、合规地发展。
|
1月前
|
云安全 监控 安全
带你读《阿里云安全白皮书》(二十三)——云上安全建设最佳实践
淘宝作为全球最大规模、峰值性能要求最高的电商交易平台,基于阿里云成功通过了多年“双11”峰值考验。淘宝的安全体系涵盖了系统安全、网络安全、账号与凭据安全、云资源安全等多个方面,通过阿里云提供的多种安全产品和服务,确保了业务的稳定运行和数据的安全。淘宝的安全实践不仅为自身业务提供了坚实的保障,也为其他行业的云上安全建设提供了宝贵的经验和参考。
|
SQL 运维 关系型数据库
NineData:为大型房产集团数据库统一纳管,推动业务高效运行
该企业是中国领先的优质房产品开发及生活综合服务供应商。在 2022 年取得了亮眼的业绩表现,销售额市场占有率跻身全国前五。业务涵盖房产开发、房产代建、城市更新、科技装修等多个领域。2023 年,该企业和玖章算术(浙江)科技有限公司达成合作,通过玖章算术的 "NineData 数据库管理平台" 管理集团旗下所有的数据库。
472 1
|
监控 容灾
《云迁移与云容灾-【驻云科技】混合IT时代面向数据的监控》电子版地址
云迁移与云容灾-【驻云科技】混合IT时代面向数据的监控
61 0
《云迁移与云容灾-【驻云科技】混合IT时代面向数据的监控》电子版地址
《企业数据备份的典型问题与新型方案》电子版地址
4-企业数据备份的典型问题与新型方案.pdf
83 0
《企业数据备份的典型问题与新型方案》电子版地址
|
人工智能 运维 Cloud Native
抛弃传统集中式架构 江西农信携手阿里云实现业务系统平滑迁移上云
抛弃传统集中式架构 江西农信携手阿里云实现业务系统平滑迁移上云
抛弃传统集中式架构 江西农信携手阿里云实现业务系统平滑迁移上云
|
数据采集 监控 数据挖掘
疫情之下,一套支持私有化部署的新闻采集系统需要具备什么?
在这样一个信息爆炸和信息碎片化时代,各个领域的信息量和信息规模都以惊人的速度增长,用户的注意力被各种纷繁复杂的信息侵扰,如果想要收集某一类信息,需要经历“网络搜索——逐条收集——汇总整合”等流程,需要耗费大量的时间和精力。
疫情之下,一套支持私有化部署的新闻采集系统需要具备什么?
|
弹性计算 运维 安全
企业IT治理沙龙·北京站 || 业务优先?治理优先?您的企业是哪种上云姿势?
为了体系化解决企业在云上管理和治理的问题,今年,阿里云开放平台推出企业IT治理样板间,为企业客户提供在阿里云上搭建跨账号的复杂企业 IT 治理体系的基本骨架,可以满足企业快速、全面的进行云治理初始化的需求,使企业在云上创建任何负载之前,就能预先搭建好一个符合企业合规管控标准的安全、可信环境。
企业IT治理沙龙·北京站 || 业务优先?治理优先?您的企业是哪种上云姿势?
|
Web App开发
一张图看懂互联网史上最大规模的公共云迁移案例
6月7日,阿里云与国内领先的云存储企业115科技在2018云栖大会·上海峰会上宣布,已将公司全部数据迁移至阿里云上,总量超过100PB。 至此,双方合力完成了互联网史上规模最大的公共云数据迁移,仅耗时45天,创造了百PB级数据公共云迁移的新纪录,而这都要依托于阿里云推出的全新离线数据迁移方案——闪电立方。
1936 0