对于企业来说,数据灾备就相当于买保险。而“保险”二字,相当于一个心理保障,对于灾难的心理恐慌有多高,购买保险的意愿和出价就越高。中国企业对于灾备的建设处于方兴未艾阶段,特别是随着数字化转型与数字经济发展,数据不仅维持着企业的运营,更与实体经济紧密结合,数据损失即意味着重大经济损失。
近年来,中国的业务连续性和数据灾备等建设仅局限于金融、电信等大型企业的少数领域,其它行业的认识和认知还不够,也没有认识到数据灾备对于企业生存和发展的重大关系。实际上,只有当企业亲自经历了数据丢失带来的重大经济损失,才会对业务连续性和灾备有深刻的认识。
根据有关市场分析,2015年我国灾备市场约136.8亿元,到2022年将达到329.1亿元。政府、军工、金融、电信、交通、能源等大企业市场对灾备的需求呈规模化增长态势。在灾备解决方案中,基于公有云的云灾备增长迅速。2019年5月29日,阿里云发布企业级云灾备解决方案,云上灾备成本相对传统线下节省50%。
对于企业来说,类似阿里云的企业级云灾备就相当于第三方保险公司,企业无需大规模自建线下成本高昂的灾备中心,而采购公有云灾备解决方案,共享业界最佳灾备实践,大幅降低灾备成本的同时,提高全面保障的能力。
数字经济,灾备升级
数据是新时代的能源,而我们正处于数据能源新时代的开端。市场调查公司IDC在2014年发布的第七次《数字宇宙报告》,预计到2020年,数字宇宙(指由全球所有消费者和企业所创建的数据,包括视频、音频和文件等)规模将达到44ZB。
140多前的1879年,爱迪生经过几千次试验发明了电灯,当时的人类对于电能的重要性还远远认识不足。之后过了90年的1969年美国把人类送到了月球,1970年空中客车公司诞生,全世界全面进入电力电能时代,几乎所有的人类文明都被电力化电能化。从大规模的现代化生产车间,到更大规模的城市建筑群,再到电力电能全面普及的民航、火车、医院等生命生活基础设施,每一次停电所造成的社会影响力量级,都在不断“换代升级”。
在DT时代,数据备份的重要性,将随着数据应用的深度和广度而不断加深。之前的信息技术时代,IT系统和数据的灾备就已经十分重要。有专家认为,如果不进行灾难恢复以及业务连续性规模,将有5%的概率引发企业的财务危机;而美国德克萨斯州大学的早期调查显示,只有6%的企业可以在数据丢失后存活下来、43%将彻底关门、51%将在两年内消失。
随着人类从信息化进入数字化和智能化时代,信息技术逐渐与企业业务和流程融为一体,数据丢失将会对企业产生毁灭性影响。数字业务对于灾难恢复的要求也远高于传统IT甚至更加苛刻,RTO(能容忍的恢复时间)从小时降到分钟以内、RPO(能容忍的最大数据丢失量)也要求尽可能低。
云灾备是灾备技术趋势
十三五规划明确提出“对于信息安全、数据安全,灾备是最基础的技术需求,几乎所有的信息资产都需要灾备保护,以确保在任何意外故障情况下,信息系统的正常运转”。
灾备技术国家工程实验室副主任、清华大学教授舒继武在阿里云企业级云灾备解决方案发布会上介绍,历史上的灾备主要是容错系统的一个研究方向,现在的灾备则是容错计算、信息安全和系统管理三个研究领域的综合。
云灾备是灾备业务的实现形式,主要包括云备份与云容灾,这二者是一个有机体,其中云备份是指备份技术将数据直接备份到公有云上,进而实现数据备份与恢复功能;而云容灾则是指通过数据/系统的云端迁移、高可用等方式实现业务的快速接管,保证业务连续性。其中,云灾备的特点包括:减少基础设施、降低IT成本;按需付费,具有高度机动性;可快速恢复,具备高度灵活性;安全备份,以服务为导向。
传统灾备具有“两高一低”的弊端:高成本、高浪费、低利用率。对于企业的传统灾备来说,通常要自建灾备中心,备份机房的平时利用率只能达到20%,但却要付出100%的成本,不仅硬件投入大而且三年过维保期,如果三年之年不出事故,备份机房就基本浪费了。
灾备对于企业来说,就相当于买保险,而如果要买保险,当然是找到第三方商业保险公司更为划算。云灾备已经成为大势所趋,Gartner预计到2020年,90%的容灾操作会发生在云端。
本次阿里云发布的企业级云灾备解决方案,采用了国内首个磁盘级数据持续复制技术,同时支持混合云和跨云的多平台融合架构,为企业提供五大能力:用户数据中心和公共云的相互容灾;业务不停机,完成容灾演练;首个云原生支持弹性容灾,只需部署最低负载;一键容灾快速恢复,RTO、RPO可达秒级;完善的数据加密体系,保证数据的极致安全。
陈绪强调,阿里云企业级云灾备的独特能力包括:本地和云上皆可快速恢复;首家大数据异地双活容灾;端到端的数据加密检验,云端容灾数据自动多副本保存;五分钟启动备份服务;高达1:30的备份数据重删比;异地备份方案成本比传统方案更低。
阿里云企业级云灾备还符合四个极限目标,即不在同一火山地震带、不在同一水系、不在同一电网、不在同一运营商网络出口,最大程度地保障业务和数据稳定安全。
阿里云企业灾备的实力
灾备对技术、管理、成本等有着综合的要求。《信息系统灾难恢复规范》GB-20988-2007国标中提出了6级相关要求,SHARE 78国际组织提出了7级国际标准,恢复时间从72小时到分钟级不等、恢复点从1至7天到0级不等。
陈绪强调,阿里云企业级云灾备体现的是包括网络、数据库、存储等在内的全方位的能力。例如,数据可靠,全链路加密,支持用户自己代理的密钥——即整个存储、传输过程都经过加密且只有用户可见全过程,而数据可靠性通过3AZ(3个可用区)实现,这在国际上也是先进的。而之所以能够达到高等级的安全可靠,一个很大的原因是阿里云的技术都经过了双11的演练。
双11作为全世界最好的技术练兵场,每年峰值都在不停的提升。阿里云是解决双11业务支撑最核心的杀手锏,在双11业务到来的时候,所有的环节都已经检测过一遍,系统能承受负载和压力也都百分之百测试过了。正因为有阿里双11的实战演习环境和模式,才保障了阿里云企业级云灾备的技术能力,包括为制造、金融、医疗等企业提供一键容灾,例如业务恢复、数据保护和网络自愈,最大程度保护本地和云上业务稳定运行。
灾备演练是任何灾备方案成功的关键,没有经过灾备演练的灾备方案,都不能称之为成功的灾备方案。而灾备技术并不孤立,涉及备份、复制、虚拟化、存储、网络、超融合等多种不同技术,系统复杂性高、建设要求复杂,而好的灾备方案要求实现用户的“故障无感知”,即业务平滑过渡、数据无损失。此外,成本还要可控,在同等级灾备能力下达到更低的成本。
具体来说,阿里云企业灾备背后的技术除了飞天整体能力外,还包括阿里高可用机房、超强容灾云服务器、存储、数据库灾备等极致的技术能力。
在高可用机房方面,阿里云的不间断IDC可双向引入独立市电、机架服务器AB路供电,通过双路供电让电池后备电源无缝接管25分钟,N+1冗余柴油发电机可在1分钟内接管;而阿里云的高可用骨干网,可实现不同AZ之间低延时高速互联,再加上AZ内双冗余网络架构以及IDC 3路由出口光纤冗余,进一步保障了网络的可靠性和高可用;最后就是3+N超多线接入BGP,保证客户在数据传输的过程中不被不同的网络困扰。在超强容灾云服务器方面,阿里云的云服务器部署从物理机、机架、数据中心和跨区域的可用区四个层面进行保障。而飞天的盘古存储,从数据保护、高可用性、IDC基础设施等层面进行了数据可靠性保障,其中包括与清华合作的多项领先技术。
在数据库灾备方面,阿里云对目前市场上的主流数据库,都能进行完全高效的灾备备份,可准确评估数据库到RDS的兼容性,具体到每张表、每条SQL;而DTS数据传输服务则能全量性能达到70MB/s、实时同步性能高达3万TPS,传输粒度可细化到记录级别,具有链路秒级恢复能力,链路可靠性高达99.95%。阿里云PolarDB还在近日发布重大更新,支持Oracle等传统数据库一键迁移上云,解决了企业核心业务上云的难题。
凭借多层次防护、跨区域容灾等能力,阿里云已连续三年入选Gartner全球云存储魔力象限,并被列为全球领导者。在数据安全领域,作为亚洲合规资质最全的云服务商,率先发布《数据保护倡议书》,是首个提出“绝对不碰客户数据”承诺的云厂商。
在发布会上,陈绪代表阿里云发布了TCO承诺书:在企业灾备场景下,同样的容量、同样的带宽、同样的RTO和RPO、同样的容灾等级,阿里云承诺比自建灾备成本等低。敢写承诺书的都有底气,而阿里云的底气就来自于其技术实力本身。舒继武教授介绍,灾备技术趋势还包括容器、边缘计算、超融合等,这些丰富的灾备场景,只有在云灾备的前提下才有可能实现。正如何IT终将向DT过渡一样,传统企业灾备也将过渡到云灾备。阿里云作为亚洲最大的公有云厂商,无疑将颠覆传统企业灾备,把普惠灾备带来千万企业。(文/宁川)