今天的存储行业正处于在大变革的前夜。由于采购成本和运维成本高、可扩展性、灵活性不足等原因,传统存储正面临来自各种新技术的严峻挑战,大有风雨欲来风满楼之势。软件定义存储是其中的领头羊,不过新技术也不仅限于软件定义存储,如今又一个强有力的挑战者来了,这就是CDM(Copy Data Management,复制数据管理),也称副本数据管理。
CDM是什么东东?
对于CDM Gartner有一个定义:它是从生产环境通过快照技术获取有应用一致性保证的数据在非生产存储上生成“黄金副本(Golden image)”,这个“黄金副本 ”数据格式是原始的磁盘格式,可再虚拟化成多个副本直接挂载给服务器,分别用于备份恢复、容灾或者开发测试。
至于为什么要用这一技术,这可能还得从数据存储与备份当前面临的问题说起。为了预防系统宕机、病毒或者人为错误,数据的备份是一个现代企业的基本需求,对一些关键业务系统,备份更是必选项。一般而言,当企业数据量不大、业务系统也不多时,备份并不是一个特别大的挑战。然而,随着企业要备份的数据越来越多,企业内部的业务系统也越来越多的时候,备份就会成为一件越来越困难的事情了。
备份之难首先体现在要消耗大量的存储资源。一方面是由于各种自动化数据采集设备的应用,企业数据在不断产生,如来自各种物联网设备的,同时,社交媒体的大量使用也成为一个重要的数据来源;另一方面,同一份数据被反复拷贝,一些关键的数据在企业平均有7-10份副本,消耗了大量的存储空间,这也让企业在数据管理上面临更大的挑战。
备份之难还体现在备份窗口越来越窄,业务系统留给后台做备份的时间越来越短,使得传统的各种备份手段面临很大挑战。
由于有望帮助克服上述问题,CDM成为一种近年来逐步受到关注的存储和备份技术。正如Gartner的定义所述,它是基于快照技术来实现的。快照对存储界的人士而言并不新鲜,它是数据在某个时间点(拷贝开始的时间点)的映像。由于其本质上是指向保存在存储设备中的数据的引用标记或指针,而不是数据的全拷贝,因此它的复制很快,占用很少的存储空间,也基本不会影响系统性能,但是可以作为一种数据备份来看待。
那么,同样是利用快照技术,CDM有什么特点之处?“其最大的优势之一,它是一种可以直接使用的数据拷贝,可以直接挂载给应用程序使用的备份,这使得CDM的备份数据可以在原数据出现问题之后迅速发挥作用,最快几分钟之内就可以完成。而采用传统备份技术的系统则可能茶馆长达几小时甚至一整天。”Actifio中国区技术总监毛立峰介绍说。
Actifio中国区技术总监毛立峰
毛立峰所在的Actifio是一家专注于CDM技术的美国公司,成立于2009年,2014年正式进入中国市场,从默默无闻到伴随着CDM市场的兴起而逐渐被业界了解。他解释说,CDM之所以能有这样的能力,是因为传统备份技术将数据备份为一种专用的文件格式(比如.tar),在需要恢复的时候,要先把数据从备份介质中恢复为原来的格式,然后挂载的应用。这种恢复的过程通常是很漫长的,有的可能长达一天。而CDM保存的是原始数据的一份映像,可以直接使用。
CDM有什么用?
CDM是作为一种备份技术出现在市场。它的第一个应用也就是用于数据的备份,特别是那些对数据恢复时间有严格要求的系统,CDM非常具有竞争力。据Actifio中国区销售总监孙峻松介绍,目前Actifio的CDM客户中最主要的应用场景就是数据备份。正如上面所述,CDM具有非常出色的快速恢复能力,对于那些关键的不可中断的业务系统,这几乎是不二之选。
除此之外,CDM占用较小的存储空间也是其优势之一。CDM除了第一次备份时是全量备份之外,以后可以一直采用增量备份。而传统备份方法通常是全量备份加上一段时间的增量备份,然后又一次全量备份再加上增量备份,如此循环,占用存储空间不说,对业务系统的干扰也大。
CDM的另一个应用场景是用于数据的开发和测试。CDM可以用一套数据来满足各种不同的开发和测试需求,而对于每个开发和测试团队而言,都拥有一个独立的数据库,大家的工作(包括增、删、改)互不干扰。其背后的原理还是快照技术,因为每个团队其实是拥有一组快照,并不是一个真正的实体数据。
对于开发测试而言,CDM的优势也很多,其中之一是节省数据存储空间。“现代很多应用所需测试数据量很大,超过100TB的情形也并不少见,同时需要数据的团队也很多,在存储空间上的节省是非常明显的。”毛立峰说。
CDM的第二个优势是节省开发和测试环境搭建的时间。众所周知,开发和测试环境的搭建是非常耗时的,少则几天多则几周甚至更长时间,而CDM这种方式数据的准备几乎是实时的。
CDM的第三个优势是数据集中管理,可以按照统一的安全规则来规范使用,防止数据泄露。
“在我们看来,CDM就是一个数据服务平台。你需要一份数据我就给你一份,至于数据是如何保存的,其实用户不用关心。这也非常符合当下的IT服务化的理念。”毛立峰告诉记者。
毛立峰透露,Actifio创始人初期的想法就是想用CDM来降低存储空间。“我们的创始人注意到,在开发和测试时每个不同应用都有一份拷贝,多的可能达到10-20份,相互之间是独立的。他希望将10-20份拷贝缩到2-3份。”
CDM的第三个应用场景则是作为容灾系统的一部分。毛立峰介绍说,现有的容灾系统在硬件容灾上已经做得相当不错,比如双机热备、两地三中心等,但是,如果软件出现问题,比如有人为的误操作或者系统中病毒,需要重启系统,时间就会很长,而CDM具有可以快速挂载的特点,有助于系统的快速恢复。
采访中毛立峰也坦言,作为存储领域的一个挑战,CDM对于现有存储系统是一个很大的巅峰,不管是从理念上还是架构上。正是因为这个原因,CDM在普及过程中也面临着一定的阻力。当然,这也是每项新技术都要经历的,一个真正适用的技术终究也会通过这个考验而被市场接受。
目前,CDM的上升势头引起了一些研究机构的注意,比如Gartner已经决定把CDM从备份软件领域中单列出来独立研究。而接下来CDM是否能被广泛接受,其在市场上到底能走多远,还是交由市场来回答吧!
原文发布时间为:2016年12月1日
本文作者:邹大斌
本文来自云栖社区合作伙伴至顶网,了解相关信息可以关注至顶网。