测试:Data Domain拔得重复数据删除头筹

简介:

【WatchStor独家译文】重复数据删除技术不仅能够提高企业存储效率,而且可以减少购买磁带或者磁盘等存储设备的需求,从而进一步节省了数据中心空间、能源和冷却资源。

从广义上讲,重复数据删除是一项分析数据文件、找出和删除冗余信息块、并且采用了g-zip或者LZ等压缩算法的技术。一般来讲,那些经常被编辑但是变更很少的文件是重复数据删除的理想对象。因此,不少企业开始考虑采用重复数据删除解决方案来减少企业数据库、电子邮件、服务器信息以及虚拟机镜像的备份和归档所需的存储空间。

Data Domain是重复数据删除市场的领导者之一,所以我们就先来看一看这家厂商的产品。其他主要厂商还包括NetApp、IBM、EMC和昆腾。一般来说,对产品的概览都是将重点放在重复数据删除水平或者重复数据删除节省下原始磁盘空间的比例上的。不仅吞吐性能和易于安装性等重要指标,而且包括空间节约都是在实验室环境下(例如在几个月或者几年时间内许多用户不会同时对实时数据进行频繁而细微的变更)非常难以测量出来的。

而这次我们希望从一个不同的角度来考量重复数据删除产品。我们选择把重点放在应用的简便性和可能存在的问题、吞吐性能、可管理性以及功能特性。我们将先在位于纽约市的存储实验室进行测试,然后采访Data Domain的用户了解他们的实际应用情况,从而掌握更准确的实际重复数据删除率。我们的主要目标是评估Data Domain解决方案在多站点业务连续性方面的稳定性。

我们的测试模拟了一个拥有一个数据中心、地区总部和分支机构的企业。该分支机构将350GB内部存储备份到本地一个DD120中,地区总部将1.2TB的内部存储备份到一个DD510中,而各个部门将数据中心两个封装了10TB存储的外置驱动器备份到一个DD690中。每个设备都设计有最大冗余性的电源、NIC、光纤通道控制器以及RAID 6磁盘阵列。我们采用了两种方法,第一个是使用Symantec Veritas NetBackup软件进行本地备份,然后使用Data Domain的复制技术在不同Data Domain设备之间进行复制;第二种方法是采用Data Domain的OST来控制NetBackUp的所有备份和复制流程。我们发现一个有趣的现象,如果你的企业已经采用了NBU,那么你可以保留所有陈旧的工作和规则,只要将他们直接从磁带驱动器迁移到Data Domain驱动器中就可以了。

虽然配置过程并不简单,但是有些方面更注重企业存储技术,而不是全面IT技术。通过远程登陆或者附加KVM使用CLI来完成安装。我发现,在第一次登陆的时候是必须要更改默认密码的。我们安装了存储设备、复制和OST的许可,然后架构网络、文件系统、系统和管理设置。确认设置完成之后重启系统,再开始安装CIFS和NFS共享。

CLI可以帮助你结束命令、运行命令树以及提供帮助。然而,它仍然只是CLI,而我更倾向于选择更好一些的Web GUI。不过我认为这是Data Domain一个最主要的缺点——虽然GUI能够完成任务,但是却并不完善。我可以在一个屏幕下监控所有这三个部分的运作情况,但是在真正管理的过程中就必须使用CLI。Data Domain有关负责人表示,他们的大多数用户都是使用CLI的(这一点也在我们的调查过程中得到了证实),下一步他们将研究升级加入Web GUI的应用。

文件资料组织缜密且信息详尽,这远不会降低向数据中心增加新技术可能存在的问题。例如,我们使用扩展套件对DD510进行升级,在10分钟内配置6个250GB附加驱动器,这就组成了一个由8个磁盘构成的RAID组、一个由6个磁盘构成的RAID组以及能够被每个组使用的热备份盘。

我们的实验室测试过程中发现,重复数据删除率从5倍到99倍不等,主要取决于文件类型和相同内容备份的次数。一般来说,在你完成第一次备份之后,由于压缩的原因不会释放太多空间,然后在接下来的备份中能够节省下的空间慢慢增多。许多企业在备份、归档和业务连续性流程方面的配置与我们没有太大区别。在通过WAN连接复制之前高效重复数据删除所能节省下的成本和时间是非常惊人的。

在完成实验室测试之后,我们开始对Data Domain进行走访来了解实际应用过程中的重复数据删除率。我们采访了一家名为The Rockefeller Group的公司,这是一家提供商业地产、地产服务和电信服务的公司。该公司高级IT服务工程师Sanja Kaljanac表示,他们数据中心在DD565上可以达到100倍的数据删除率,在分支机构的DD120上可以达到67.5倍的数据删除率。在对其他Data Domain用户提供的日志文件进行分析后我们发现,压缩率从10倍到40倍不等,DD690上的最高吞吐量在每秒300~500MB之间。除了Rockefeller Group之外,其他采用了Data Domain产品的地产公司还包括Land America Financial Group and Skidmore和Owings and Merrill。

我们的实验室测试结果和实际调查结果表明,Data Domain的重复数据删除技术在站点间或者通过WAN连接的备份、恢复和归档方面具有一定的优势。考虑到维持多站点企业业务连续性所需的数据量,传统备份方法被不断完善甚至是突破了原有的局限性。DD120在分支机构的应用结合DD690或者DD510在数据中心应用不仅能够消除局限性,而且还会让你对现有业务连续性流程进行重新评估。  

  l  测试产品总价格:293540美元
l  DD690(带有扩展架的基本架构):210000美元
l  DD51019000美元
l  DD510扩展套件:13000美元
l  DD120(带有复制功能):12500美元
l  DD690复制软件许可:35000美元
l  DD510复制软件许可:2540美元
l  DD510复制软件许可:1500美元  

 
 

来源:51CTO
目录
相关文章
|
17天前
|
分布式计算 Shell MaxCompute
odps测试表及大量数据构建测试
odps测试表及大量数据构建测试
|
22天前
|
开发框架 .NET Java
C#集合数据去重的5种方式及其性能对比测试分析
C#集合数据去重的5种方式及其性能对比测试分析
34 11
|
24天前
|
开发框架 .NET Java
C#集合数据去重的5种方式及其性能对比测试分析
C#集合数据去重的5种方式及其性能对比测试分析
49 10
|
2月前
|
机器学习/深度学习 算法 UED
在数据驱动时代,A/B 测试成为评估机器学习项目不同方案效果的重要方法
在数据驱动时代,A/B 测试成为评估机器学习项目不同方案效果的重要方法。本文介绍 A/B 测试的基本概念、步骤及其在模型评估、算法改进、特征选择和用户体验优化中的应用,同时提供 Python 实现示例,强调其在确保项目性能和用户体验方面的关键作用。
50 6
|
2月前
|
机器学习/深度学习 算法 UED
在数据驱动时代,A/B 测试成为评估机器学习项目效果的重要手段
在数据驱动时代,A/B 测试成为评估机器学习项目效果的重要手段。本文介绍了 A/B 测试的基本概念、步骤及其在模型评估、算法改进、特征选择和用户体验优化中的应用,强调了样本量、随机性和时间因素的重要性,并展示了 Python 在 A/B 测试中的具体应用实例。
40 1
|
3月前
|
存储 测试技术 数据库
数据驱动测试和关键词驱动测试的区别
数据驱动测试 数据驱动测试或 DDT 也被称为参数化测试。
49 1
|
3月前
|
机器学习/深度学习 监控 计算机视觉
目标检测实战(八): 使用YOLOv7完成对图像的目标检测任务(从数据准备到训练测试部署的完整流程)
本文介绍了如何使用YOLOv7进行目标检测,包括环境搭建、数据集准备、模型训练、验证、测试以及常见错误的解决方法。YOLOv7以其高效性能和准确率在目标检测领域受到关注,适用于自动驾驶、安防监控等场景。文中提供了源码和论文链接,以及详细的步骤说明,适合深度学习实践者参考。
812 0
目标检测实战(八): 使用YOLOv7完成对图像的目标检测任务(从数据准备到训练测试部署的完整流程)
|
3月前
|
机器学习/深度学习 并行计算 数据可视化
目标分类笔记(二): 利用PaddleClas的框架来完成多标签分类任务(从数据准备到训练测试部署的完整流程)
这篇文章介绍了如何使用PaddleClas框架完成多标签分类任务,包括数据准备、环境搭建、模型训练、预测、评估等完整流程。
224 0
|
3月前
|
机器学习/深度学习 数据采集 算法
目标分类笔记(一): 利用包含多个网络多种训练策略的框架来完成多目标分类任务(从数据准备到训练测试部署的完整流程)
这篇博客文章介绍了如何使用包含多个网络和多种训练策略的框架来完成多目标分类任务,涵盖了从数据准备到训练、测试和部署的完整流程,并提供了相关代码和配置文件。
86 0
目标分类笔记(一): 利用包含多个网络多种训练策略的框架来完成多目标分类任务(从数据准备到训练测试部署的完整流程)
|
3月前
|
机器学习/深度学习 XML 并行计算
目标检测实战(七): 使用YOLOX完成对图像的目标检测任务(从数据准备到训练测试部署的完整流程)
这篇文章介绍了如何使用YOLOX完成图像目标检测任务的完整流程,包括数据准备、模型训练、验证和测试。
329 0
目标检测实战(七): 使用YOLOX完成对图像的目标检测任务(从数据准备到训练测试部署的完整流程)

热门文章

最新文章