2到5倍压缩比 浪潮全固态存储HF5000如何提高空间使用效率?

简介:

数据压缩技术,是减少数据冗余和所需存储空间的一种技术方法。有研究称,数据压缩的概念最早可以追溯到发明摩斯密码的19世纪,古老的摩斯密码使用了基本的压缩方法,可以有效改善系统的整体效率,从而帮助电报员在更短的时间里传输更多信息。现代的压缩技术则比摩斯密码要复杂很多,今天我们就来看一下,浪潮存储高端联邦的核心成员——全固态存储HF5000-F,使用了哪些创新的压缩技术。

“老司机”带你上高速,实现2到5倍数据压缩比率

压缩算法,对于当前互联网从本地到云端、一切数据流存储的高效运行都至关重要。浪潮在2016年推出的HF全固态存储采用创新技术,在算法上具备较大优势,通过在控制器中置入压缩、去重、消0等高级功能,压缩实际写入3D NAND的数据量,可用容量提升5倍+,整体性能提升2-3倍。

浪潮固态存储HF5000-F在压缩功能方面,称得上是一名“老司机”,可以提供更高的压缩比,为数据存储节省更多空间。它的在线数据压缩功能,可在数据写入SSD之前用压缩算法对数据内容进行压缩,在不影响存储性能的同时,达到2到5倍的数据压缩比率,压缩后的数据才写入SSD。

有效的在线数据压缩,可以降低SSD闪存介质进行重复数据删除时的Hash存储消耗,从而提高SSD使用率。数据压缩技术在除虚拟化桌面VDI之外的更多应用环境中,都比重复数据删除具备更高的效率与优势。

浪潮HF5000-F的高速压缩秘籍:变长数据块布局

下面就来看一下,这名“老司机”——浪潮HF5000-F在线数据压缩功能的工作原理介绍。

首先,看写入操作。浪潮HF5000-F采用有后备电源的镜像NVRAM做写缓存掉电安全保护,写入数据同时进入普通内存和NVRAM,并在两个控制器的NVRAM之间做镜像复制,镜像完成后,向主机回复写入操作完成,然后存储系统对在内存中的写入数据进行压缩处理。

与在线重复数据删除一样,浪潮HF5000-F在线数据压缩的技术基础是“变长数据块布局”,在线数据压缩的过程是:

首先,将多个数据块分别加以压缩:

2到5倍压缩比 浪潮全固态存储HF5000如何提高空间使用效率? 

压缩后的数据块长度不尽相同,逻辑上合并为“数据组”,即数据条带:

2到5倍压缩比 浪潮全固态存储HF5000如何提高空间使用效率? 

然后将“数据组”即数据条带,顺序写入最终存储介质,如SSD盘或磁盘:

2到5倍压缩比 浪潮全固态存储HF5000如何提高空间使用效率? 

在这一过程中,如果某一数据块M需要更新,则只需将更新的M’压缩,合并进入新的“数据组”,然后如往常一样,顺序写入存储介质。这就为“数据压缩、更新、再压缩”的过程节省了大量的计算和后台资源,不需要对M及同组所有数据块解压缩、再对M’和同组数据块进行再次压缩,也无需额外将闪存或磁盘介质上的M以及同组所有数据块读至系统内存、写入至存储介质。

举例来说,浪潮HF5000-F的“变长数据块布局”,就像一辆高速前行的列车,如果车厢中的某位“乘客”M需要更新,只需针对M提供单独的服务,而不会打扰到其他乘客。 

高效压缩,性能无损

浪潮HF5000-F在线压缩对性能的影响仅在1%~3%,可以忽略不计。HF5000-F系列采用的LZ4压缩算法以快速及资源开销小为目标,并不追求极致的压缩比,因此对控制器的CPU、内存等资源占用很少。对于HF5000-F系列选用的Intel Xeo CPU而言,使用LZ4算法对CPU只有3%左右的资源占用。性能影响的不同,主要受数据压缩的效果影响,如果压缩效果好,则完全可以忽略对系统的整体影响;即使压缩效果不够理想,对性能也仅有3%左右的微小影响。

2到5倍压缩比 浪潮全固态存储HF5000如何提高空间使用效率?

浪潮固态存储HF5000

走在业界前列,适用各类场景

浪潮固态存储在算法上的创新与优势走在业界前列,HF5000-F的数据压缩功能适合于各种应用环境,它的在线数据压缩不会带来性能损耗,所以这项功能在默认情况下都是处于打开状态的;如果在数据本身就是压缩格式的场景下,HF5000-F也可以按照数据卷关闭压缩功能。

在创新技术的支撑下,HF5000-F适用于多媒体音频、视频、图像等各类常见压缩格式的数据,可以为金融、互联网、制造、医疗、政府等各类追求高I/O和低延时的场景,提供高效、稳健的数据服务。


原文发布时间为:2017年2月21日

本文来自云栖社区合作伙伴至顶网,了解相关信息可以关注至顶网。

相关文章
|
7月前
|
数据采集 人工智能 测试技术
3倍生成速度还降内存成本,超越Medusa2的高效解码框架终于来了
【5月更文挑战第21天】CLLM,一种新方法,通过并行解码提升大型语言模型推理速度3-4倍,降低内存成本,超越Medusa2。采用Jacobi解码和微调策略,保证生成质量。无需修改模型架构,训练成本低,可与现有技术集成。但依赖高质量数据集,更大数据集可提高泛化能力。[链接](https://arxiv.org/pdf/2403.00835)
68 2
|
存储 弹性计算 NoSQL
突破内存应用瓶颈,让IT成本下降40%的秘诀
近两年5G、大数据、云计算一直为行业热点,数字化进程不断加速,全行业数据开始爆发式增长。面对数据的迅猛增长,企业一方面享受着数据化转型带来的红利,另一方面也承担着大内存运行实例的高额开支。传统内存面临挑战,持久内存方案开始受到了行业更多的关注。
突破内存应用瓶颈,让IT成本下降40%的秘诀
|
测试技术 芯片 Windows
|
存储 内存技术 数据中心
|
存储 固态存储 数据中心
|
存储 前端开发 数据库