2到5倍压缩比 浪潮全固态存储HF5000如何提高空间使用效率?

简介:

数据压缩技术,是减少数据冗余和所需存储空间的一种技术方法。有研究称,数据压缩的概念最早可以追溯到发明摩斯密码的19世纪,古老的摩斯密码使用了基本的压缩方法,可以有效改善系统的整体效率,从而帮助电报员在更短的时间里传输更多信息。现代的压缩技术则比摩斯密码要复杂很多,今天我们就来看一下,浪潮存储高端联邦的核心成员——全固态存储HF5000-F,使用了哪些创新的压缩技术。

“老司机”带你上高速,实现2到5倍数据压缩比率

压缩算法,对于当前互联网从本地到云端、一切数据流存储的高效运行都至关重要。浪潮在2016年推出的HF全固态存储采用创新技术,在算法上具备较大优势,通过在控制器中置入压缩、去重、消0等高级功能,压缩实际写入3D NAND的数据量,可用容量提升5倍+,整体性能提升2-3倍。

浪潮固态存储HF5000-F在压缩功能方面,称得上是一名“老司机”,可以提供更高的压缩比,为数据存储节省更多空间。它的在线数据压缩功能,可在数据写入SSD之前用压缩算法对数据内容进行压缩,在不影响存储性能的同时,达到2到5倍的数据压缩比率,压缩后的数据才写入SSD。

有效的在线数据压缩,可以降低SSD闪存介质进行重复数据删除时的Hash存储消耗,从而提高SSD使用率。数据压缩技术在除虚拟化桌面VDI之外的更多应用环境中,都比重复数据删除具备更高的效率与优势。

浪潮HF5000-F的高速压缩秘籍:变长数据块布局

下面就来看一下,这名“老司机”——浪潮HF5000-F在线数据压缩功能的工作原理介绍。

首先,看写入操作。浪潮HF5000-F采用有后备电源的镜像NVRAM做写缓存掉电安全保护,写入数据同时进入普通内存和NVRAM,并在两个控制器的NVRAM之间做镜像复制,镜像完成后,向主机回复写入操作完成,然后存储系统对在内存中的写入数据进行压缩处理。

与在线重复数据删除一样,浪潮HF5000-F在线数据压缩的技术基础是“变长数据块布局”,在线数据压缩的过程是:

首先,将多个数据块分别加以压缩:

2到5倍压缩比 浪潮全固态存储HF5000如何提高空间使用效率? 

压缩后的数据块长度不尽相同,逻辑上合并为“数据组”,即数据条带:

2到5倍压缩比 浪潮全固态存储HF5000如何提高空间使用效率? 

然后将“数据组”即数据条带,顺序写入最终存储介质,如SSD盘或磁盘:

2到5倍压缩比 浪潮全固态存储HF5000如何提高空间使用效率? 

在这一过程中,如果某一数据块M需要更新,则只需将更新的M’压缩,合并进入新的“数据组”,然后如往常一样,顺序写入存储介质。这就为“数据压缩、更新、再压缩”的过程节省了大量的计算和后台资源,不需要对M及同组所有数据块解压缩、再对M’和同组数据块进行再次压缩,也无需额外将闪存或磁盘介质上的M以及同组所有数据块读至系统内存、写入至存储介质。

举例来说,浪潮HF5000-F的“变长数据块布局”,就像一辆高速前行的列车,如果车厢中的某位“乘客”M需要更新,只需针对M提供单独的服务,而不会打扰到其他乘客。 

高效压缩,性能无损

浪潮HF5000-F在线压缩对性能的影响仅在1%~3%,可以忽略不计。HF5000-F系列采用的LZ4压缩算法以快速及资源开销小为目标,并不追求极致的压缩比,因此对控制器的CPU、内存等资源占用很少。对于HF5000-F系列选用的Intel Xeo CPU而言,使用LZ4算法对CPU只有3%左右的资源占用。性能影响的不同,主要受数据压缩的效果影响,如果压缩效果好,则完全可以忽略对系统的整体影响;即使压缩效果不够理想,对性能也仅有3%左右的微小影响。

2到5倍压缩比 浪潮全固态存储HF5000如何提高空间使用效率?

浪潮固态存储HF5000

走在业界前列,适用各类场景

浪潮固态存储在算法上的创新与优势走在业界前列,HF5000-F的数据压缩功能适合于各种应用环境,它的在线数据压缩不会带来性能损耗,所以这项功能在默认情况下都是处于打开状态的;如果在数据本身就是压缩格式的场景下,HF5000-F也可以按照数据卷关闭压缩功能。

在创新技术的支撑下,HF5000-F适用于多媒体音频、视频、图像等各类常见压缩格式的数据,可以为金融、互联网、制造、医疗、政府等各类追求高I/O和低延时的场景,提供高效、稳健的数据服务。


原文发布时间为:2017年2月21日

本文来自云栖社区合作伙伴至顶网,了解相关信息可以关注至顶网。

相关文章
|
存储 Kubernetes Cloud Native
一文搞懂云原生架构
目前,每个 IT 资源或产品都作为服务提供。而且伴随云计算的滚滚浪潮,云原生(CloudNative)的概念应运而生,云原生很火,火得一塌糊涂,都0202年了,如果还不懂云原生,那真的out了。因此,云原生软件开发成为每个企业的关键要求,无论其规模和性质如何。在加入云计算潮流之前,了解什么是云原生架构以及如何为云原生应用程序需求设计正确的架构非常重要。
一文搞懂云原生架构
|
算法 分布式数据库 分布式计算
|
编解码 JSON 自然语言处理
通义千问重磅开源Qwen2.5,性能超越Llama
击败Meta,阿里Qwen2.5再登全球开源大模型王座
5884 19
|
机器学习/深度学习 存储 人工智能
用60%成本干80%的事,DeepSeek分享沉淀多年的高性能深度学习架构
【10月更文挑战第2天】近年来,深度学习(DL)与大型语言模型(LLMs)的发展推动了AI的进步,但也带来了计算资源的极大需求。为此,DeepSeek团队提出了Fire-Flyer AI-HPC架构,通过创新的软硬件协同设计,利用10,000个PCIe A100 GPU,实现了高性能且低成本的深度学习训练。相比NVIDIA的DGX-A100,其成本减半,能耗降低40%,并在网络设计、通信优化、并行计算和文件系统等方面进行了全面优化,确保系统的高效与稳定。[论文地址](https://arxiv.org/pdf/2408.14158)
715 5
|
并行计算 前端开发 物联网
全网首发!真·从0到1!万字长文带你入门Qwen2.5-Coder——介绍、体验、本地部署及简单微调
2024年11月12日,阿里云通义大模型团队正式开源通义千问代码模型全系列,包括6款Qwen2.5-Coder模型,每个规模包含Base和Instruct两个版本。其中32B尺寸的旗舰代码模型在多项基准评测中取得开源最佳成绩,成为全球最强开源代码模型,多项关键能力超越GPT-4o。Qwen2.5-Coder具备强大、多样和实用等优点,通过持续训练,结合源代码、文本代码混合数据及合成数据,显著提升了代码生成、推理和修复等核心任务的性能。此外,该模型还支持多种编程语言,并在人类偏好对齐方面表现出色。本文为周周的奇妙编程原创,阿里云社区首发,未经同意不得转载。
30191 18
|
SQL 关系型数据库 MySQL
关系型数据库的并发处理能力限制
【5月更文挑战第3天】关系型数据库的并发处理能力限制
421 8
关系型数据库的并发处理能力限制
|
人工智能 并行计算 云计算
从UALink近期发展再看GPU Scale Up的互连方向
ALink System的目标是聚焦GPU算力需求、驱动云计算定义的开放生态,形成智算超节点的竞争力。
|
JavaScript 算法 网络协议
【Node系列】node中的流(Stream)
Node.js 中的流(Stream)是一种处理数据的方式,它允许你以流的方式处理数据,而不是一次性加载整个数据集。这种方式对于处理大量数据非常有用,因为它可以减少内存的使用并提高性能。
179 4
|
SQL Java 关系型数据库
【Spring】配置文件的使用
1. 什么是配置文件 2. 为什么需要配置文件 3. Java 应用常见的配置文件格式 3.1 特殊说明 4. *.properties 4.1 properties 配置文件说明 4.2 properties 基本语法 4.3 注意 5. *.yml 5.1 yml 配置文件说明 5.2 yml 基本语法 6. 修改 Spring 配置的一些配置信息 7. 在配置文件中配置对象 8. 在 Bean 读取配置信息的三种方法 8.1 使用 Spring 提供的 Environment 对象 8.2 使用 @Value 注解 8.3 使用注解 @ConfigurationProperties 将配
956 3
|
前端开发 JavaScript Java
基于Vue和SpringBoot的网上蛋糕销售系统的设计和实现(一)
基于Vue和SpringBoot的网上蛋糕销售系统的设计和实现
1425 0

热门文章

最新文章