Facebook开源新的压缩算法，性能超zlib-阿里云开发者社区

Facebook开源新的压缩算法，性能超zlib

2017-07-03 1860

版权

本文内容由阿里云实名注册用户自发贡献，版权归原作者所有，阿里云开发者社区不拥有其著作权，亦不承担相应法律责任。具体规则请查看《阿里云开发者社区用户服务协议》和《阿里云开发者社区知识产权保护指引》。如果您发现本社区中有涉嫌抄袭的内容，填写侵权投诉表单进行举报，一经查实，本社区将立刻删除涉嫌侵权内容。

简介：

近日，Facebook开源了新的压缩算法Zstandard 1.0。据Facebook工程师Yann Collet和Chip Turner介绍，该算法是少数能够在性能和效率方面超过zlib的压缩算法之一，而后者当前是“占统治地位的标准”。Facebook Zstandard利用了Collet之前所做的工作。Collet是LZ4的作者，他在2015年发布了其新算法的第一个版本。

Facebook的基准测试显示，在任意压缩率和压缩带宽组合下，Zstandard的性能都要高于zlib。

特别地，当使用标准无损压缩语料库Silesia时，相比zlib，Zstandard展示了出色的性能：

在压缩率相同的情况下，它的速度快大约3到5倍；在压缩速度相同的情况下，它生成的文件小10%到15%；不管压缩率多大，它解压缩的速度都要快2倍；它的最大压缩率要高许多（大约为4比3.15）。
Zstandard使用了有限状态熵，并以Jarek Duda在熵编码非对称数字系统（ANS）方面的工作为基础。ANS的目标是“避免在压缩速度和压缩率之间进行取舍”，它既可以用于精确编码，也可以用于快速编码，并且支持数据加密。但是，从根本上讲，Zstandard之所以提供了更好的性能是因为它的多项设计和实现选择。

zlib受一个32KB的窗口限制，而Zstandard并没有任何固有的限制，它可以更充分地利用现代环境中的内存，包括移动和嵌入式环境。一个新的Huffman解码器Huff0。它可以借助多个ALU并行解码符号，减少算术操作之间的依赖。
Zstandard设法尽量减少分支，从而将因为分支预测错误而导致的、开销很高的管道清理最小化。下面的例子展示了如何在不使用分支的情况下重写while循环：

/ 经典版本 /while (nbBitsUsed >= 8) { / 每个while测试都是一个分支 / accumulator <<= 8; accumulator += byte++; nbBitsUsed -= 8;}/ 无分支版本 */nbBytesUsed = nbBitsUsed >> 3;nbBitsUsed &= 7;ptr += nbBytesUsed;accumulator = read64(ptr);
对于差别只有几个字节的序列，重复码建模极大地改善了压缩。

Zstandard是使用C语言编写的。它既是一个命令行工具，也是一个库。它提供了20多个压缩级别，让用户可以根据具体可用的硬件、待压缩的数据和待优化的瓶颈进行仔细地调整。Facebook建议开始时使用默认级别3。该级别适合大多数情况。然后，可以尝试9以下的级别，合理地平衡速度和空间，或者使用更高的级别获得更高的压缩率，而20以上的级别则适合那些你不关心压缩速度的情况。

对于Zstandard的未来版本会带来什么特性，Collet和Turner也提供了一些信息，其中包括支持多线程，以及可以提供更快压缩速度和更高压缩率的新的压缩级别。

Zstandard是继苹果的ZLFSE和谷歌的Brotli之后的又一个开源压缩算法。ZLFSE和Brotli都是开源的，每一种算法都针对特定的应用场景进行了优化：Brotli似乎为实现Web资产和Android APK的高压缩率进行了优化，而LZFSE的目标是，在压缩率相同的情况下，提供比zlib更快的压缩速度和更低的电量消耗。

本文转自d1net（转载）

Facebook开源新的压缩算法，性能超zlib

热门文章

最新文章

相关课程

相关电子书

探索云世界

热门

云计算

大数据

云原生

人工智能

数据库

开发与运维

活动广场

任务中心

训练营

直播

乘风者计划

下载

镜像站

技术资料

Facebook开源新的压缩算法，性能超zlib

热门文章

最新文章

相关课程

相关电子书