在数字化时代,图像是信息传递的最重要载体之一,从智能手机拍摄的海量照片,到互联网上琳琅满目的图片资源,再到专业领域如医学影像、卫星遥感图像等,各类图像数据的规模一直呈爆炸式增长,对于传输及存储都是巨大挑战,因此图片编码技术也在不断演进,以适应日益增长的图像处理需求。
称霸30年的互联网图片格式——JPEG
目前常见的图片格式有 PNG、GIF、BMP 以及 JPEG 等。PNG 格式支持透明背景,图像质量较高且无损压缩,适用于图标、网页元素等对图像质量和透明度有要求的场景,但文件大小相对较大。GIF 格式则擅长处理简单动画,颜色数量有限,在早期的网页动画制作中广泛应用,但其图像质量和色彩表现力在复杂图像面前略显不足。BMP 格式是一种简单的位图格式,不进行压缩或采用简单的无损压缩,图像质量高但文件体积庞大,常用于 Windows 系统中的一些基本图像显示和处理场景。
而JPEG 格式在图片编码领域占据着极为重要的地位,是目前互联网上应用最为广泛的图片格式之一。据统计,在互联网中的图片资源里,JPEG 格式图片的占比超过了 60%,如社交媒体平台、电商网站等,大量的用户上传图片目前都采用的是 JPEG 格式。
JPEG广泛应用的原因在于其独特的压缩特性,在图像质量和文件大小之间取得了良好的平衡。无论是在网页浏览、社交媒体分享,还是在移动应用中的图片展示,JPEG 都能以较小的文件大小快速加载,同时呈现出优质的视觉效果,极大地提升了用户的图像交互体验。因此,微帧认为,深入优化JPEG图片编码压缩技术,对于图像存储及传输都具有重要应用价值。
微帧WZ-JPEG编码压缩技术优势
JPEG编码的核心原理是基于人类视觉系统(HVS)的特性,通过对图像数据进行巧妙的变换和编码,在尽可能保留图像视觉质量的前提下,大幅减少数据量。
具体技术流程包含多个关键步骤:首先需要将RGB转换为YCrCb,再通过YUV411或YUV422方式进行采样,再将图像分割成多个 8x8 的像素块。对于每个像素块,进行离散余弦变换(DCT)。DCT 的作用是将图像的空间域信息转换为频率域信息,使得图像数据的能量分布更加集中。在频率域中,图像的低频部分包含了图像的主要信息,如整体的亮度、颜色分布等,而高频部分则主要体现图像的细节和边缘信息。通过 DCT 变换后,大部分能量集中在低频系数上,高频系数相对较小。接着,对 DCT 系数进行量化处理。量化过程根据预先设定的量化表,对不同频率的系数采用不同的量化步长。由于人类视觉对高频信息相对不敏感,所以对高频系数采用较大的量化步长,这样可以大幅减少数据量。量化后的系数再进行熵编码,通常采用霍夫曼编码或算术编码,目的是进一步去除数据中的冗余信息,将量化后的系数转换为更紧凑的二进制码流。
微帧针对JPEG编码压缩技术进行了深度优化,在实际应用中展现了以下优势:
1)相较于开源编码器,微帧WZ-JPEG的压缩效率实现了显著提升,平均可多节省27%左右的图片体积,对于复杂度不高的场景图片,WZ-JPEG更是实现了高达40%的压缩优势;
2)在编码速度方面,达到了开源编码器的4倍,极大提升了图片压缩的效率;
3)具备极强的鲁棒性,在面对不同类型、不同分辨率的图片时,均能保持稳定的压缩效果,展现了卓越的稳定性。
经过多次实验验证,在确保VMAF分数保持相近水平(即图片画质维持相当标准)的条件下,WZ-JPEG相较于开源的Libjpeg,压缩后体积平均降低了27.68%,与原始图片相比,WZ-JPEG实现了高达平均92.68%的压缩率。
下图为实验结果中挑选的一组色彩艳丽的图片,经过细致对比分析,发现相较于开源Libjpeg,WZ-JPEG在体积节省约42%的情况下,保留了更丰富的细节,同时WZ-JPEG在处理色彩丰富的图像时,能在极致压缩的过程中最大限度地保持鲜活真实的色彩。
在人物细节的保留方面,WZ-JPEG也展示出了明显优势,如下图所示,相较于开源Libjpeg,WZ-JPEG压缩后的图片节省了约46%的体积,同时对两者图像细节进行对比,如肌肤纹理的细腻程度、发丝的丝丝分明、边缘轮廓的锐度等高频信息,均保持了高度的一致性。
除了JPEG格式之外,微帧针对市面上广泛使用的各类图片格式,均进行了专门的编码压缩算法优化。比如对于WebP格式,微帧的WZ-WebP压缩算法,与开源编码器相比,同画质下能够节省约20%的体积。更进一步,在处理具备更高压缩效率的HEIF格式时,微帧的WZ-HEIF技术相较于开源编码器,展现出了约33%的压缩优势。而对于更为前沿的AVIF图片格式,微帧WZ-AVIF同样表现卓越,展现了大约25%的压缩优势。这些优化彰显着微帧在图像处理领域的深厚技术积累,如今微帧的图片智能压缩产品已广泛应用于社交平台、资讯、电商、手机相册等场景,为各类应用带来了更高效、优质的图片压缩效果。