多媒体信息处理学习笔记-2. Multimedia Data and Coding-阿里云开发者社区

多媒体信息处理学习笔记-2. Multimedia Data and Coding

2023-02-23 108

版权

本文内容由阿里云实名注册用户自发贡献，版权归原作者所有，阿里云开发者社区不拥有其著作权，亦不承担相应法律责任。具体规则请查看《阿里云开发者社区用户服务协议》和《阿里云开发者社区知识产权保护指引》。如果您发现本社区中有涉嫌抄袭的内容，填写侵权投诉表单进行举报，一经查实，本社区将立刻删除涉嫌侵权内容。

简介： 多媒体信息处理学习笔记-2. Multimedia Data and Coding

Chap 2. Multimedia Data and Coding

Lossless compression

Run length

Shannon Fano

Huffman

Dictionary coding

Arithmetic coding

Image compression

图像压缩是一种有损压缩，它利用了图像中的冗余度和人类视觉系统（HVS

JPEG

JPEG是图像压缩领域的第一个国际标准

实现10:1的压缩，而在图像质量方面几乎没有可察觉的损失

基于离散余弦变换（DCT）的有损压缩

基于预测的无损压缩

优点。

– 高度控制的压缩程度。用户可独立选择比率质量/文件大小。

– 格式是兼容的，它可以在任何浏览器、所有电脑和移动设备上正确显示。

– 适用于具有大量色彩和对比度转换的全彩写实图像。

– 画面质量高，压缩程度小。

缺点

– 当你挤压它时，图像可能会 "散开 "成单独的方块–8×8像素的块状物

– JPEG不太适合于处理文本或界限清晰的单色图形

JPEG 2000是由联合摄影专家组委员会在2000年创建的。

用一种新设计的、基于小波的方法取代原来基于DCT的JPEG标准

比JPEG的改进

1.卓越的压缩比

2.人工痕迹不那么明显，几乎没有块

3.渐进式传输

在收到整个文件的较小部分后，观看者可以看到最终图片的较低质量版本。然后通过从源头下载更多的数据位，质量逐步提高。

4.ROI编码

更多的比特被分配到ROI（感兴趣区域）区域，以达到更好的质量。

BMP

 储存二维数字图像，包括单铬和彩色，有各种颜色深度。

GIF

 使用LZW无损数据压缩技术

PNG

 设计为GIF的替代品以避免专利费用

 无法支持动画

音频压缩

 数字化

 抽样调查

 频率 fs

 量化

 量化是一个多对少的映射，它是一个固有的非线性和不可逆的过程

 量化精度

 采样频率fs是根据奈奎斯特理论确定的，音频信号的最大频率fh

 fs >= fh*2

 电话音频的fh约为3.4kHz，所以fs为8kHz。

视频

 视频数据可以表示为一系列的静止图像

 自然视频场景由具有不同形状、纹理和亮度的物体组成。

 自然的视频场景可以从两个方面来表征。

 外观、形状和颜色

 运动、亮度变化、摄像机移动和视角变化

 视频帧在空间和时间领域是连续的

 空间采样

 图像平面上的一个矩形网格

 时间性取样

 在时间轴上有固定间隔的框架

 空间时间域中的每个样本（像素）都用一组数字表示，代表亮度和色度

 视频编码器通常包含三个模块

 时间模型

 空间模型

 熵编码器

 时间模型的目标是通过获得预测帧并减去当前帧中的预测帧来减少帧间冗余。

 预测越准确，输出的残余帧能量就越小。

 预测精度可以通过当前编码帧和参考帧之间的运动补偿来提高。

 时域中最简单的预测是使用当前帧的前一帧作为预测。

 由于帧间运动，残余帧中的能量仍然非常大。

光流

 光流方法试图计算两个图像帧之间的运动，这两个图像帧是在时间t和t+Δt的每个体素位置上拍摄的。

 大量的计算

 相关帧框架可以是前帧，也可以是后帧，或者是时域中相关帧的组合。

 编码器需要在帧间编码和帧内编码之间切换。

 物体运动很少有16x16的整齐边界，可变块大小的运动补偿会更有效。

 由于物体的运动通常不是整数像素的距离，所以用子像素运动补偿来插补参考帧是更有效的。

 较小的块大小可以带来更好的运动补偿效果。

 但较小的区块大小也带来了更大的计算复杂性。

 需要更多的搜索过程

 需要传输的运动矢量的数量会增加

 优化方案是根据图像特征自适应地调整块的大小。

 使用较大的块状尺寸对平坦和一致的区域

 对具有丰富细节的区域使用较小的块状尺寸

多媒体信息处理学习笔记-2. Multimedia Data and Coding

Chap 2. Multimedia Data and Coding

Image compression

音频压缩

视频

热门文章

最新文章

相关电子书

热门

活动广场

任务中心

开发者评测

高校计划

乘风者计划

训练营

阿里云MVP

话题

直播

下载

镜像站

技术资料

插件

多媒体信息处理学习笔记-2. Multimedia Data and Coding

Chap 2. Multimedia Data and Coding

Image compression

音频压缩

视频

热门文章

最新文章

相关电子书