多媒体信息处理学习笔记-2. Multimedia Data and Coding

简介: 多媒体信息处理学习笔记-2. Multimedia Data and Coding

Chap 2. Multimedia Data and Coding


Lossless compression


Run length

Shannon Fano

Huffman

Dictionary coding

Arithmetic coding


Image compression

图像压缩是一种有损压缩,它利用了图像中的冗余度和人类视觉系统(HVS


JPEG


JPEG是图像压缩领域的第一个国际标准

实现10:1的压缩,而在图像质量方面几乎没有可察觉的损失

基于离散余弦变换(DCT)的有损压缩

基于预测的无损压缩

优点。

– 高度控制的压缩程度。用户可独立选择比率质量/文件大小。

– 格式是兼容的,它可以在任何浏览器、所有电脑和移动设备上正确显示。

– 适用于具有大量色彩和对比度转换的全彩写实图像。

– 画面质量高,压缩程度小。


缺点

– 当你挤压它时,图像可能会 "散开 "成单独的方块–8×8像素的块状物

– JPEG不太适合于处理文本或界限清晰的单色图形


JPEG 2000是由联合摄影专家组委员会在2000年创建的。

用一种新设计的、基于小波的方法取代原来基于DCT的JPEG标准

比JPEG的改进

1.卓越的压缩比

2.人工痕迹不那么明显,几乎没有块

3.渐进式传输

在收到整个文件的较小部分后,观看者可以看到最终图片的较低质量版本。然后通过从源头下载更多的数据位,质量逐步提高。

4.ROI编码

更多的比特被分配到ROI(感兴趣区域)区域,以达到更好的质量。


BMP

 储存二维数字图像,包括单铬和彩色,有各种颜色深度。

GIF

 使用LZW无损数据压缩技术

PNG

 设计为GIF的替代品以避免专利费用

 无法支持动画


音频压缩

 数字化

 抽样调查

 频率 fs

 量化

 量化是一个多对少的映射,它是一个固有的非线性和不可逆的过程

 量化精度


 采样频率fs是根据奈奎斯特理论确定的,音频信号的最大频率fh

 fs >= fh*2

 电话音频的fh约为3.4kHz,所以fs为8kHz。


视频

 视频数据可以表示为一系列的静止图像

 自然视频场景由具有不同形状、纹理和亮度的物体组成。

 自然的视频场景可以从两个方面来表征。

 外观、形状和颜色

 运动、亮度变化、摄像机移动和视角变化


 视频帧在空间和时间领域是连续的

 空间采样

 图像平面上的一个矩形网格

 时间性取样

 在时间轴上有固定间隔的框架

 空间时间域中的每个样本(像素)都用一组数字表示,代表亮度和色度


 视频编码器通常包含三个模块

 时间模型

 空间模型

 熵编码器



 时间模型的目标是通过获得预测帧并减去当前帧中的预测帧来减少帧间冗余。

 预测越准确,输出的残余帧能量就越小。

 预测精度可以通过当前编码帧和参考帧之间的运动补偿来提高。


 时域中最简单的预测是使用当前帧的前一帧作为预测。

 由于帧间运动,残余帧中的能量仍然非常大。


光流

 光流方法试图计算两个图像帧之间的运动,这两个图像帧是在时间t和t+Δt的每个体素位置上拍摄的。

 大量的计算


 相关帧框架可以是前帧,也可以是后帧,或者是时域中相关帧的组合。

 编码器需要在帧间编码和帧内编码之间切换。

 物体运动很少有16x16的整齐边界,可变块大小的运动补偿会更有效。

 由于物体的运动通常不是整数像素的距离,所以用子像素运动补偿来插补参考帧是更有效的。

 较小的块大小可以带来更好的运动补偿效果。

 但较小的区块大小也带来了更大的计算复杂性。

 需要更多的搜索过程

 需要传输的运动矢量的数量会增加

 优化方案是根据图像特征自适应地调整块的大小。

 使用较大的块状尺寸对平坦和一致的区域

 对具有丰富细节的区域使用较小的块状尺寸

目录
相关文章
|
2月前
|
传感器 人工智能 机器人
Multi-Agent应用领域及项目示例
多智能体系统(MAS)通过多个自主、交互式的智能体协同工作,能够更高效地解决复杂问题,提高系统的灵活性和鲁棒性。本文详细介绍了MAS的概念、特点及其在人工智能与机器人技术、经济与商业、交通管理、医疗健康和环境保护等领域的具体应用示例。
106 0
|
5月前
|
存储 物联网 数据库
App Inventor 2 低功耗蓝牙 BlueToothLE 拓展中文文档(完整翻译加强版)
低功耗蓝牙,也称为蓝牙LE 或简称 BLE,是一种类似于经典蓝牙的新通信协议,不同之处在于它旨在消耗更少的功耗和成本,同时保持同等的功能。 因此,低功耗蓝牙是与耗电资源有限的物联网设备进行通信的首选。
180 0
|
JavaScript 前端开发 数据挖掘
Echarts数据分析系统Data Analysis Platform使用说明文档
Echarts数据分析系统Data Analysis Platform使用说明文档
125 0
|
存储 算法 数据挖掘
多媒体信息处理学习笔记-Chap 5. Audio Retrieval(上篇)
多媒体信息处理学习笔记-Chap 5. Audio Retrieval(上篇)
128 0
|
机器学习/深度学习 存储 自然语言处理
多媒体信息处理学习笔记-Chap 5. Audio Retrieval(下篇)
多媒体信息处理学习笔记-Chap 5. Audio Retrieval(下篇)
131 0
多媒体信息处理学习笔记-Chap 5. Audio Retrieval(下篇)
|
机器学习/深度学习 存储 传感器
多媒体信息处理学习笔记-Chap 5. Audio Retrieval(中篇)
多媒体信息处理学习笔记-Chap 5. Audio Retrieval(中篇)
101 0
|
存储 自然语言处理 算法
多媒体信息处理学习笔记-1Introduction
多媒体信息处理学习笔记-1Introduction
113 0
|
芯片 SoC
基于XQ6657Z35-EVM开发平台上TI TMS320C6657 TLV320AIC3206音频设计
TMS320C6657 Audio设计 评估板XQ6657Z35-EVM,音频输入输出设计,其引脚定义如下图: (TLV320AIC3206IRSBR音频接口芯片)
基于XQ6657Z35-EVM开发平台上TI TMS320C6657 TLV320AIC3206音频设计
SAP SD基础知识之文本确定(Text Determination)
SAP SD基础知识之文本确定(Text Determination)
SAP SD基础知识之文本确定(Text Determination)
|
存储 ARouter 前端开发
毕业设计So Easy:珠穆朗玛FM音频电台APP
毕业设计So Easy:珠穆朗玛FM音频电台APP
毕业设计So Easy:珠穆朗玛FM音频电台APP