【H.264/AVC视频编解码技术详解】十五、H.264的变换编码(二):H.264整数变换和量化的实现

简介: 《H.264/AVC视频编解码技术详解》视频教程已经在“CSDN学院”上线,视频中详述了H.264的背景、标准协议和实现,并通过一个实战工程的形式对H.

《H.264/AVC视频编解码技术详解》视频教程已经在“CSDN学院”上线,视频中详述了H.264的背景、标准协议和实现,并通过一个实战工程的形式对H.264的标准进行解析和实现,欢迎观看!

“纸上得来终觉浅,绝知此事要躬行”,只有自己按照标准文档以代码的形式操作一遍,才能对视频压缩编码标准的思想和方法有足够深刻的理解和体会!

链接地址:H.264/AVC视频编解码技术详解

GitHub代码地址:点击这里


一、H.264的整数变换

变换和量化编码在图像和视频的压缩编码中具有重要作用。通过变换编码,空间域信息可以被转换到频率域,使其能量集中于低频区域,并使其码率相对于空间信号有大幅下降。H.264定义了4×4的整数离散余弦变换(简称整数变换),相对浮点数的离散余弦变换,整数变换具有更低的运算复杂度,更适用于移动设备等适用于低功耗的设备运行。

H.264的整数变换的主要流程如下图所示:

标准的离散余弦变换经过多重运算和修正后,可以用下式表示:

在上式中,右侧的矩阵通常可以表示为常量矩阵,且并入量化中实现,左侧的变换只剩下加减和位移操作。通过这种方式构成了实际的整数变换操作。很明显,相对于原始的DCT变换,该变换的运算量明显要小得多。


二、量化

量化运算实际上并非视频压缩领域首先使用的。在通信信号处理等领域,量化技术早就获得广泛的应用。在模拟-数字信号转化过程中,首先需要对模拟信号按照某个频率进行采样,获得离散时间信号,其取值范围为一个连续区间。此时的离散时间信号尚不能称之为数字信号。

为了对信号进行数字化,必须对离散时间信号进行量化,将连续的取值范围区间也进行离散化。这样的取值位置离散,采样值也是离散的信号称之为数字信号。

在一维信号的量化过程中,我们就已经知道,对于同一模拟信号,使用不同的参数进行量化的结果可能差别非常大,如下图:

上图的量化步长更小,因此失真明显比量化步长更大的下图更小。

在H.264中,量化方法选择了运算较为简单的标量量化。通常标量量化的原理为:

FQ = round(y/QStep)

在上式中,y表示待量化的原始数值,FQ为量化后的值,QP为量化参数。量化的相反过程称之为反量化,其原理为:

y' = QStep × FQ

量化与反量化关键的因素在于量化参数QP。量化参数决定了量化步长,而量化步长决定了量化过程的精细度:QP越小,量化步长越小,量化过程中的真实数据损失越小。QP每增加6,量化步长增大一倍。在H.264中,通常亮度分量的QP取值范围为[0,51],色度分量QP的取值范围为[0,39]。

在H.264的量化过程中,还需要实现变换中的Ef矩阵按元素相乘的操作。量化和矩阵Ef的运算可通过与量化参数QP相关的预定义矩阵实现。

16×16模式与色度分量的变换量化

对于4×4模式的色度分量与16×16模式,其变换量化方法与4×4模式的亮度分量有些不同。

对于16×16的亮度块,变换量化的块包括两个部分:直流部分DC和交流部分AC。16×16亮度块的变换和量化依然要分为16个4×4个子块实现,而与4×4模式不同的是,16×16模式首先抽取出16个4×4系数矩阵的直流分量,组成一个新的4×4矩阵,再对这个直流矩阵进行Hadamard变换后再进行量化。Hadamard变换的原理如下式:

对于4×4模式的色度分量,同样需要抽取直流分量进行Hadamard变换然后再进行量化。然而色度分量的大小为8×8,每个分量分为4个4×4个子块,因此Hadamard变换的直流分量矩阵为2×2大小:

目录
相关文章
|
存储 安全 编译器
【Qt 底层机制之信号和槽 】深入探究Qt信号和槽背后的原理
【Qt 底层机制之信号和槽 】深入探究Qt信号和槽背后的原理
3441 4
|
8月前
|
数据可视化 流计算 Python
Python创意爱心代码大全:从入门到高级的7种实现方式
本文分享了7种用Python实现爱心效果的方法,从简单的字符画到复杂的3D动画,涵盖多种技术和库。内容包括:基础字符爱心(一行代码实现)、Turtle动态绘图、Matplotlib数学函数绘图、3D旋转爱心、Pygame跳动动画、ASCII艺术终端显示以及Tkinter交互式GUI应用。每种方法各具特色,适合不同技术水平的读者学习和实践,是表达创意与心意的绝佳工具。
7193 0
|
Java 数据库连接 API
Seata异常捕获问题之回滚事务如何解决
Seata是一款开源的分布式事务解决方案,旨在提供高效且无缝的分布式事务服务;在集成和使用Seata过程中,开发者可能会遇到不同的异常问题,本合集针对Seata常见异常进行系统整理,为开发者提供详细的问题分析和解决方案,助力高效解决分布式事务中的难题。
907 98
|
算法 Linux Windows
FFmpeg开发笔记(十七)Windows环境给FFmpeg集成字幕库libass
在Windows环境下为FFmpeg集成字幕渲染库libass涉及多个步骤,包括安装freetype、libxml2、gperf、fontconfig、fribidi、harfbuzz和libass。每个库的安装都需要下载源码、配置、编译和安装,并更新PKG_CONFIG_PATH环境变量。最后,重新配置并编译FFmpeg以启用libass及相关依赖。完成上述步骤后,通过`ffmpeg -version`确认libass已成功集成。
572 1
FFmpeg开发笔记(十七)Windows环境给FFmpeg集成字幕库libass
|
算法 计算机视觉 Python
DSP技术深度解析:原理、实践与应用
DSP技术深度解析:原理、实践与应用
1502 1
|
存储 Linux 程序员
Linux解压Zip文件命令详解
Linux解压Zip文件命令详解
|
算法
3D Hough变换点云平面检测算法
3D Hough变换点云平面检测算法
587 0
|
机器学习/深度学习 前端开发 vr&ar
未来前端发展趋势与挑战
【2月更文挑战第4天】 随着互联网技术的快速发展,前端开发作为用户与网站交互的重要环节,其发展也日益受到重视。本文探讨了未来前端发展的趋势与挑战,从人工智能、跨平台开发、AR/VR技术等方面展望了前端技术的发展方向,同时也指出了前端开发者在面对这些变化时需要面对的挑战。