h.264加权预测

简介:

帧间运动是基于视频亮度(luma)不发生改变的一个假设,而在视频序列中经常能遇到亮度变化的场景,比如淡入淡出、镜头光圈调整、整体或局部光源改变等,在这些场景中,简单帧间运动补偿的效果可想而知(实际编码中遇到亮度变化的宏块,R-D模型的最后结果通常都是用帧内预测编码),加权预测的提出就是为 了应对亮度变化的场景。

在h.264中两种预测模式:显示模式(explicit mode)与隐式模式(implicit mode),另外还有一种默认预测模式,不过这相当于不进行预测。

P帧与B帧都有显式模式,隐式模式只有B帧适用。至于怎么区分两种模式,简单来说,显式模式,需要在片头中传输权重(weight),而隐式模式则不需要。

      

加权预测可以分为三个步骤:

  1. 亮度变化检测。一般是用阈值判断亮度是否发生变化。
  2. 确定权重与偏移。就目前来说,用的都是简单的加权预测算法,这步是跟亮度变化检测连在一起的,因为是用权重来判断亮度是否发生了变化。
  3. 亮度补偿,把参考帧通过权重与偏移的线性补偿得到加权参考帧。

 

显式模式

对于显式模式来说,我们可以认为亮度在当前帧与参考帧是线性变化的,既有如下关系:

LumaCur=weight×LumaRef+offset25LumaCur=weight×LumaRef+offset25

其中权重(weight)会被归一化为32(2^5),因此我们就可以用weight与offset来表示两帧亮度的变化:

weight=25LumaCurijLumaRefijweight=25⋅∑LumaCurij∑LumaRefij

{0i<imgWidth0j<imgHeight{0≤i<imgWidth0≤j<imgHeight

尽管这种用整个帧的亮度做比较会忽视图像的局部变化,但是由于其简单的计算方式,目前JM还是用的这种方法来得到权重。当然,在得到权重之后我们需要判断该权重是否超出既定的阈值,如果超出阈值则表示亮度没有发生变化,采用默认的加权预测(即不预测)。

offset=0offset=0    在JM中offsetoffset默认为0

      

 隐式模式

隐式模式也同样是基于亮度线性变化的假设。B帧与其两个参考帧:RefFront与RefBack在POC位置上保持着线性的关系

weightBackweightFront=26LengthFrontLengthFront+LengthBack=26weightBackweightBack=26⋅LengthFrontLengthFront+LengthBackweightFront=26−weightBack

 

无论前向参考帧与后向参考帧距离有多长,最终都会归一化为64,然后求出两个参考帧的权重

 

最后的亮度补偿只是把参考帧用weight与offset进行线性处理而已

Lumaij=weight×LumaRefij+offset2nLumaij′=weight×LumaRefij+offset2n

最最后需要补充一句的是,因为当前还没确定应该用参考帧列表中的哪一帧作为当前帧的参考帧,所以加权预测必须对当前参考帧列表中的所有帧求出weightweight与offsetoffset,而隐式模式,更是需要对listX[0]listX[0]与listX[1]listX[1]两个参考帧列表中所有的帧进行listXSize[0]×listXSize[1]listXSize[0]×listXSize[1]次配对后,再分别求出每对参考帧的两个weightweight与offset

目录
相关文章
|
8月前
|
算法 数据挖掘
WinBUGS对多元随机波动率SV模型:贝叶斯估计与模型比较
WinBUGS对多元随机波动率SV模型:贝叶斯估计与模型比较
|
数据处理
数据处理 过采样与欠采样 SMOTE与随机采样 达到样本均衡化
数据处理 过采样与欠采样 SMOTE与随机采样 达到样本均衡化
351 0
数据处理 过采样与欠采样 SMOTE与随机采样 达到样本均衡化
|
3月前
|
机器学习/深度学习 数据可视化
FredNormer: 非平稳时间序列预测的频域正则化方法
FredNormer是一种创新的频域正则化方法,旨在提高时间序列预测模型处理非平稳数据的能力。现有正则化技术虽在分布偏移上有所成效,但在频域动态模式捕捉方面存在不足。FredNormer通过自适应增强关键频率分量的权重,解决了这一问题,并设计了即插即用模块,便于集成到各类预测模型中。实验表明,FredNormer在多个公共数据集上显著提升了预测精度,特别是在复杂频率特征的数据集上效果显著。此外,其计算效率也优于现有方法。该方法为非平稳时间序列预测提供了有力工具。
76 3
FredNormer: 非平稳时间序列预测的频域正则化方法
|
6月前
|
机器学习/深度学习 PyTorch 算法框架/工具
VQ-VAE:矢量量化变分自编码器,离散化特征学习模型
VQ-VAE 是变分自编码器(VAE)的一种改进。这些模型可以用来学习有效的表示。本文将深入研究 VQ-VAE 之前,不过,在这之前我们先讨论一些概率基础和 VAE 架构。
202 10
|
8月前
|
机器学习/深度学习 编解码 计算机视觉
YOLOv5改进 | 2023 | Deformable-LKA可变形大核注意力(涨点幅度超高)
YOLOv5改进 | 2023 | Deformable-LKA可变形大核注意力(涨点幅度超高)
172 0
|
8月前
|
算法 测试技术 vr&ar
用综合信息准则比较随机波动率(SV)模型对股票价格时间序列建模
用综合信息准则比较随机波动率(SV)模型对股票价格时间序列建模
|
8月前
|
机器学习/深度学习 传感器 编解码
快7倍 | SpirDet基于降采样正交重参化+稀疏解码器有效减少延迟,同时提升小目标检测精度
快7倍 | SpirDet基于降采样正交重参化+稀疏解码器有效减少延迟,同时提升小目标检测精度
134 0
|
机器学习/深度学习 算法 固态存储
目标检测误检与负样本问题
目标检测误检与负样本问题
489 0
|
BI
信息率失真函数与平均互信息
信息率失真函数与平均互信息
202 0
|
机器学习/深度学习 监控
使用2D卷积技术进行时间序列预测(上)
使用2D卷积技术进行时间序列预测
260 1
使用2D卷积技术进行时间序列预测(上)

热门文章

最新文章