阿里云 RTC QoS 弱网对抗之 LTR 及其硬件解码支持

简介: LTR 弱网对抗由于需要解码器的反馈,因此用硬件解码器实现时需要做一些特殊处理。另外,一些硬件解码器对 LTR 的实现不是特别完善,会导致出现解码错误。本文为 QoS 弱网优化系列的第三篇,将为您详解阿里云 RTC QoS 策略中的 LTR 抗弱网原理与实现硬解 LTR 时遇到的坑及其相应解法。

作者|安基程、陶森柏、田伟峰

审校|泰一


Long Term Reference (LTR) 抗弱网原理

参考帧丢失的 I 帧恢复

在 RTC 场景下一般的编码参考策略是向前一帧参考(在不考虑 temporal svc 的情况下),因为一般情况下参考距离越近,相似性越好,则压缩效果越好,出于实时的考虑编码只有 I 帧和 P 帧,没有 B 帧。在有 P 帧丢失的场景下,接收端需要重新请求 I 帧才能继续正确的解码和播放。

image.png


如上图所示,正常的 I P P P 帧编码,如果发生弱网导致中间的某个 P 帧(✖️ 标记)丢失,无法恢复,则接收端会请求发送端重新编码 I 帧,然而 I 帧只能使用帧内预测,所以编码效率低下。


参考帧丢失的 LTR 恢复

长期参考帧是一种可跨帧的参考帧选择策略,这种策略打破了传统的向前一帧的限制,可以更加灵活地选择参考帧。长期参考帧策略的目的是在有 P 帧丢失的场景下,接收端不需要重新请求 I 帧也能继续正确的解码和播放,其相对于 I 帧可以明显提升编码效率,节省带宽。该技术可以绕过丢失的帧,利用丢失帧之前的一个已经接收的长期参考帧作为参考进行编码 / 解码显示,从而提升弱网场景下的视频流畅性。

 

image.png


上图所示是引入 LTR 技术后的丢帧恢复策略,未发生弱网时仍然是正常的 I P P P 帧编码,只是会将其中的某些 P 帧标记为 LTR 帧(如图中的绿色 P 帧,以下称为 LTR 标记帧)。如果发生弱网中间的某个 P 帧(✖️ 标记)丢失,无法恢复,则接收端会请求发送端(编码器)利用 LTR 恢复,此时编码器会利用之前的已经确认收到的 LTR 标记帧做为参考编出一个 P 帧(图中红色 P 帧,以下被称为 LTR 恢复帧)。


由于之前的 LTR 标记帧已经被解码器确认收到,所以解码器参考帧 buffer 中必然存有此帧,所以利用此帧做参考的红色 P 帧必然可以被解码器正确解码。LTR 恢复帧由于是有参考的 P 帧,所以比 I 帧的编码效率显著提升。


根据上述 LTR 技术的特点和目的,可见 LTR 技术是一种网络模块和编码器共同配合完成的参考帧选择技术。实现 LTR 技术需要有接收端侧反馈信息,即编码器发出的 LTR 标记帧(图中的绿色 P 帧),如果被解码器成功收到,需要解码器通知编码器其收到了这一帧,这样编码器在收到 LTR 恢复请求的时候,才可以 “放心的” 使用此帧做参考。


关于 LTR,前两篇文章中也有做部分介绍,感兴趣的读者可以参考:


1.《阿里云 RTC QoS 屏幕共享弱网优化之若干编码器相关优化》

2.《阿里云 RTC QoS 弱网对抗之变分辨率编码》

硬件解码支持 LTR

硬件解码的优势

硬件解码相对于软件解码而言,具有低功耗的天然优势,所以,在有条件使用硬件解码且不影响视频观看体验的情况下,应首选硬件解码。


获取码流中的 LTR 相关信息

对于软件解码器而言,开发者可以直接在解码器中实现接口以从码流中读取 LTR 相关信息,比如此帧是否为 LTR 标记帧,及其 frame number 等信息。如果此帧是 LTR 标记帧,则将其 frame number 反馈给编码器以表示其已收到此帧。


然而对于硬件解码器,其接口软件开发者是无法修改的,一般硬件解码器也没有接口可以读取 LTR 的相关信息。那怎样才能读取到 LTR 的相关信息呢?


本文使用的方法是,在硬件解码器之外的 RTC level 再进行一次码流解析,读取 LTR 相关信息,反馈给编码器。由于该信息都在码流的 high level syntax 中,如 slice header 等,所以额外解析该部分码流并没有太大开销。


某些硬解不支持 LTR 及解决思路

由于 LTR 的上述功能并不是 codec 中特别常用的功能,所以一些硬解厂商并没有将 LTR 功能实现的很好,在本文的实测过程中,就发现了一些问题。

image.png


上图中如果红框中的普通 P 帧没有被丢失的话,则 LTR 恢复帧即红色 P 帧都可以被本文所测试的硬件解码器正确解码。但是如果红框中的 P 帧丢失了,则有一部分硬件解码器无法正确解码出后面红色的 LTR 恢复帧。本文实测了一些手机,发现使用苹果,高通,三星芯片的手机可以正确的解码,然而使用华为(海思)、联发科某些芯片的手机则不能正确解码此时的 LTR 恢复帧,会返回解码错误或输出花屏。


由于实际发生弱网的时候,肯定会伴随着丢帧,即红框中的 P 帧肯定会有所丢失,所以若此时 LTR 恢复帧不可解码,则就等同于 LTR 技术对于这些硬解不可用了。这应该是某些硬件解码器自身实现的问题,即没有完全按照标准去实现所致。但是要如何规避这种问题呢?


进一步测试发现,解码错误的原因是由于中间红框里面的 P 帧丢失导致 frame number 不连续,如果将后面帧的 frame number 改为连续的,则仍然可以正确的解码!所以,本文的解法是:对于一帧码流,在送给某些硬件解码器之前,如果发现其 frame number 和之前的是不连续的,则直接改写码流将其改为连续的,再送给硬解,这样,就可以很好的规避某些硬解无法解码 LTR 恢复帧的问题,从而兼顾功耗和弱网视频体验。


「视频云技术」你最值得关注的音视频技术公众号,每周推送来自阿里云一线的实践技术文章,在这里与音视频领域一流工程师交流切磋。

image.png

相关文章
|
物联网 测试技术 Android开发
蓝牙BLE传输性能及延迟分析
BLE传输性能主要受以下几个因素影响:操作类型,Connection Interval,每个Connection Event内发送的帧数、每一帧数据的长度。具体参见如下链接: https://en.wikipedia.
3736 0
|
6月前
|
监控 5G
GPRS与4G网络:技术差异与应用选择
GPRS与4G在移动通信中各有重要地位,但4G(如LTE)以其高达1Gbps的速度、低延迟及优化的高带宽应用(如视频监控)超越了GPRS的几十Kbps速度。5G的兴起将进一步革新通信,带来更快、更智能的服务。选择技术需依据实际需求。
|
7月前
|
编解码 计算机视觉 Python
IPC机制在jetson中实现硬解码视频流数据通信的逻辑解析
IPC机制在jetson中实现硬解码视频流数据通信的逻辑解析
193 0
|
编解码 监控 网络协议
Android平台GB28181设备接入侧如何实现按需打开视音频采集传输
Android平台GB28181设备接入侧如何实现按需打开视音频采集传输
160 2
|
编解码 监控 前端开发
GB/T28181-2016传输要求和Android平台设备接入技术实现
GB/T28181-2016公共安全视频监控联网系统 信息传输、交换、控制技术要求相关的传输要求如下:
240 1
|
编解码 Android开发 开发者
Android平台GB28181设备接入模块如何实现实时视频和本地录像双码流编码
我们在做Android平台GB28181设备接入模块的时候,遇到这样的场景,比如执法记录仪或智慧工地等场景下,由于GB28181设备接入模块,注册到国标平台后,平时只是心跳保持,或还有实时位置订阅,查看视频的时候,是按需看,而且有时候,网络环境并不是太好,所以,催生了这样一个诉求:部分开发者希望能本地录像的时候,录制高分辨率(比如1920*1080),国标平台侧发起实时视频查看请求的时候,上传低分辨率(如1280*720)数据,有点类似于IPC的主码流和子码流。
|
编解码 Android开发
Android平台GB28181设备接入、RTMP推送模块如何实现高效率的视频编码
我们在做Android平台RTMP推送、轻量级RTSP服务和GB28181设备接入模块的时候,有一个点是逃不掉的:如何高效率的实现视频数据编码?
188 0
|
开发工具 Android开发 开发者
Android平台GB28181接入端语音广播和语音对讲规范解读和技术实现
我在之前的blog,有提到过Android端GB28181接入端的语音广播和语音对讲,今天主要从GB/T28181-2016官方规范和交互流程,大概介绍下Android平GB28181接入端的语音广播和语音对讲。
239 0
|
Android开发 开发者
Android平台GB28181设备接入端语音广播如何实现实时音量调节
Android平台GB28181设备接入,语音广播功能非常重要,本文要介绍的,不是语音广播的流程,语音广播流程,之前的blog也有非常详细的分享,感兴趣的可以参考官方规范书的交互流程:
|
编解码 边缘计算 算法
一文详述流媒体传输网络MediaUni
LiveVideoStackCon2023上海站,阿里云视频云专场系列演讲-1
593 0