FFmpeg代码导读——HEVC在RTMP中的扩展

简介: 视频流媒体中视频数据的传输占据了绝大部分的带宽,如何提升编码效率、减小带宽使用、提升画面质量,成为音视频开发者努力的重点。

640?wx_fmt=jpeg&wxfrom=5&wx_lazy=1


视频流媒体中视频数据的传输占据了绝大部分的带宽,如何提升编码效率、减小带宽使用、提升画面质量,成为音视频开发者努力的重点。HEVC编码格式的推出为此带来了突破点。对于直播而言,大部分推拉流协议是基于RTMP的,因此本文将主要介绍如何在RTMP协议中增加对HEVC视频编码格式的支持。


本文来自金山云OBG事业部投稿,是《FFmpeg从入门到出家》系列的第一篇下半部分,由LiveVideoStack审校整理,希望能让大家对FFmpeg有更深入了解。阅读上半部分内容请点击【阅读原文】


文 / 施雪梅


4. HEVC在RTMP中的扩展


为推进HEVC视频编码格式在直播方案中的落地,经过CDN联盟讨论,并和主流云服务厂商达成一致,规范了HEVC在RTMP/FLV中的扩展,具体修改内容见下。


4.1 FLV规范扩展


HEVC为视频编码格式,因此对FLV规范的扩展,只集中在Video Tag,其它部分,无任何改动。


4.1.1 支持HEVC的VideoTagHeader


扩展后的VideoTagHeader如下图所示(红色字体为新增内容):

 

0?wx_fmt=png

图9. 支持HEVC的FLVTagHeader


修改点如下:


1.CodecID - 定义HEVC格式的值为12;

2.HEVCPacketType - 当CodecID == 12时,AVCPacketType为HEVCPacketType:

  • 如果HEVCPacketType为0,表示HEVCVIDEOPACKET中存放的是HEVC sequence header;

  • 如果HEVCPacketType为1,表示HEVCVIDEOPACKET中存放的是HEVC NALU;

  • 如果HEVCPacketType为2,表示HEVCVIDEPACKET中存放的是HEVC end of sequence,即HEVCDecoderConfigurationRecord;

3.CompositionTime - 当CodecID == 12时,同样需要CompositionTime。


4.1.2 支持HEVC的VideoTagBody


当CodecID为12时,VideoTagBody中存放的就是HEVC视频帧内容。

扩展后的VideoTagBody如下图所示(红色字体为HEVC新增内容):

 

0?wx_fmt=png

图10. 支持HEVC的VideoTagBody


4.2 FFmpeg中的修改


我们已在FFmpeg的各个版本上提供相关的完整修改,具体参见:https://github.com/ksvc/FFmpeg,完整patch获取及相关说明见:https://github.com/ksvc/FFmpeg/wiki。


由第二章节的阐述可知,FLV的解复用和复用功能代码分别在libavformt/flvdec.c和libavformat/flvenc.c中,扩展后的修改也都集中在这两个文件。本节将在FFmpeg3.3的基础上,说明修改的关键点。


4.2.1 编码类型定义


libavformat/flv.h中按照VideoTagHeader中的CodecID定义了一组视频编码格式的枚举值,扩展后的枚举定义如下:


 
  

enum {
   FLV_CODECID_H263    = 2,
   FLV_CODECID_SCREEN  = 3,
   FLV_CODECID_VP6     = 4,
   FLV_CODECID_VP6A    = 5,
   FLV_CODECID_SCREEN2 = 6,
   FLV_CODECID_H264    = 7,
   FLV_CODECID_REALH263= 8,
   FLV_CODECID_MPEG4   = 9,
   FLV_CODECID_HEVC   = 12,
};


4.2.2 FLV demux


在解复用过程中,flv_read_packet方法是整个过程的核心,它里面完成了对每个Tag的读取和解析。


4.1.1中提到,如果HEVCPacketType为0时,表示HEVCVIDEOPACKET中存放的是HEVC sequence header,也就是HEVCDecoderConfigurationRecord,解码时需设置HEVCDecoderConfigurationRecord方能正确解码。


HEVC与AVC视频帧在FLV中的存放格式相同,所以只需在读取Video Tag的地方增加AV_CODEC_ID_HEVC的判断条件即可,调整后的代码如下:


 
  

if (st->codecpar->codec_id == AV_CODEC_ID_AAC ||
    st->codecpar->codec_id == AV_CODEC_ID_H264 ||
    st->codecpar->codec_id == AV_CODEC_ID_HEVC ||
   st->codecpar->codec_id == AV_CODEC_ID_MPEG4) {
   int type = avio_r8(s->pb);
   size--;
   if (st->codecpar->codec_id == AV_CODEC_ID_H264 ||
        st->codecpar->codec_id == AV_CODEC_ID_HEVC ||
        st->codecpar->codec_id == AV_CODEC_ID_MPEG4) {
        // sign extension
        int32_t cts = (avio_rb24(s->pb) + 0xff800000) ^ 0xff800000;
        pts = dts + cts;
        if (cts< 0) { // dts might be wrong
            if (!flv->wrong_dts)
                av_log(s, AV_LOG_WARNING,
                       "Negative cts, previous timestamps might be wrong.\n");
           flv->wrong_dts = 1;
       } else if (FFABS(dts - pts) > 1000*60*15) {
               av_log(s, AV_LOG_WARNING,
                      "invalid timestamps %"PRId64" %"PRId64"\n", dts, pts);
               dts = pts = AV_NOPTS_VALUE;
       }
  }
 
  if (type == 0 &&(!st->codecpar->extradata ||
      st->codecpar->codec_id == AV_CODEC_ID_AAC ||
      st->codecpar->codec_id == AV_CODEC_ID_HEVC ||
      st->codecpar->codec_id == AV_CODEC_ID_H264)) {
      AVDictionaryEntry *t;
      if (st->codecpar->extradata) {
          if ((ret = flv_queue_extradata(flv, s->pb, stream_type, size)) < 0)
              return ret;
          ret = FFERROR_REDO;
          goto leave;
      }
      if ((ret = flv_get_extradata(s, st, size)) < 0)
          return ret;
      ……
  }
}

AVCDecoderConfigurationRecord和HEVCDecoderConfigurationRecord都是存放在AVStream->AVCodecParameter->extradata中。

4.2.3 FLV mux


FLV mux的修改相对较多、header、packet、trailer中均有涉及。


4.2.3.1 write header


flv_write_header中主要完成了以下工作:


  1. 写入FLV Header;

  2. 写入Metadata;

  3. 如果音频编码格式为AAC,则写入第一个Audio Tag,其AudioTagBody中存放的是AAC sequence header;

  4. 如果视频编码格式为AVC,则写入第一个Video Tag,其中VideoTagBody中存放的是AVC sequence header。


同样,当视频编码格式HEVC时,也要写入第一个VideoTag,其中VideoTagBody中存放的是HEVCDecoderConfigurationRecord,修改点如下:


 
  

avio_w8(pb, par->codec_tag | FLV_FRAME_KEY); // flags
avio_w8(pb, 0); // AVC sequence header
avio_wb24(pb, 0); // composition time

if (par->codec_id == AV_CODEC_ID_HEVC)
   ff_isom_write_hvcc(pb, par->extradata, par->extradata_size, 0);
else
   ff_isom_write_avcc(pb, par->extradata, par->extradata_size);


ff_isom_write_hvcc的作用是将extradata转为HEVCDecoderConfigurationRecord结构并写入。


4.2.3.2 write packet


flv_write_packet的作用是写入音视频帧,其中有关写入video数据的地方,都需要加上AV_CODEC_ID_HEVC的判断条件,修改内容如下:


 
  

   else if (par->codec_id == AV_CODEC_ID_HEVC ){
       if (par->extradata_size> 0 && *(uint8_t*)par->extradata != 1)
           if ((ret = ff_hevc_annexb2mp4_buf(pkt->data, &data, &size, 0, NULL)) < 0)
               return ret;
   }


ff_hevc_annexb2mp4_buf方法的作用是将Annex-B格式的HEVC视频帧转为HVCC格式。


AnnexB与AVCC/HVCC(ISO/IEC14496-15中所定义,通常也称为MPEG-4格式)的区别在于参数集与帧格式,AnnexB的参数集sps、pps以NAL的形式存在码流中(带内传输),以startcode分割NAL。而HVCC 的参数集存储在extradata中(带外传输),使用NALU长度(固定字节,通常为4字节,从extradata中解析)分隔NAL。


4.2.3.3 write trailer


结束时需要写入HEVC end of sequence,其格式与AVC end of sequence相同,直接复用即可,flv_write_trailer的修改内容如下:


 
  

if (par->codec_type == AVMEDIA_TYPE_VIDEO &&
          (par->codec_id == AV_CODEC_ID_H264 || par->codec_id == AV_CODEC_ID_HEVC || par->codec_id == AV_CODEC_ID_MPEG4))
     put_avc_eos_tag(pb, sc->last_ts); 


5. 结束语


本文简单介绍了如何在FFmpeg中扩展rtmp协议对HEVC编码格式的支持,而要将HEVC应用于直播整体方案,除推流端和播放端要提供相应能力外,源站、CDN、转码服务同样都需要提供这种能力。金山云的所有视频服务中,已完全支持HEVC视频编码格式,欢迎大家使用。


相关文章
|
2月前
|
应用服务中间件 Linux nginx
FFmpeg学习笔记(一):实现rtsp推流rtmp以及ffplay完成拉流操作
这篇博客介绍了如何使用FFmpeg实现RTSP推流到RTMP服务器,并使用ffplay进行拉流操作,包括在Windows和Linux系统下的命令示例,以及如何通过HTML页面显示视频流。
570 0
|
1月前
|
编解码 监控 网络协议
如何使用FFmpeg实现RTSP推送H.264和H.265(HEVC)编码视频
本文详细介绍了如何使用FFmpeg实现RTSP推送H.264和H.265(HEVC)编码视频。内容涵盖环境搭建、编码配置、服务器端与客户端实现等方面,适合视频监控系统和直播平台等应用场景。通过具体命令和示例代码,帮助读者快速上手并实现目标。
255 6
|
5月前
|
Web App开发 缓存 编解码
FFmpeg开发笔记(三十八)APP如何访问SRS推流的RTMP直播地址
《FFmpeg开发实战》书中介绍了轻量级流媒体服务器MediaMTX,适合测试RTSP/RTMP协议,但不适用于复杂直播场景。SRS是一款强大的开源流媒体服务器,支持多种协议,起初为RTMP,现扩展至HLS、SRT等。在FFmpeg 6.1之前,推送给SRS的HEVC流不受支持。要播放RTMP流,Android应用可使用ExoPlayer,需在`build.gradle`导入ExoPlayer及RTMP扩展,并根据URL类型创建MediaSource。若SRS播放黑屏,需在配置文件中开启`gop_cache`以缓存关键帧。
173 2
FFmpeg开发笔记(三十八)APP如何访问SRS推流的RTMP直播地址
|
6月前
|
编解码 Java Android开发
FFmpeg开发笔记(三十一)使用RTMP Streamer开启APP直播推流
RTMP Streamer是一款开源的安卓直播推流框架,支持RTMP、RTSP和SRT协议,适用于各种直播场景。它支持H264、H265、AV1视频编码和AAC、G711、OPUS音频编码。本文档介绍了如何使用Java版的RTMP Streamer,建议使用小海豚版本的Android Studio (Dolphin)。加载项目时,可添加国内仓库加速依赖下载。RTMP Streamer包含五个模块:app、encoder、rtmp、rtplibrary和rtsp。完成加载后,可以在手机上安装并运行APP,提供多种直播方式。开发者可以从《FFmpeg开发实战:从零基础到短视频上线》获取更多信息。
141 7
FFmpeg开发笔记(三十一)使用RTMP Streamer开启APP直播推流
|
5月前
|
应用服务中间件 Linux nginx
FFmpeg开发笔记(四十)Nginx集成rtmp模块实现RTMP推拉流
《FFmpeg开发实战》书中介绍了如何使用FFmpeg向网络推流,简单流媒体服务器MediaMTX不适用于复杂业务。nginx-rtmp是Nginx的RTMP模块,提供基本流媒体服务。要在Linux上集成rtmp,需从官方下载nginx和nginx-rtmp-module源码,解压后在nginx目录配置并添加rtmp模块,编译安装。配置nginx.conf启用RTMP服务,监听1935端口。使用ffmpeg推流测试,如能通过VLC播放,表明nginx-rtmp运行正常。更多详情见书本。
144 0
FFmpeg开发笔记(四十)Nginx集成rtmp模块实现RTMP推拉流
|
6月前
|
编解码 Linux iOS开发
FFmpeg开发笔记(二十三)使用OBS Studio开启RTMP直播推流
OBS(Open Broadcaster Software)是一款开源、跨平台的直播和和Linux。官网为<https://obsproject.com/>。要使用OBS进行直播,需执行四步:1) 下载并安装OBS Studio(<https://obsproject.com/download>),2) 启动流媒体服务器如MediaMTX,生成RTMP推流地址,3) 打开OBS Studio,设置直播服务为自定义RTMP服务器(127.0.0.1:1935/stream),调整视频分辨率,4) 添加视频来源并开始直播。同时,通过FFmpeg的拉流程序验证直播功能正常。
218 4
FFmpeg开发笔记(二十三)使用OBS Studio开启RTMP直播推流
|
6月前
|
Web App开发 移动开发 编解码
FFmpeg开发笔记(三十二)利用RTMP协议构建电脑与手机的直播Demo
本文讨论了实时数据传输在互联网中的重要性,如即时通讯和在线直播。一对一通信通常使用WebRTC技术,但一对多直播需要流媒体服务器和特定协议,如RTSP、RTMP、SRT或RIST。RTMP由于其稳定性和早期普及,成为国内直播的主流。文章通过实例演示了如何使用OBS Studio和RTMP Streamer进行RTMP推流,并对比了不同流媒体传输协议的优缺点。推荐了两本关于FFmpeg和Android开发的书籍以供深入学习。
106 0
FFmpeg开发笔记(三十二)利用RTMP协议构建电脑与手机的直播Demo
|
7月前
|
编解码 并行计算
ffmpeg cuda加速 h264->hevc(h265) 缩小存储空间
ffmpeg cuda加速 h264->hevc(h265) 缩小存储空间
229 0
|
7月前
|
网络协议 应用服务中间件 Linux
【音视频 ffmpeg 学习】 RTMP推流 mp4文件
【音视频 ffmpeg 学习】 RTMP推流 mp4文件
|
7月前
|
应用服务中间件 nginx Windows
ffmpeg推流到nginx服务器,并使用vlc播放rtmp视频
ffmpeg推流到nginx服务器,并使用vlc播放rtmp视频
417 0