北京大学数字视频编解码技术国家工程实验室开源AVS2高清实时编码器

简介: 本文转自公众号:PKUVCL。

本文转自公众号:PKUVCL。北京大学数字视频编解码技术国家工程实验室视频编码算法研究室 (PKU-VCL) 开源了 AVS2 高清实时编码器 xAVS2(V1.0)。原文链接请点击【阅读原文】。


2018 年 1 月 31 日,北京大学数字视频编解码技术国家工程实验室视频编码算法研究室 (PKU-VCL) 开源了 AVS2 高清实时编码器 xAVS2(V1.0)。AVS2 是我国新一代视频编码国家标准,和第一代 AVS 视频编码标准相比,AVS2 编码效率提升一倍以上;和国际标准 HEVC/H.265 相比,AVS2 在场景视频编码方面有显著优势。


640?wx_fmt=png&wxfrom=5&wx_lazy=1

        

针对不同的应用场景,xAVS2(V1.0) 编码器设置了 preset 0 ~ preset 9 共 10 个速度档次。其中,preset 0 是最快速的档次,preset 9 编码效率最高。preset 9 编码性能与 AVS2 参考软件 RD19.2 相当,而速度提升约 10 倍。下图为 xAVS2(V1.0)、x265(V2.6) 各个速度档次下单线程的编码速度与性能(横坐标为编码效率相对于 HM16.17 的损失,纵坐标为每秒编码帧数)。可以看到,在慢速档次下,xAVS2(V1.0) 相比于 x265(V2.6) 有明显优势。

此外,为响应下一代 AVS3 标准制定,PKU-VCL 还开发了简洁高效的 AVS2 参考软件平台(xRD1.0),供大家参考使用,可以从 AVS 官方网站免费下载。

640?wx_fmt=png

图1  xAVS2 与 x265 对比

 

1、测试条件


  1. 运行平台:Intel Xeon E5-2687W v4, 3.0 GHz, RAM 32GB。

  2. 评价指标:基于 PSNR 的 BD-RATE 衡量 xAVS2(V1.0)、x265(V2.6)、RD19.2 相对 HM16.17 的性能。

  3. 测试序列:AVS2 通测条件中的 5 个 1080P 高清序列。

  4. 软件编码配置

       i). HM16.17 编码配置:随机访问 (RA) 编码配置,根据序列基本信息配置分辨率、帧率、总帧数、I 帧间隔(约 1s 一个 I 帧),为了保证码率相近,HM 使用的量化参数设置为:24、29、33、38。

      ii). RD19.2 编码配置:随机访问 (RA) 编码配置,分辨率、帧率、总帧数、I帧间隔与HM16.17保持一致,量化参数使用:27、32、38、45,ME 搜索范围设置为 64。

     iii). x265 使用 2.6 版本,编码配置:--tune psnr --psnr --pools 1 --frame-threads 1 --no-wpp --no-scenecut --no-weightp --bframes 7 -fps XX --frames XX -I XX -qp XX -p XX,为保持码率相近,x265 编码器使用的量化参数设置为:27、32、36、41。参数说明:-fps 编码帧率,--frames 编码帧数,-I I 帧间隔,-qp 量化参数,-p 编码档次。

      iv). xAVS2 编码配置:随机访问 (RA) 编码配置,分辨率、帧率、总帧数、I 帧间隔与 HM16.17 保持一致,量化参数使用:27、32、38、45。

 

2、测试结果

表1 xAVS2(V1.0) 和 x265(V2.6) 各个档次下的性能损失与时间节省

640?wx_fmt=png 

表2 xAVS2(V1.0) 各个序列的性能损失与编码速度

640?wx_fmt=png

表3 x265(V2.6) 各个序列的性能损失与编码速度

640?wx_fmt=png


3、开源地址


https://gitee.com/pkuvcl/xavs2

https://github.com/pkuvcl/xavs2

 

4、联系方式


联系人:王苫社

电话:010-62756172

邮箱:sswang@pku.edu.cn

项目详情关注:

640?wx_fmt=png

相关文章
|
29天前
|
人工智能 编解码
OmniBooth:华为诺亚方舟联合港科大推出的图像生成框架
OmniBooth是由华为诺亚方舟实验室和港科大研究团队联合推出的图像生成框架,支持基于文本提示或图像参考进行空间控制和实例级定制。该框架通过用户定义的掩码和相关联的文本或图像指导,精确控制图像中对象的位置和属性,提升文本到图像合成技术的可控性和实用性。
35 1
OmniBooth:华为诺亚方舟联合港科大推出的图像生成框架
|
4月前
|
存储 自然语言处理 监控
FunAudioLLM在性能、功能、技术先进性等方面与国际知名语音大模型的比较
FunAudioLLM在性能、功能、技术先进性等方面与国际知名语音大模型的比较
|
达摩院 自然语言处理 测试技术
直接开源!达摩院公布下一代工业级语音识别模型
直接开源!达摩院公布下一代工业级语音识别模型
771 0
|
人工智能 算法
ICASSP 2022 | 89.46%检出率,网易云信音频实验室提出全球首个AI啸叫检测方案(1)
ICASSP 2022 | 89.46%检出率,网易云信音频实验室提出全球首个AI啸叫检测方案
412 0
|
机器学习/深度学习 数据采集 人工智能
ICASSP 2022 | 89.46%检出率,网易云信音频实验室提出全球首个AI啸叫检测方案(2)
ICASSP 2022 | 89.46%检出率,网易云信音频实验室提出全球首个AI啸叫检测方案
212 0
|
编解码
《MPEG和AVS视频编码标准最新动态圆桌会》电子版地址
MPEG和AVS视频编码标准最新动态圆桌会
78 0
《MPEG和AVS视频编码标准最新动态圆桌会》电子版地址
《基于视觉计算建设全球先进的工科实验教学平台》电子版地址
基于视觉计算建设全球先进的工科实验教学平台.ppt
72 0
《基于视觉计算建设全球先进的工科实验教学平台》电子版地址
|
机器学习/深度学习 编解码 人工智能
优酷发布最大工业级超高清视频数据集,超分辨率算法大赛落幕
在这场算法挑战赛上,不仅有刚刚出现在 CVPR 2019 的最新算法,还出现了年仅 18 岁的获奖选手。
888 0
优酷发布最大工业级超高清视频数据集,超分辨率算法大赛落幕
|
机器学习/深度学习 人工智能 自然语言处理
科大讯飞的1024:语音技术进一步突破,发布专用芯片
1024 作为程序员的节日被世人所知,而科大讯飞也会在每年这个时候举办开发者节日和相关活动。在今年的开发者节上,科大讯飞发布了更多关于平台,产品和技术方面的信息。
537 0
科大讯飞的1024:语音技术进一步突破,发布专用芯片