北京大学数字视频编解码技术国家工程实验室开源AVS2高清实时编码器

简介: 本文转自公众号:PKUVCL。

本文转自公众号:PKUVCL。北京大学数字视频编解码技术国家工程实验室视频编码算法研究室 (PKU-VCL) 开源了 AVS2 高清实时编码器 xAVS2(V1.0)。原文链接请点击【阅读原文】。


2018 年 1 月 31 日,北京大学数字视频编解码技术国家工程实验室视频编码算法研究室 (PKU-VCL) 开源了 AVS2 高清实时编码器 xAVS2(V1.0)。AVS2 是我国新一代视频编码国家标准,和第一代 AVS 视频编码标准相比,AVS2 编码效率提升一倍以上;和国际标准 HEVC/H.265 相比,AVS2 在场景视频编码方面有显著优势。


640?wx_fmt=png&wxfrom=5&wx_lazy=1

        

针对不同的应用场景,xAVS2(V1.0) 编码器设置了 preset 0 ~ preset 9 共 10 个速度档次。其中,preset 0 是最快速的档次,preset 9 编码效率最高。preset 9 编码性能与 AVS2 参考软件 RD19.2 相当,而速度提升约 10 倍。下图为 xAVS2(V1.0)、x265(V2.6) 各个速度档次下单线程的编码速度与性能(横坐标为编码效率相对于 HM16.17 的损失,纵坐标为每秒编码帧数)。可以看到,在慢速档次下,xAVS2(V1.0) 相比于 x265(V2.6) 有明显优势。

此外,为响应下一代 AVS3 标准制定,PKU-VCL 还开发了简洁高效的 AVS2 参考软件平台(xRD1.0),供大家参考使用,可以从 AVS 官方网站免费下载。

640?wx_fmt=png

图1  xAVS2 与 x265 对比

 

1、测试条件


  1. 运行平台:Intel Xeon E5-2687W v4, 3.0 GHz, RAM 32GB。

  2. 评价指标:基于 PSNR 的 BD-RATE 衡量 xAVS2(V1.0)、x265(V2.6)、RD19.2 相对 HM16.17 的性能。

  3. 测试序列:AVS2 通测条件中的 5 个 1080P 高清序列。

  4. 软件编码配置

       i). HM16.17 编码配置:随机访问 (RA) 编码配置,根据序列基本信息配置分辨率、帧率、总帧数、I 帧间隔(约 1s 一个 I 帧),为了保证码率相近,HM 使用的量化参数设置为:24、29、33、38。

      ii). RD19.2 编码配置:随机访问 (RA) 编码配置,分辨率、帧率、总帧数、I帧间隔与HM16.17保持一致,量化参数使用:27、32、38、45,ME 搜索范围设置为 64。

     iii). x265 使用 2.6 版本,编码配置:--tune psnr --psnr --pools 1 --frame-threads 1 --no-wpp --no-scenecut --no-weightp --bframes 7 -fps XX --frames XX -I XX -qp XX -p XX,为保持码率相近,x265 编码器使用的量化参数设置为:27、32、36、41。参数说明:-fps 编码帧率,--frames 编码帧数,-I I 帧间隔,-qp 量化参数,-p 编码档次。

      iv). xAVS2 编码配置:随机访问 (RA) 编码配置,分辨率、帧率、总帧数、I 帧间隔与 HM16.17 保持一致,量化参数使用:27、32、38、45。

 

2、测试结果

表1 xAVS2(V1.0) 和 x265(V2.6) 各个档次下的性能损失与时间节省

640?wx_fmt=png 

表2 xAVS2(V1.0) 各个序列的性能损失与编码速度

640?wx_fmt=png

表3 x265(V2.6) 各个序列的性能损失与编码速度

640?wx_fmt=png


3、开源地址


https://gitee.com/pkuvcl/xavs2

https://github.com/pkuvcl/xavs2

 

4、联系方式


联系人:王苫社

电话:010-62756172

邮箱:sswang@pku.edu.cn

项目详情关注:

640?wx_fmt=png

相关文章
|
1月前
|
人工智能 自然语言处理 搜索推荐
AIGC: 2 语音转换新纪元-Whisper技术在全球客服领域的创新运用
全球客服领域的发展设想结合点: 1.智能客服语音助手: 2.多语言无缝服务体验: 3.语音分析与情感智能
697 2
|
1月前
|
机器学习/深度学习 人工智能 算法
我国“风乌GHR”大模型发布,人工智能助气象预报进入“10公里级时代”
【2月更文挑战第16天】我国“风乌GHR”大模型发布,人工智能助气象预报进入“10公里级时代”
41 2
我国“风乌GHR”大模型发布,人工智能助气象预报进入“10公里级时代”
|
4月前
|
机器学习/深度学习 人工智能 数据挖掘
将AI引入量子化学、用AI预报天气!首届世界科学智能大赛落幕
将AI引入量子化学、用AI预报天气!首届世界科学智能大赛落幕
271 0
|
10月前
|
达摩院 自然语言处理 测试技术
直接开源!达摩院公布下一代工业级语音识别模型
直接开源!达摩院公布下一代工业级语音识别模型
504 0
|
11月前
|
人工智能 算法
ICASSP 2022 | 89.46%检出率,网易云信音频实验室提出全球首个AI啸叫检测方案(1)
ICASSP 2022 | 89.46%检出率,网易云信音频实验室提出全球首个AI啸叫检测方案
233 0
|
11月前
|
机器学习/深度学习 数据采集 人工智能
ICASSP 2022 | 89.46%检出率,网易云信音频实验室提出全球首个AI啸叫检测方案(2)
ICASSP 2022 | 89.46%检出率,网易云信音频实验室提出全球首个AI啸叫检测方案
107 0
|
11月前
|
机器学习/深度学习 自然语言处理 前端开发
首个用于工业开发的自动代码生成系统,精巧高效还入选了顶会
首个用于工业开发的自动代码生成系统,精巧高效还入选了顶会
150 0
|
11月前
|
机器学习/深度学习 自然语言处理 算法
中科院自动化所联合北方电子设备研究所提出多输入文本人脸合成方法,数据代码已开源
中科院自动化所联合北方电子设备研究所提出多输入文本人脸合成方法,数据代码已开源
147 0
|
Web App开发 编解码 缓存
深度解读阿里巴巴SIGCOMM2022“可预期音视频网络”技术
深度解读阿里巴巴SIGCOMM2022“可预期音视频网络”技术
深度解读阿里巴巴SIGCOMM2022“可预期音视频网络”技术
|
机器学习/深度学习 人工智能 监控
AI在智慧城市的十种应用方式
智慧城市对气候变化、更明智的决策和提高生活质量的影响较小,下面,我们来看看人工智能帮助实现这一目标的十种方式。
AI在智慧城市的十种应用方式