北京大学数字视频编解码技术国家工程实验室开源AVS2高清实时编码器

简介: 本文转自公众号:PKUVCL。

本文转自公众号:PKUVCL。北京大学数字视频编解码技术国家工程实验室视频编码算法研究室 (PKU-VCL) 开源了 AVS2 高清实时编码器 xAVS2(V1.0)。原文链接请点击【阅读原文】。


2018 年 1 月 31 日,北京大学数字视频编解码技术国家工程实验室视频编码算法研究室 (PKU-VCL) 开源了 AVS2 高清实时编码器 xAVS2(V1.0)。AVS2 是我国新一代视频编码国家标准,和第一代 AVS 视频编码标准相比,AVS2 编码效率提升一倍以上;和国际标准 HEVC/H.265 相比,AVS2 在场景视频编码方面有显著优势。


640?wx_fmt=png&wxfrom=5&wx_lazy=1

        

针对不同的应用场景,xAVS2(V1.0) 编码器设置了 preset 0 ~ preset 9 共 10 个速度档次。其中,preset 0 是最快速的档次,preset 9 编码效率最高。preset 9 编码性能与 AVS2 参考软件 RD19.2 相当,而速度提升约 10 倍。下图为 xAVS2(V1.0)、x265(V2.6) 各个速度档次下单线程的编码速度与性能(横坐标为编码效率相对于 HM16.17 的损失,纵坐标为每秒编码帧数)。可以看到,在慢速档次下,xAVS2(V1.0) 相比于 x265(V2.6) 有明显优势。

此外,为响应下一代 AVS3 标准制定,PKU-VCL 还开发了简洁高效的 AVS2 参考软件平台(xRD1.0),供大家参考使用,可以从 AVS 官方网站免费下载。

640?wx_fmt=png

图1  xAVS2 与 x265 对比

 

1、测试条件


  1. 运行平台:Intel Xeon E5-2687W v4, 3.0 GHz, RAM 32GB。

  2. 评价指标:基于 PSNR 的 BD-RATE 衡量 xAVS2(V1.0)、x265(V2.6)、RD19.2 相对 HM16.17 的性能。

  3. 测试序列:AVS2 通测条件中的 5 个 1080P 高清序列。

  4. 软件编码配置

       i). HM16.17 编码配置:随机访问 (RA) 编码配置,根据序列基本信息配置分辨率、帧率、总帧数、I 帧间隔(约 1s 一个 I 帧),为了保证码率相近,HM 使用的量化参数设置为:24、29、33、38。

      ii). RD19.2 编码配置:随机访问 (RA) 编码配置,分辨率、帧率、总帧数、I帧间隔与HM16.17保持一致,量化参数使用:27、32、38、45,ME 搜索范围设置为 64。

     iii). x265 使用 2.6 版本,编码配置:--tune psnr --psnr --pools 1 --frame-threads 1 --no-wpp --no-scenecut --no-weightp --bframes 7 -fps XX --frames XX -I XX -qp XX -p XX,为保持码率相近,x265 编码器使用的量化参数设置为:27、32、36、41。参数说明:-fps 编码帧率,--frames 编码帧数,-I I 帧间隔,-qp 量化参数,-p 编码档次。

      iv). xAVS2 编码配置:随机访问 (RA) 编码配置,分辨率、帧率、总帧数、I 帧间隔与 HM16.17 保持一致,量化参数使用:27、32、38、45。

 

2、测试结果

表1 xAVS2(V1.0) 和 x265(V2.6) 各个档次下的性能损失与时间节省

640?wx_fmt=png 

表2 xAVS2(V1.0) 各个序列的性能损失与编码速度

640?wx_fmt=png

表3 x265(V2.6) 各个序列的性能损失与编码速度

640?wx_fmt=png


3、开源地址


https://gitee.com/pkuvcl/xavs2

https://github.com/pkuvcl/xavs2

 

4、联系方式


联系人:王苫社

电话:010-62756172

邮箱:sswang@pku.edu.cn

项目详情关注:

640?wx_fmt=png

相关文章
|
关系型数据库 MySQL 数据安全/隐私保护
Docker实战——MySQL的数据持久化
Docker实战——MySQL的数据持久化
3164 0
Docker实战——MySQL的数据持久化
|
搜索推荐 前端开发 架构师
阿里高级技术专家谈开源DDD框架:COLA4.0,分离架构和组件(上)
阿里高级技术专家谈开源DDD框架:COLA4.0,分离架构和组件(上)
2907 0
阿里高级技术专家谈开源DDD框架:COLA4.0,分离架构和组件(上)
|
7月前
|
人工智能 算法 安全
OpenRouter 推出百万 token 上下文 AI 模型!Quasar Alpha:提供完全免费的 API 服务,同时支持联网搜索和多模态交互
Quasar Alpha 是 OpenRouter 推出的预发布 AI 模型,具备百万级 token 上下文处理能力,在代码生成、指令遵循和低延迟响应方面表现卓越,同时支持联网搜索和多模态交互。
592 1
OpenRouter 推出百万 token 上下文 AI 模型!Quasar Alpha:提供完全免费的 API 服务,同时支持联网搜索和多模态交互
|
8月前
|
机器学习/深度学习 编解码 人工智能
Qwen2.5-VL Technical Report
Qwen2.5-VL是阿里云团队推出的Qwen系列最新旗舰模型,具备显著提升的基础能力和创新功能。它在视觉识别、对象定位、文档解析和长视频理解等方面实现突破,支持精准的边界框/点定位及复杂输入处理。通过技术创新如窗口注意力、动态帧率采样和绝对时间编码,该模型在多模态任务中表现出色,在多个基准测试中超越顶级闭源模型,适用于从边缘AI到高性能计算的广泛场景。
|
人工智能 搜索推荐 算法
人工智能在医疗诊断中的应用与前景
本文探讨了人工智能在医疗诊断中的最新进展、应用案例以及面临的挑战。通过分析AI在医学影像识别、电子病历分析和个性化治疗方案等领域的具体应用,揭示了其提高诊断准确性、缩短诊断时间的潜力。同时,讨论了数据隐私、算法偏见等伦理和法律问题,并提出了未来研究方向。
|
固态存储 测试技术 图形学
电脑升级有哪些建议?
【10月更文挑战第31天】电脑升级有哪些建议?
596 4
|
7月前
|
人工智能 搜索推荐 数据挖掘
生成式人工智能认证(GAI认证)如何推动就业市场的创新?
生成式人工智能(Generative AI)认证是由全球终身学习公司Pearson推出,旨在为职场人士和学生提供全面的Gen AI技能培训。该认证涵盖方法论、提示优化、基础提示工程及伦理法律等内容,推动就业市场变革,拓展职业领域,升级技能要求,创新工作模式。尽管面临技术更新等挑战,但通过及时调整与培训,可保障就业市场健康发展,创造更多新兴岗位。
|
存储 缓存 C语言
【c语言】简单的算术操作符、输入输出函数
本文介绍了C语言中的算术操作符、赋值操作符、单目操作符以及输入输出函数 `printf` 和 `scanf` 的基本用法。算术操作符包括加、减、乘、除和求余,其中除法和求余运算有特殊规则。赋值操作符用于给变量赋值,并支持复合赋值。单目操作符包括自增自减、正负号和强制类型转换。输入输出函数 `printf` 和 `scanf` 用于格式化输入和输出,支持多种占位符和格式控制。通过示例代码详细解释了这些操作符和函数的使用方法。
364 10
|
11月前
|
人工智能 API 数据库
Qwen-Agent功能调用实践探索
本文详细解析了Qwen-Agent的核心功能——功能调用,涵盖其定义、工作流程、重要性和实际应用,通过实例展示了如何在Qwen-Agent中利用此功能与外部工具和API互动,扩展AI应用范围。
|
设计模式 数据可视化 Java
如何在 IDEA 中设置类路径
在 IntelliJ IDEA 中设置类路径,可以通过项目结构配置或模块设置来添加所需的库和依赖。具体步骤包括打开项目结构对话框、选择模块、添加类路径等。
2045 18