多维评测指标解读第17届MSU世界编码器大赛全高清10bit赛道结果

简介: MSU2022世界编码器大赛
超高清视频纤毫毕现的关键一环。


01 主要指标多项第一,带宽节省48%


近日,第17届MSU世界编码器大赛全高清10bit赛道成绩揭晓,阿里自研的H.266/VVC编码器Ali266在该赛道最高效的1fps档次上获得两项冠军,相较大赛基准编码器x265可节省48%的带宽,有效降低超高清视频门槛,推动其普及。



MSU世界编码器大赛是指由莫斯科国立大学(Lomonosov Moscow State University,MSU)主办的面向全球各大公司、学术机构、开源社区和个人的编码器比赛,从2005年起每年举办一次,至今已举办17届。


在过去的17届比赛中,参赛编码器总体数量不断攀升,使MSU世界编码器大赛成为视频编解码领域影响力最大的顶级权威赛事,吸引了如Google、Intel、Netflix等众多知名科技公司参赛,参赛编码器均有广泛实用性、代表了行业发展的风向标。


本届MSU大赛共有21款编码器参赛,并首次专门设立了10bit赛道。继获得16届全高清赛道8项冠军和主观赛道冠军后,Ali266参加了本届大赛10bit赛道压缩率最高的1fps速度档位,取得SSIM、PSNR两项指标第一



为了全面地测评参赛编码器在多项质量评价指标下的压缩性能,MSU比赛采用了PSNR、SSIM、VMAF等客观质量评价指标。


其中,SSIM指标从亮度、对比度和结构信息三个方面来估计失真图像的视觉质量,旨在比较原始视频和失真视频的结构相似度,研究感知结构的损伤来评估视频质量,可以更好地反映人眼主观特性,因此历来也是MSU主办方指定的主要评价指标。


具体来看,按YUV (6:1:1)-SSIM指标排名


第一名:阿里巴巴Ali266、腾讯Tencent266 v0.2.1和Tencent266 v0.2.2



上图中,纵坐标为参赛编码器,横坐标为相同的SSIM质量下,各编码器输出文件相对于参考编码器x265的平均大小。


柱状图越短,表示编码器输出的文件越小,压缩率越高,编码器性能越好。图中显示,在同等YUV (6:1:1)-SSIM画质下,Ali266比参考编码器x265节省了48%的文件大小。


按YUV (6:1:1)-PSNR (avg. MSE)指标排名


第一名:腾讯Tencent266 v0.2.1、阿里巴巴Ali266



图中显示,在同等YUV (6:1:1)-PSNR (avg. MSE)画质下,Ali266比参考编码器x265节省了43%的文件大小。


对全球众多编码器进行全面、公平、公正地测评并非易事。以本届10bit赛道测评为例,从2022年6月1日开始公开征集参赛编码器,到2023年9月25日发布评测结果,整整经历了约16个月的时间。


费时费力的背后,在于视频编码技术在多媒体信息传输和处理环节中的基础性、关键性作用。


02 4K、60帧、10bit,补齐全链路最后一环


数字视频实质上就是一帧帧连续的图像,虽然一帧图像的大小并不大,但一般情况下每秒至少得有24帧图像,它们累积起来就会占据非常大的空间。

而当前,视频超高清化趋势势不可挡,人们越来越享受视频高分辨率、高帧率、高比特深度带来的极致震撼体验。


以4K超高清视频为例,分辨率为3840×2160像素,帧率为60(即每秒有60幅图像),那么未经压缩的1秒视频的数据量超过119.4亿比特(3840×2160像素/帧×24bits/像素×60帧/秒)。


视频编码器可以去除原视频的冗余信息给视频“瘦身”。以暑期热映的《封神第一部:朝歌风云》举例,该电影片长148分钟,合8900秒。若选用4K、24帧/秒、10bit位深的最高清画质,全片数据量便超过7000GB。这么巨大的数据量,不经过压缩直接传输和存储几乎是无法实现的。


在保证画质的前提下,编码器可将原始视频的数据量压缩至几百分之一甚至几千分之一。


因此,视频编码技术使得视频的存储和播放成为可能。


据测算,利用广泛采用的上一代标准开源编码器x265 veryslow档位编码的《封神》4K全片文件大小约3GB,而采用Ali266 slow档位可比原方案节省流量1.8GB,码率节省高达64%。


毫无疑问,4K、60帧、10bit逐渐成为行业公认的超高清视频标准。本届MSU世界编码器大赛首次专门设立了10bit赛道。那么,10bit究竟能为我们的生活带来什么呢?


如果用最直观的说法去描述,10bit能够让色彩呈现出更加细腻的渐变变化,因为每一个颜色通道中的色彩级数由8bit的256级(目前绝大多数的显示设备都采用的是8bit)一下子提高到10bit的1024级,这意味着能够在色彩的渐进和变化方面表现出非凡的细腻度


如下表示的夕阳西下图,上半副图采用8bit位深表示,我们看到太阳由内到外的橘黄色过渡存在明显的“断层”现象,而下半副图采用10bit表示,色彩过渡非常自然。


该对比图片来源于网络


随着国家政策持续发力、市场需求不断增长,视频超高清产业正蓬勃发展。而超高清视频的高分辨率、高帧率、宽色域、宽动态范围等特征,必须与高位深相配合才能充分展示色彩细腻度和对比度,为消费者带来真正的视频临场体验感。因此,高位深是超高清视频不可或缺的重要特征和趋势之一。


若要真正享受到10bit色彩,光有屏幕支持10bit显示是远远不够的,而需要将视频的采集、处理、编码、存储或传输、解码、显示等全链路都以10bit进行处理。

由此可见,10bit编码和10bit解码是整个处理链路中必不可少的两个环节。在H.266/VVC以前的几代标准中,入门档次只支持8bit位深,10bit位深需要在更高的扩展档次才能支持,因此大部分编解码设备并不支持10bit位深视频。


而H.266/VVC在2017年10月发布技术征求书时,就将宽色域和宽动态范围视频(即HDR/WCG)作为主要面向的应用,因此,其入门档次(Main10 Profile)就支持10bit位深的编码标准,大大提高了对10bit位深视频的友好性,拉齐视频业界支持高位深的水准。


此次Ali266编码器在10bit赛道获奖,亦证明了Ali266完全具备10bit编码能力,补齐了全链路10bit的关键一环,符合视频超高清技术发展趋势,为消费者享受真实的视频临场体验提供了新的解决方案。


03 持续耕耘,Ali266的自我进化


Ali266是阿里巴巴达摩院对新一代国际视频标准H.266/VVC的编解码实现,具有高压缩性能、高清实时编码速度、完整的实时高清编解码能力等特点。Ali266编解码器的推出,更好地打开了H.266/VVC标准端到端的生态,为业界提供了新一代视频编解码解决方案。


编码端,Ali266通过实现多种编码算法提升编码质量,提高压缩效率,例如运动补偿时域滤波,自适应GOP大小决策,场景切换检测,屏幕内容检测、码率控制技术等。


另一方面,Ali266涵盖了上百种编码快速算法,配合多线程技术、汇编指令、内存访问效率等工程优化手段,以极小的压缩性能代价大幅提高编码速度。


解码端,Ali266自研的解码器架构、数据结构和内存可复用设计,通过多核并行、汇编优化、内存占用和访存效率优化等一系列工程和算法的优化手段来提高解码速度,可完美兼容Android、iOS、Linux、MacOS、Windows等多种平台。特别是对于集成Ali266解码器的中低端手机,也可清晰流畅地观看最新的H.266/VVC视频或直播,更好地满足了移动互联网时代的用户使用需求。


此外,Ali266充分考虑了商业化软件的需求,经过不同平台数千款高中低端设备的大规模检验,验证了Ali266解码器的鲁棒性、稳定性和可商用性。在MSU世界编码器大赛上连续获奖,标志着Ali266具备业界领先的软件编解码性能,展现其在视频超高清产业的应用潜力。


2022年1月,Ali266在优酷正式上线,优酷也成为当时业界首个H.266/VVC实用落地项目。据测算,自优酷稳定上线使用Ali266以来,在码率上,同等画面清晰度的情况下比原H.265/HEVC方案码率最高节省40%;在体验上,卡顿率降低50%,稳定性超过99.95%


为了充分释放视频编解码标准升级带来的技术红利,为业界提供更低成本、更高画质的视频解决方案,阿里云联合达摩院实现了Ali266对视频点播业务的全线支持。此举将进一步帮助客户大幅节省带宽成本,提升播放体验,解决视频观看体验和带宽流量间的矛盾。


阿里云视频点播支持H.266/VVC,主要包括两方面。一方面阿里云视频云支持将视频转码为H.266/VVC的视频流,并支持mp4、ts、hls等主流容器,方便H.266/VVC视频流存储、传输和分发。另一方面,阿里云播放器提供完美兼容H.266/VVC编码协议视频流的播放解决方案,让客户享受流畅清晰的播放体验。

更多编码效果展示,请点击:https://retina.aliyun.com/#/Ali266


未来,Ali266将紧扣10bit HDR、超高清4K~8K、高帧率60fps~120fps、自由视角等最新技术发展趋势,与音视频产业紧密结合,在点播、直播、RTC等场景不断探索新的商业应用可能,并与5G、人工智能、虚拟现实等技术深度融合,催生大量新场景、新应用、新模式,为观众带来更极致的视听体验和更创新的互动玩法。

相关文章
|
3天前
|
人工智能 自然语言处理 搜索推荐
浪潮信息 Yuan-embedding-1.0 模型登顶MTEB榜单第一名
浪潮信息Yuan-Embedding-1.0模型在C-MTEB评测基准中荣获Retrieval任务第一名,推动中文语义向量技术发展
|
4月前
|
人工智能 算法
第四届 Data-Juicer数据挑战赛暨天池 Better Synth 多模态大模型数据合成挑战赛
阿里云、NVIDIA主办,阿里云天池平台、魔搭社区、阿里巴巴通义实验室共同组织的第四届 Data-Juicer 数据挑战赛,暨天池 Better Synth 多模态大模型数据合成挑战赛开赛啦~
|
人工智能 算法
阿里云人工智能平台 PAI 扩散模型加速采样算法论文入选 CIKM 2023
近日CIKM 2023上,阿里云人工智能平台PAI和华东师范大学陈岑副教授团队主导的扩散模型加速采样算法论文《Optimal Linear Subspace Search: Learning to Construct Fast and High-Quality Schedulers for Diffusion Models》入选。此次入选意味着阿里云人工智能平台 PAI自研的扩散模型算法和框架达到了全球业界先进水平,获得了国际学者的认可,展现了中国人工智能技术创新在国际上的竞争力。
|
算法 数据可视化 自动驾驶
国内首次!山东大学全新点云法向估计算法荣获SIGGRAPH最佳论文奖
国内首次!山东大学全新点云法向估计算法荣获SIGGRAPH最佳论文奖
182 0
|
机器学习/深度学习 人工智能 自然语言处理
人人PyTorch,上A100能夺冠:分析完去年200场数据竞赛,我悟了
人人PyTorch,上A100能夺冠:分析完去年200场数据竞赛,我悟了
124 0
|
计算机视觉
10亿参数、多项SOTA,智源开源视觉基础模型EVA
10亿参数、多项SOTA,智源开源视觉基础模型EVA
343 0
|
存储 机器学习/深度学习 人工智能
IJCAI 2022 | 推理速度22.3倍提升,北航、字节跳动提出二值化关键字识别模型(2)
IJCAI 2022 | 推理速度22.3倍提升,北航、字节跳动提出二值化关键字识别模型
142 0
|
机器学习/深度学习 存储 人工智能
IJCAI 2022 | 推理速度22.3倍提升,北航、字节跳动提出二值化关键字识别模型(1)
IJCAI 2022 | 推理速度22.3倍提升,北航、字节跳动提出二值化关键字识别模型
111 0
|
机器学习/深度学习 编解码 人工智能
华为诺亚调研200多篇文献,视觉Transformer综述入选TPAMI 2022
华为诺亚调研200多篇文献,视觉Transformer综述入选TPAMI 2022
312 0
|
机器学习/深度学习 人工智能 自然语言处理
威大哥大等联合发文!最新多模态大模型LLaVA问世,水平直逼GPT-4
威大哥大等联合发文!最新多模态大模型LLaVA问世,水平直逼GPT-4
292 0
下一篇
无影云桌面