带你读《2022技术人的百宝黑皮书》——淘宝直播端到端音视频评测方案首次公开(2) https://developer.aliyun.com/article/1243282?groupCode=taobaotech
清晰度
视频的清晰度是衡量视频质量优劣的重要指标,它能够较好的与人的主观感受相对应,清晰度不高表现出视频图像的模糊。从模糊的物理来源来分析,分为:拍摄失真(运动模糊、对焦模糊、昏暗等)、传输失真(x264、jpeg等
压缩模糊)、编辑失真(resize、美颜、滤镜、裁剪等带来的模糊),渲染失真等。
视频质量评价,按有没有人参与的角度,可以分为主观评测和客观评测。
关于主观评测,ITU-R-BT.500,ITU-R-BT.1788和ITU-T-P.910标准,详细的描述了主观评测的环境,设备,素材,人员,流程,结果等细节。因参与人数多,开销大,人的主观疲劳等缺点,主观评测无法高频投入,但其评测结果最接近人主观评价,准确度最高,经常被用来作为客观评价的指导性标注值和质量补充。
考虑到当前客观评价方法的局限性,音视频评测平台从不同需求出发,接入全参考和无参考客观评价算法,以及建立主观评价系统。
全参考评价
有代表性的全参考评价算法,包括PSNR、SSIM、VMAF等。
PSNR是视频处理领域应用最广的性能量化方法,计算复杂度小,实现速度快,数值范围在20~50之间,数值越小表示损失越大,但是局限性很明显,受像素点的影响比较大,与主观评价一致性比较低。
SSIM是一种基于亮度、对比度和结构三个相对独立的主观度量,用于衡量图像间的结构相似度,较PSNR 更符合人眼对图像品质的判断,取值范围0-1,越大质量越好。
VMAF由 Netflix 开发并开源,利用大量的主观数据作为训练集,通过使用机器学习算法(SVM),能得到一个更接近人眼主观感受的评价结果,得分范围在0~100分之间,越大质量越好。如下图所示,VMAF与人眼Mos分匹配度高达90%以上。
全参考评价方法需要提供一个无失真的原始视频,经过对比得到一个对处理后视频的评价结果。音视频评测平台目前支持实时流的全参考评价,通过截取转推实时流地址中的部分时长数据,存储并处理为与源视频同格式视频,进一步做帧对齐处理,从而获取全参考评价算法的两个输入,平台所使用的vmaf算法经淘宝直播训练集训练产出。
带你读《2022技术人的百宝黑皮书》——淘宝直播端到端音视频评测方案首次公开(4) https://developer.aliyun.com/article/1243280?groupCode=taobaotech