带你读《2022技术人的百宝黑皮书》——淘宝直播端到端音视频评测方案首次公开(4)

简介: 带你读《2022技术人的百宝黑皮书》——淘宝直播端到端音视频评测方案首次公开(4)

带你读《2022技术人的百宝黑皮书》——淘宝直播端到端音视频评测方案首次公开(3) https://developer.aliyun.com/article/1243281?groupCode=taobaotech



无参考评价


在直播场景应用过程中绝大多数为实景拍摄,在无侵入改造的条件下实际上很难获取无损的源视频。因此,无参考评价具有更广泛的适用性,无参考方法无需参考视频,根据视频的自身特征来估算视频的质量。一般常用的传统的客观评价可以用梯度、信息熵、QP等算法,其优点是适应性强,对于任意内容视频也有较高的准确度,缺点是评价维度比较单一。例如QP考虑块效应,信息熵反馈信息复杂程度但对噪声比较敏感,梯度计算相邻元素梯度变化,使用不同算子对不同失真类型敏感度程度不同,都有一定的局限性。


淘宝音视频评测平台接入了多种梯度计算算法,经过多个版本测试,发现在实验条件相对固定(拍摄内容和光源)的情况下,梯度算法和信息熵等评测数值,比较符合主观对于不同端侧清晰度排序的结果。因客观数值能更好的描

述图片之间细小的差别,对于清晰度的评价还是有很强的参考意义。


但是,线上直播内容场景众多。淘宝音视频团队将不同编码参数应用于不同视频内容,对重点关注区域做了画质增强。如美妆类关注人脸,服饰类关注色差和纹理,玉石类关注亮度等。现实中每个人对噪声、纹理、色彩、亮度、流畅度等体感是不一样的,综上全参考评价算法或梯度等无参考算法应用上都有一定的适用范围,而目前在无参考评价算法领域,还缺乏类似于有参考评测PSNR,SSIM,VMAF等具备公信力的指标算法。


image.png


目前学术界主流的无参考评价算法,是使用深度学习来预测视频的主观质量。淘宝音视频团队自研视频画质评价算法MD-VQA,同时考虑了语义特征和失真特征,通过多层语义信息以及相邻帧语义信息的差异来表征视频语义信息的退化情况。失真特征则考虑了清晰度、噪声、块效应、过曝/欠曝和彩度五个质量相关的不同维度的失真指标,作为视频语义特征的补充。二者结合来评价视频的整体失真情况。目前音视频评测平台已接入MD-VQA算法,结合主观评测及月度版本评测持续观测算法效果。



带你读《2022技术人的百宝黑皮书》——淘宝直播端到端音视频评测方案首次公开(5) https://developer.aliyun.com/article/1243279?groupCode=taobaotech


相关文章
|
安全 Linux KVM
倚天产品介绍|倚天虚拟化:CPU虚拟化原理介绍
虚拟化技术中最关键的技术之一就是CPU虚拟化。在没有硬件辅助虚拟化技术出来之前,通常都是通过TCG(软件进行指令翻译)的方式实现CPU虚拟化。但是由于TCG方式的虚拟化层开销太大,性能太差,因此引入了硬件辅助虚拟化技术。
|
数据可视化
绘制热图时看不出颜色差异?四种方式转换处理使结果显而“易”见
绘制热图时看不出颜色差异?四种方式转换处理使结果显而“易”见
21236 2
|
机器学习/深度学习 数据建模 定位技术
【数据结构】图的基本概念—无/有向图、权和网、完全图、路径与回路
【数据结构】图的基本概念—无/有向图、权和网、完全图、路径与回路
6718 0
【数据结构】图的基本概念—无/有向图、权和网、完全图、路径与回路
|
机器学习/深度学习 自然语言处理 算法
|
人工智能 Cloud Native 数据管理
媒体声音|重磅升级,阿里云发布首个“Data+AI”驱动的一站式多模数据平台
在2024云栖大会上,阿里云瑶池数据库发布了首个一站式多模数据管理平台DMS:OneMeta+OneOps。该平台由Data+AI驱动,兼容40余种数据源,实现跨云数据库、数据仓库、数据湖的统一数据治理,帮助用户高效提取和分析元数据,提升业务决策效率10倍。DMS已服务超10万企业客户,降低数据管理成本高达90%。
933 19
|
开发框架 人工智能 物联网
跨平台开发框架的发展趋势
【10月更文挑战第25天】
零基础入门金融风控之贷款违约预测的Task1:赛题理解
零基础入门金融风控之贷款违约预测的Task1:赛题理解
305 4
|
Linux Shell
Linux系统编程:掌握popen函数的使用
记得在使用完 `popen`打开的流后,总是使用 `pclose`来正确关闭它,并回收资源。这种做法符合良好的编程习惯,有助于保持程序的健壮性和稳定性。
1016 6
|
JavaScript 前端开发 安全
80 行 JS 代码实现页面添加水印:文字水印、多行文字水印、图片水印、文字&图片水印
80 行 JS 代码实现页面添加水印:文字水印、多行文字水印、图片水印、文字&图片水印 1. 信息标识: 水印可以用于标识文档的所有者、保密级别、状态或其他相关信息,帮助用户更好地理解文档内容的属性。 2. 版权保护: 在文档中添加水印可以帮助保护内容的版权,防止他人未经授权地复制、转载或篡改内容。 3. 安全保护: 对于敏感信息或机密文档,添加水印可以帮助防止信息泄露,提高文档的安全性。 4. 提升专业性: 在一些场景下,如商业报告、合同文件等,添加水印可以增加文档的专业性和正式性。 5. 防止截屏或拷贝: 在网页中添加水印可以防止用户通过截屏或复制粘贴等方式非法获取文档内容。
710 1
80 行 JS 代码实现页面添加水印:文字水印、多行文字水印、图片水印、文字&图片水印
|
Shell Linux Python
python执行linux系统命令的几种方法(python3经典编程案例)
文章介绍了多种使用Python执行Linux系统命令的方法,包括使用os模块的不同函数以及subprocess模块来调用shell命令并处理其输出。
1046 0