【OpenVI-视觉评价系列之MOS评价实战篇】手机存储不够用,清理照片太痛苦?MOS评价帮你挑选“垃圾”照片

简介: MOS(Mean Opinion Score)是一种常用的主观质量评价方法,常用于视频、图像等多媒体领域中的质量评价。MOS视觉评价通常是通过让受试者观看视频/图像,对视频的清晰度、锐度、颜色饱和度、运动模糊、噪声等方面进行评价。然而,MOS视觉评价也存在一些局限,例如需要大量的受试者,评估时间较长等。因此,近年来,研究者们也开始探索使用客观评价方法来替代或补充MOS视觉评价。

一、背景


     使用基于深度学习模型进行客观MOS评价相比传统的基于主观评价的方法,有以下一些好处:

1.高效性:相比于传统的主观评价方法需要大量受试者进行评估,使用深度学习模型可以大大减少评估时间和人力成本,从而提高评估效率。

2.一致性:深度学习模型可以通过训练来学习人类主观评价的规律和模式,从而使得评估结果更加一致和准确。

3.可重复性:使用深度学习模型进行评价可以使得评估结果具有可重复性,不会像传统的主观评价方法一样受到个体差异的影响。

4.更广泛的应用:传统的主观评价方法需要大量人力和时间成本,使得其在实际应用中受到一定限制。而深度学习模型可以在大规模数据集上进行训练,从而可以在更广泛的场景下进行应用。


和传统的有参考评价方法PSNR, SSIM, VMAF等指标相比,

a.MOS评价不需要参考图,更契合终端用户的使用场景;

b.传统评价方法仅仅考虑图像像素的差异,而忽略了人类视觉系统对图像质量的感知。而使用深度学习模型进行视觉MOS评价有效考虑到人类主观评价的因素,从而更加准确地衡量图像质量;


     总之,使用深度学习模型进行视觉MOS评价可以提高评估效率和准确性,同时也可以使得评估结果具有更好的可重复性和更广泛的应用范围。


二、效果展示

1.png

三、技术原理


     客观MOS评价模型的原理是通过收集人类主观评估数据,并对数据进行特征提取和建模,自动分析图像的不同特征,例如对比度、清晰度和色彩饱和度等,并生成一个与人类主观意见相似的MOS分数。最终将该模型应用于新的图像、视频数据,实现了客观地评估媒体内容质量的目的。应用到终端用户的手机中,可以但不限于自动评价相册中海量图像、视频质量,并挑选其中的高画质内容进行二次创作,或者移除低画质内容以优化存储空间。


四、方法


方法1:模型即服务

     首先打开notebook,可以通过示例右上角快速体验创建账号申领。或者根据本地环境安装(查看文档“Python环境配置部分),等到环境ready后,试跑如下示例代码:

from modelscope.pipelines import pipeline

from modelscope.utils.constant import Tasks

from modelscope.outputs import OutputKeys

img = 'https://modelscope.oss-cn-beijing.aliyuncs.com/test/images/dogs.jpg'

image_quality_assessment_pipeline = pipeline(Tasks.image_quality_assessment_mos, 'damo/cv_resnet_image-quality-assessment-mos_youtubeUGC')

result = image_quality_assessment_pipeline(img)[OutputKeys.SCORE]

print(result)

这样就完成了模型即服务的AI功能调用了


方法2:


视觉智能平台——视频画质评估
打开视频画质评估链接(如上), 按下图所示步骤:

1. 上传视频,将待测视频手动上传。

2. 执行测试,云端推理引擎会对上传视频进行预测。

3. 显示结果,最终的结果会显示在框中。

image.png

五、更多应用

    除了上述模型外,视觉智能平台还上线了包括去噪、超分、调色、上色等多种视频图像修复增强算法。任何低质量的原始视频,都能够在增强修复后变得焕然一新,让你享受到极致高清、饱满、丝滑的视频观看体验。


点击链接   视觉智能平台——视频生产能力广场    可体验多种视觉编辑功能。







相关文章
|
6月前
|
安全 API Python
详解手机状态查询API实战指南
手机状态查询API是一款高效接口,可实时识别手机号状态(实号、空号、风险号等),帮助企业筛选有效号码,提升业务触达率与客户体验。
723 0
|
7月前
|
并行计算 计算机视觉 流计算
照片生成眨眼张嘴的视频软件,制作眨眼睛张嘴图软件,手机制作人脸眨眼张嘴
这是一套基于Python的人脸动画生成系统,功能完整且模块化设计。项目利用dlib与face-alignment库实现精准人脸关键点检测,结合Delaunay三角剖分技术完成图像变形
|
7月前
|
Java
照片一键生成眨眼视频app,手机照片一键生成眨眼动图,通过JAR代码实现效果
这是一个自动生成眨眼GIF动画的Java程序,包含主程序处理、图像变形和GIF生成三个模块。输入照片路径,自动识别人脸眼睛位置,生成闭眼、半闭眼等多帧图像,并合成为眨眼动效GIF文件。
|
4月前
|
传感器 机器学习/深度学习 算法
【室内导航通过视觉惯性数据融合】将用户携带的智能手机收集的惯性数据与手机相机获取的视觉信息进行融合研究(Matlab代码实现)
【室内导航通过视觉惯性数据融合】将用户携带的智能手机收集的惯性数据与手机相机获取的视觉信息进行融合研究(Matlab代码实现)
206 2
|
7月前
|
算法 前端开发 计算机视觉
在线照片眨眼生成器,一键生成眨眼照片, 手机制作人脸眨眼张嘴
本系统基于Flask、OpenCV和dlib实现,包含后端服务、前端界面和动画算法三大模块。支持上传照片实时检测人脸关键点,利用薄板样条变换生成自然眨眼动画效果
|
7月前
|
算法 Python
让照片眨眼张嘴的软件免费,照片摇头眨眼张嘴动图,手机制作人脸眨眼张嘴
本项目提供手机端从代码到开发的完整实现路径,包含人脸关键点检测与动画生成。结合先进算法如First Order Motion Model可进一步优化效果,相关开源项目可在GitHub获取。
|
11月前
|
存储 人工智能 编译器
【03】鸿蒙实战应用开发-华为鸿蒙纯血操作系统Harmony OS NEXT-测试hello word效果-虚拟华为手机真机环境调试-为DevEco Studio编译器安装中文插件-测试写一个滑动块效果-介绍诸如ohos.ui等依赖库-全过程实战项目分享-从零开发到上线-优雅草卓伊凡
【03】鸿蒙实战应用开发-华为鸿蒙纯血操作系统Harmony OS NEXT-测试hello word效果-虚拟华为手机真机环境调试-为DevEco Studio编译器安装中文插件-测试写一个滑动块效果-介绍诸如ohos.ui等依赖库-全过程实战项目分享-从零开发到上线-优雅草卓伊凡
754 11
【03】鸿蒙实战应用开发-华为鸿蒙纯血操作系统Harmony OS NEXT-测试hello word效果-虚拟华为手机真机环境调试-为DevEco Studio编译器安装中文插件-测试写一个滑动块效果-介绍诸如ohos.ui等依赖库-全过程实战项目分享-从零开发到上线-优雅草卓伊凡
|
XML 人工智能 文字识别
Mobile-Agent:通过视觉感知实现自动化手机操作,支持多应用跨平台
Mobile-Agent 是一款基于多模态大语言模型的智能代理,能够通过视觉感知自主完成复杂的移动设备操作任务,支持跨应用操作和纯视觉解决方案。
4630 10
Mobile-Agent:通过视觉感知实现自动化手机操作,支持多应用跨平台
|
机器学习/深度学习 数据采集 算法
基于贝叶斯算法的手机垃圾短信过滤
基于贝叶斯算法的手机垃圾短信过滤
|
存储 小程序 前端开发
【微信小程序 - 工作实战分享】1.微信小程序发送手机短信验证码(阿里云)
【微信小程序 - 工作实战分享】1.微信小程序发送手机短信验证码(阿里云)
1489 0