达摩院OpenVI-图像MOS评价协助清理“垃圾”照片

本文涉及的产品
交互式建模 PAI-DSW,每月250计算时 3个月
模型训练 PAI-DLC,100CU*H 3个月
模型在线服务 PAI-EAS,A10/V100等 500元 1个月
简介: 达摩院OpenVI-图像MOS评价协助清理“垃圾”照片

01背景

MOS(Mean Opinion Score)是一种常用的主观质量评价方法,常用于视频、图像等多媒体领域中的质量评价。MOS视觉评价通常是通过让受试者观看视频/图像,对视频的清晰度、锐度、颜色饱和度、运动模糊、噪声等方面进行评价。然而,MOS视觉评价也存在一些局限,例如需要大量的受试者,评估时间较长等。

因此,近年来,研究者们也开始探索使用客观评价方法来替代或补充MOS视觉评价。使用基于深度学习模型进行客观MOS评价相比传统的基于主观评价的方法,有以下一些好处:

a.)高效性:相比于传统的主观评价方法需要大量受试者进行评估,使用深度学习模型可以大大减少评估时间和人力成本,从而提高评估效率。

b.)一致性:深度学习模型可以通过训练来学习人类主观评价的规律和模式,从而使得评估结果更加一致和准确。

c.)可重复性:使用深度学习模型进行评价可以使得评估结果具有可重复性,不会像传统的主观评价方法一样受到个体差异的影响。

d.)适配性好:传统的主观评价方法需要大量人力和时间成本,使得其在实际应用中受到一定限制。而深度学习模型可以在大规模数据集上进行训练,从而可以在更广泛的场景下进行应用。

与传统的有参考评价方法PSNR, SSIM, VMAF等指标相比:

1.)MOS评价不需要参考图,更契合终端用户的使用场景;

2.)传统评价方法仅仅考虑图像像素的差异,而忽略了人类视觉系统对图像质量的感知。而使用深度学习模型进行视觉MOS评价有效考虑到人类主观评价的因素,从而更加准确地衡量图像质量;

总之,使用深度学习模型进行视觉MOS评价可以提高评估效率和准确性,同时也可以使得评估结果具有更好的可重复性和更广泛的应用范围。效果如下图所示:

2方法

客观MOS评价模型的原理是通过收集人类主观评估数据,并对数据进行特征提取和建模,自动分析图像的不同特征,例如对比度、清晰度和色彩饱和度等,并生成一个与人类主观意见相似的MOS分数。

最终将该模型应用于新的图像、视频数据,实现了客观地评估媒体内容质量的目的。应用到终端用户的手机中,可以但不限于自动评价相册中海量图像、视频质量,并挑选其中的高画质内容进行二次创作,或者移除低画质内容以优化存储空间。

3体验

体验网址:

方法1:模型即服务

首先打开notebook,可以通过示例右上角快速体验创建账号申领。或者根据本地环境安装(查看文档中“Python环境配置”部分),等到环境ready后,试跑如下示例代码:

from modelscope.pipelines import pipelinefrom modelscope.utils.constant import Tasksfrom modelscope.outputs import OutputKeys img = 'https://modelscope.oss-cn-beijing.aliyuncs.com/test/images/dogs.jpg'image_quality_assessment_pipeline = pipeline(Tasks.image_quality_assessment_mos, 'damo/cv_resnet_image-quality-assessment-mos_youtubeUGC')result = image_quality_assessment_pipeline(img)[OutputKeys.SCORE]print(result)

这样就完成了模型即服务的AI功能调用了。

方法2:使用在线体验功能

打开模型链接, 按下图所示步骤:

1. 上传图片,将待测图片手动上传。

2. 执行测试,云端推理引擎会对上传图像进行mos预测。

3. 显示结果,最终的结果会显示在框中。结果为浮点数,范围[0, 1]值越大代表图像质量越高。

04应用

除了上述模型外,modelscope社区还上线了包括去噪、超分、调色、上色等多种视频图像修复增强算法。任何低质量的原始视频,都能够在增强修复后变得焕然一新,让你享受到极致高清、饱满、丝滑的视频观看体验。

点击链接:

https://www.modelscope.cn/models?page=1&tasks=vision-editing&type=cv

可体验多种视觉编辑功能。

视觉评价是底层视觉的一部分,能有替代人工高效完成画质评估工作,

05模型传送门

异常帧检测

https://www.modelscope.cn/models/damo/cv_mobilenet-v2_bad-image-detecting/summary

图像画质损伤分析

https://www.modelscope.cn/models/damo/cv_resnet50_image-quality-assessment_degradation/summary

相关文章
|
人工智能 自然语言处理 前端开发
AI 绘画Stable Diffusion 研究(十)sd图生图功能详解-精美二维码的制作
AI 绘画Stable Diffusion 研究(十)sd图生图功能详解-精美二维码的制作
1147 1
|
2月前
|
机器学习/深度学习 编解码 人工智能
面壁开源多模态新旗舰MiniCPM-V 4.5,8B 性能超越 72B,高刷视频理解又准又快
今天,面壁智能正式开源 8B 参数的面壁小钢炮 MiniCPM-V 4.5 多模态旗舰模型,成为行业首个具备“高刷”视频理解能力的多模态模型,看得准、看得快,看得长!高刷视频理解、长视频理解、OCR、文档解析能力同级 SOTA,且性能超过 Qwen2.5-VL 72B,堪称最强端侧多模态模型。
347 9
|
Linux 数据安全/隐私保护 Windows
更换(Pypi)pip源到国内镜像
pip国内的一些镜像 阿里云 http://mirrors.aliyun.com/pypi/simple/ 中国科技大学 https://pypi.mirrors.
247218 2
|
11月前
|
人工智能 文字识别 测试技术
苹果多模态模型大升级!文本密集、多图理解,全能小钢炮
苹果公司近日发布了其最新版本的多模态模型MM1.5,该模型在文本密集图像理解、视觉引用和定位以及多图推理等方面进行了显著升级。MM1.5基于MM1模型,具备更强的文本处理、视觉理解和多图推理能力,适用于多种下游任务。此外,还推出了专门用于视频理解和移动UI理解的变体。
198 3
|
11月前
|
算法
客观评价模型与主观DMOS分数拟合的分享与实用性探讨
本文深入探讨了视频质量的主客观评价方法,指出客观评价方法旨在精确描述人眼的主观感受。文章介绍了微帧在日常训练中使用的拟合方法,通过映射函数将客观指标与主观评价DMOS分数进行非线性拟合,以提高评价的准确性、一致性、稳定性和单调性。具体讨论了SSIM、PSNR和VMAF等常见客观指标的拟合公式,并总结了拟合方法在分析质量差异、统一客观指标和指导参数设置方面的实用价值。
|
机器学习/深度学习 存储 人工智能
【OpenVI-视觉评价系列之MOS评价实战篇】手机存储不够用,清理照片太痛苦?MOS评价帮你挑选“垃圾”照片
MOS(Mean Opinion Score)是一种常用的主观质量评价方法,常用于视频、图像等多媒体领域中的质量评价。MOS视觉评价通常是通过让受试者观看视频/图像,对视频的清晰度、锐度、颜色饱和度、运动模糊、噪声等方面进行评价。然而,MOS视觉评价也存在一些局限,例如需要大量的受试者,评估时间较长等。因此,近年来,研究者们也开始探索使用客观评价方法来替代或补充MOS视觉评价。
870 2
【OpenVI-视觉评价系列之MOS评价实战篇】手机存储不够用,清理照片太痛苦?MOS评价帮你挑选“垃圾”照片
|
Android开发 Swift iOS开发
python 基于电脑蓝牙连接获取手机的实时数据
python 基于电脑蓝牙连接获取手机的实时数据
279 0
|
机器学习/深度学习 人工智能 搜索推荐
【图像生成技术】人工智能在广告营销的革新:图像生成技术的应用与实践代码示例
随着人工智能技术的飞速发展,广告营销行业迎来了前所未有的变革。图像生成技术,作为AI领域的一颗璀璨明星,正被广泛应用于创造个性化、高吸引力的产品展示图、海报乃至宣传视频,以精准对接目标受众,显著提升广告的转化率和整体营销效果。本文将深入探讨这一技术的应用场景,并通过一个简单的代码示例,展示如何利用深度学习框架TensorFlow来实现创意图像的自动生成。
344 4
|
机器学习/深度学习 人工智能 自然语言处理
AI生产范式
【5月更文挑战第7天】AI生产范式
675 4
|
安全 Python
Python如何对文件进行重命名操作?
Python如何对文件进行重命名操作?
349 0