初次体验图像分类模型识别

简介: 自建1300类常见物体标签体系,覆盖常见的日用品,动物,植物,家具,设备,食物等物体,标签从海量中文互联网社区语料进行提取,保留了出现频率较高的常见物体名称。模型结构采用最新的ViT-Base结构。

360截图17350729667396.png

  • 首先这个需要知道图片识别这个技术领域,图像识别技术是人工智能的一个重要领域。它是指对图像进行对象识别,以识别各种不同模式的目标和对像的技术。
  • 图像识别是人工智能的一个重要领域,是指利用计算机对图像进行处理、分析和理解,以识别各种不同模式的目标和对像的技术。

基本过程流程

  • 信息的获取:是通过传感器,将光或声音等信息转化为电信息。信息可以是二维的图象如文字,图象等;可以是一维的波形如声波,心电图,脑电图;也可以是物理量与逻辑值。
  • 预处理:包括A\D,二值化,图象的平滑,变换,增强,恢复,滤波等, 主要指图象处理。
  • 特征抽取和选择:在模式识别中,需要进行特征的抽取和选择,例如,一幅64x64的图象可以得到4096个数据,这种在测量空间的原始数据通过变换获得在特征空间最能反映分类本质的特征。这就是特征提取和选择的过程。
  • 分类器设计:分类器设计的主要功能是通过训练确定判决规则,使按此类判决规则分类时,错误率最低。
  • 分类决策:在特征空间中对被识别对象进行分类。

ViT-base图像分类模型

  • 阿里云提供的图像分类模型这个那些几乎都是大差不差的,通过AI数据识别分析,然后在数据库中比对,数据相符合的。
  • 就像我们做的垃圾分类这个功能,用户通过手机拍照,然后传给后端,后端通过数据比对,返回当前图片的数据信息,属于哪些类。
  • 阿里云的日常物体识别模型。是自建1300类常见物体标签体系,覆盖常见的日用品,动物,植物,家具,设备,食物等物体,标签从海量中文互联网社区语料进行提取,保留了出现频率较高的常见物体名称。模型结构采用最新的ViT-Base结构。

图像分类模型使用范围

  • 本模型适用范围较广,覆盖大部分日常生活常见的物品类目,包括日用品,动物,植物,家具,设备,食物等。也可作为下游任务的预训练backbone。

如何使用阿里云提供的图片分类模型

  • 在ModelScope框架上,提供输入图片,即可通过简单的Pipeline调用来使用。

代码实现

  from modelscope.pipelines import pipeline
from modelscope.utils.constant import Tasks

img_path = '/path/to/input/test.jpg'
image_classification = pipeline(Tasks.image_classification)
result = image_classification(img_path)
print(result)

实现效果

  • 通过平台,我们上传一张照片,就可以分析出当前图片属于那些类

1.png

  • 接口返回数据
"root":{5 items
"Code":int200
"Data":{2 items
"computation_time":string"0.09s"
"data":{2 items
"labels":[5 items
0:string"毛巾"
1:string"浴巾"
2:string"鲸鱼"
3:string"江豚"
4:string"鲸"
]
"scores":[5 items
0:float0.625086784362793
1:float0.17376253008842468
2:float0.0020476249046623707
3:float0.0020405922550708055
4:float0.001764394692145288
]
}
}
"Message":string"success"
"RequestId":string"f67340cb-b9ff-4082-82de-08a13babf4f2"
"Success":booltrue
}
  • 这样我们随意上传一张照片,就可以看到当前照片信息,方便快捷,最常用的还是城市垃圾分类这个效果,用户可以拍照,上传图片,精准准确的识别当前图片,方便快捷
  • 图像分类模型识别体验,确实是一个不错的模型,应用场景比较广泛,日常生活中,我们都可以用到当前模型,来帮助我们日常处理一些事情
目录
相关文章
|
8月前
|
人工智能
KOALA图像AI模型发布,低配电脑2秒生图
【2月更文挑战第13天】KOALA图像AI模型发布,低配电脑2秒生图
115 2
KOALA图像AI模型发布,低配电脑2秒生图
|
8月前
|
并行计算 Linux 计算机视觉
还在手工标注数据集?快来试一试自动化多模型标注大模型-gui交互式标注(部署运行教程-高效生产力)
还在手工标注数据集?快来试一试自动化多模型标注大模型-gui交互式标注(部署运行教程-高效生产力)
|
人工智能 自然语言处理 Java
首次体验中文竞技场大模型体验!!!
我将分别从知识常识、中文游戏、NLP专业领域、代码相关、写作创作、人类价值观六大领域测评不同模型的效果,以及一些看法。
|
机器学习/深度学习 人工智能 自然语言处理
ModelScope在线体验模型测试
ModelScope在线体验模型测试
41665 3
ModelScope在线体验模型测试
|
22天前
|
机器学习/深度学习 人工智能 文字识别
Kimi 上线视觉思考模型,K1 系列强化学习模型正式开放,无需借助外部 OCR 处理图像与文本进行思考并回答
k1视觉思考模型是kimi推出的k1系列强化学习AI模型,具备端到端图像理解和思维链技术,能够在数学、物理、化学等领域表现优异。本文详细介绍了k1视觉思考模型的功能、技术原理、使用方法及其在多个应用场景中的表现。
169 68
Kimi 上线视觉思考模型,K1 系列强化学习模型正式开放,无需借助外部 OCR 处理图像与文本进行思考并回答
|
13天前
|
人工智能 自然语言处理 机器人
OpenAI推出具有图像上传和分析功能的完整o1模型,并首次推出ChatGPT Pro
OpenAI推出具有图像上传和分析功能的完整o1模型,并首次推出ChatGPT Pro
|
7月前
|
自然语言处理 并行计算 测试技术
初次体验魔搭,问题一堆堆
问题不少,可以提升的空间还很大
绘梦相似,AIGC图生图:相似图像生成模型魔搭社区开源体验
日常我们在艺术创作和产品设计中,需要多张风格相似的图片
|
机器学习/深度学习 人工智能 自然语言处理
「模型即服务AI」1分钟调用SOTA人脸检测,同时搭建时光相册小应用—【OpenVI—代码解读系列】
最近有两个计算机应用发展的方向正在潜移默化的汇拢中:1.)模型即服务 2.)人工智能(AI)。它们的会师正逐渐形成模型即服务AI热潮。 近几年模型即服务一直被人津津乐道,这是提升AI编程效率、加速AI创新应用的大趋势。人工智能领域近几年非常火热,基于AI的行业创新应用层出不穷,尤其今年的AI绘画又大有元年之势,相应介绍可查阅《人工智能内容生成元年—AI绘画原理解析》。如下章节将重点介绍如何通过模型即服务来完成AI功能调用以及相应AI应用搭建。
1420 3
|
数据采集 机器学习/深度学习 人工智能
用ChatGPT训练羊驼:「白泽」开源,轻松构建专属模型,可在线试玩
用ChatGPT训练羊驼:「白泽」开源,轻松构建专属模型,可在线试玩
489 0