初次体验图像分类模型识别

简介: 自建1300类常见物体标签体系,覆盖常见的日用品,动物,植物,家具,设备,食物等物体,标签从海量中文互联网社区语料进行提取,保留了出现频率较高的常见物体名称。模型结构采用最新的ViT-Base结构。

360截图17350729667396.png

  • 首先这个需要知道图片识别这个技术领域,图像识别技术是人工智能的一个重要领域。它是指对图像进行对象识别,以识别各种不同模式的目标和对像的技术。
  • 图像识别是人工智能的一个重要领域,是指利用计算机对图像进行处理、分析和理解,以识别各种不同模式的目标和对像的技术。

基本过程流程

  • 信息的获取:是通过传感器,将光或声音等信息转化为电信息。信息可以是二维的图象如文字,图象等;可以是一维的波形如声波,心电图,脑电图;也可以是物理量与逻辑值。
  • 预处理:包括A\D,二值化,图象的平滑,变换,增强,恢复,滤波等, 主要指图象处理。
  • 特征抽取和选择:在模式识别中,需要进行特征的抽取和选择,例如,一幅64x64的图象可以得到4096个数据,这种在测量空间的原始数据通过变换获得在特征空间最能反映分类本质的特征。这就是特征提取和选择的过程。
  • 分类器设计:分类器设计的主要功能是通过训练确定判决规则,使按此类判决规则分类时,错误率最低。
  • 分类决策:在特征空间中对被识别对象进行分类。

ViT-base图像分类模型

  • 阿里云提供的图像分类模型这个那些几乎都是大差不差的,通过AI数据识别分析,然后在数据库中比对,数据相符合的。
  • 就像我们做的垃圾分类这个功能,用户通过手机拍照,然后传给后端,后端通过数据比对,返回当前图片的数据信息,属于哪些类。
  • 阿里云的日常物体识别模型。是自建1300类常见物体标签体系,覆盖常见的日用品,动物,植物,家具,设备,食物等物体,标签从海量中文互联网社区语料进行提取,保留了出现频率较高的常见物体名称。模型结构采用最新的ViT-Base结构。

图像分类模型使用范围

  • 本模型适用范围较广,覆盖大部分日常生活常见的物品类目,包括日用品,动物,植物,家具,设备,食物等。也可作为下游任务的预训练backbone。

如何使用阿里云提供的图片分类模型

  • 在ModelScope框架上,提供输入图片,即可通过简单的Pipeline调用来使用。

代码实现

  from modelscope.pipelines import pipeline
from modelscope.utils.constant import Tasks

img_path = '/path/to/input/test.jpg'
image_classification = pipeline(Tasks.image_classification)
result = image_classification(img_path)
print(result)

实现效果

  • 通过平台,我们上传一张照片,就可以分析出当前图片属于那些类

1.png

  • 接口返回数据
"root":{5 items
"Code":int200
"Data":{2 items
"computation_time":string"0.09s"
"data":{2 items
"labels":[5 items
0:string"毛巾"
1:string"浴巾"
2:string"鲸鱼"
3:string"江豚"
4:string"鲸"
]
"scores":[5 items
0:float0.625086784362793
1:float0.17376253008842468
2:float0.0020476249046623707
3:float0.0020405922550708055
4:float0.001764394692145288
]
}
}
"Message":string"success"
"RequestId":string"f67340cb-b9ff-4082-82de-08a13babf4f2"
"Success":booltrue
}
  • 这样我们随意上传一张照片,就可以看到当前照片信息,方便快捷,最常用的还是城市垃圾分类这个效果,用户可以拍照,上传图片,精准准确的识别当前图片,方便快捷
  • 图像分类模型识别体验,确实是一个不错的模型,应用场景比较广泛,日常生活中,我们都可以用到当前模型,来帮助我们日常处理一些事情
目录
相关文章
|
人工智能 自然语言处理 Java
首次体验中文竞技场大模型体验!!!
我将分别从知识常识、中文游戏、NLP专业领域、代码相关、写作创作、人类价值观六大领域测评不同模型的效果,以及一些看法。
|
8天前
|
数据采集 人工智能 物联网
【Qwen模型百变玩家】——从微调到部署的全能攻略!
本文通过“Qwen模型”实例,详细讲解了AI模型从微调到部署的全过程。涵盖模型简介、调参技巧、高效部署及实际案例,帮助读者从新手成长为调参高手,确保模型在生产环境中稳定高效运行。
79 12
|
7月前
|
人工智能 安全
【新手小白】Sora如何申请?Sora使用教程(最新)
近日,OpenAI发布的Sora模型引发了广泛关注,成为行业内外热议的焦点。这一模型不仅在专业领域引起了极大兴趣,还激发了普通群众对于人工通用智能(AGI)的热情。随着Sora模型的爆红,越来越多的人开始关注一个问题:我们何时能开始使用Sora?在OpenAI的官方论坛上,关于这个问题的讨论异常激烈。有关如何使用Sora的话题阅读量已接近70,000,显示出人们对此充满期待。下面这篇文章解答了大家的这些问题。
5310 3
【新手小白】Sora如何申请?Sora使用教程(最新)
|
6月前
|
自然语言处理 并行计算 测试技术
初次体验魔搭,问题一堆堆
问题不少,可以提升的空间还很大
|
7月前
|
人工智能 编解码 安全
如何使用Sora?Sora小白教程一文通
如何使用Sora?Sora小白教程一文通
|
7月前
|
人工智能 机器人 API
ChatGPT4.0直接出图功能上线!神奇一键画,新手小白也能绘画(chatgpt4.0直接出圖)
ChatGPT4.0直接出图功能上线!神奇一键画,新手小白也能绘画(chatgpt4.0直接出圖)
412 2
|
PyTorch 算法框架/工具 计算机视觉
目标检测模型NanoDet(超轻量,速度很快)介绍和PyTorch版本实践
YOLO、SSD、Fast R-CNN等模型在目标检测方面速度较快和精度较高,但是这些模型比较大,不太适合移植到移动端或嵌入式设备;轻量级模型 NanoDet-m,对单阶段检测模型三大模块(Head、Neck、Backbone)进行轻量化,目标加检测速度很快;模型文件大小仅几兆(小于4M)。
372 0
|
机器学习/深度学习 人工智能 自然语言处理
「模型即服务AI」1分钟调用SOTA人脸检测,同时搭建时光相册小应用—【OpenVI—代码解读系列】
最近有两个计算机应用发展的方向正在潜移默化的汇拢中:1.)模型即服务 2.)人工智能(AI)。它们的会师正逐渐形成模型即服务AI热潮。 近几年模型即服务一直被人津津乐道,这是提升AI编程效率、加速AI创新应用的大趋势。人工智能领域近几年非常火热,基于AI的行业创新应用层出不穷,尤其今年的AI绘画又大有元年之势,相应介绍可查阅《人工智能内容生成元年—AI绘画原理解析》。如下章节将重点介绍如何通过模型即服务来完成AI功能调用以及相应AI应用搭建。
1406 3
「模型即服务AI」1分钟调用SOTA人脸检测,同时搭建时光相册小应用—【OpenVI—代码解读系列】
|
机器学习/深度学习 异构计算
福利贴!玩机器学习的各位,送你一个免费的GPU!!!
福利贴!玩机器学习的各位,送你一个免费的GPU!!!
160 0
|
人工智能 iOS开发 异构计算
3天近一万Star,无差体验GPT-4识图能力,MiniGPT-4看图聊天、还能草图建网站
3天近一万Star,无差体验GPT-4识图能力,MiniGPT-4看图聊天、还能草图建网站
192 0