- 首先这个需要知道图片识别这个技术领域,图像识别技术是人工智能的一个重要领域。它是指对图像进行对象识别,以识别各种不同模式的目标和对像的技术。
- 图像识别是人工智能的一个重要领域,是指利用计算机对图像进行处理、分析和理解,以识别各种不同模式的目标和对像的技术。
基本过程流程
- 信息的获取:是通过传感器,将光或声音等信息转化为电信息。信息可以是二维的图象如文字,图象等;可以是一维的波形如声波,心电图,脑电图;也可以是物理量与逻辑值。
- 预处理:包括A\D,二值化,图象的平滑,变换,增强,恢复,滤波等, 主要指图象处理。
- 特征抽取和选择:在模式识别中,需要进行特征的抽取和选择,例如,一幅64x64的图象可以得到4096个数据,这种在测量空间的原始数据通过变换获得在特征空间最能反映分类本质的特征。这就是特征提取和选择的过程。
- 分类器设计:分类器设计的主要功能是通过训练确定判决规则,使按此类判决规则分类时,错误率最低。
- 分类决策:在特征空间中对被识别对象进行分类。
ViT-base图像分类模型
- 阿里云提供的图像分类模型这个那些几乎都是大差不差的,通过AI数据识别分析,然后在数据库中比对,数据相符合的。
- 就像我们做的垃圾分类这个功能,用户通过手机拍照,然后传给后端,后端通过数据比对,返回当前图片的数据信息,属于哪些类。
- 阿里云的日常物体识别模型。是自建1300类常见物体标签体系,覆盖常见的日用品,动物,植物,家具,设备,食物等物体,标签从海量中文互联网社区语料进行提取,保留了出现频率较高的常见物体名称。模型结构采用最新的ViT-Base结构。
图像分类模型使用范围
- 本模型适用范围较广,覆盖大部分日常生活常见的物品类目,包括日用品,动物,植物,家具,设备,食物等。也可作为下游任务的预训练backbone。
如何使用阿里云提供的图片分类模型
- 在ModelScope框架上,提供输入图片,即可通过简单的Pipeline调用来使用。
代码实现
from modelscope.pipelines import pipeline
from modelscope.utils.constant import Tasks
img_path = '/path/to/input/test.jpg'
image_classification = pipeline(Tasks.image_classification)
result = image_classification(img_path)
print(result)
实现效果
- 通过平台,我们上传一张照片,就可以分析出当前图片属于那些类
"root":{5 items
"Code":int200
"Data":{2 items
"computation_time":string"0.09s"
"data":{2 items
"labels":[5 items
0:string"毛巾"
1:string"浴巾"
2:string"鲸鱼"
3:string"江豚"
4:string"鲸"
]
"scores":[5 items
0:float0.625086784362793
1:float0.17376253008842468
2:float0.0020476249046623707
3:float0.0020405922550708055
4:float0.001764394692145288
]
}
}
"Message":string"success"
"RequestId":string"f67340cb-b9ff-4082-82de-08a13babf4f2"
"Success":booltrue
}
- 这样我们随意上传一张照片,就可以看到当前照片信息,方便快捷,最常用的还是城市垃圾分类这个效果,用户可以拍照,上传图片,精准准确的识别当前图片,方便快捷
- 图像分类模型识别体验,确实是一个不错的模型,应用场景比较广泛,日常生活中,我们都可以用到当前模型,来帮助我们日常处理一些事情