使用特征包方法进行图像类别分类

简介: 使用特征包方法进行图像类别分类。这种技术通常也被称为词袋。视觉图像分类是为受测图像分配类别标签的过程。类别可能包含代表几乎任何东西的图像,例如狗、猫、火车、船。

一、前言
使用特征包方法进行图像类别分类。这种技术通常也被称为词袋。视觉图像分类是为受测图像分配类别标签的过程。类别可能包含代表几乎任何东西的图像,例如狗、猫、火车、船。
二、加载图像数据集
解压缩要用于此示例的图像集合。使用 加载图像集合以帮助您管理数据。由于对图像文件位置进行操作,因此不会将所有图像加载到内存中,因此可以安全地用于大型图像集合。

您可以轻松检查每个类别的图像数量以及类别标签,如下所示:
1.png

请注意,标签派生自用于构造图像数据存储的目录名称,但可以通过手动设置对象的标签属性来自定义。接下来,显示一些图像以了解正在使用的图像类型。
2.png

请注意,要使特征袋方法有效,大部分对象必须在图像中可见。

三、准备训练和验证图像集
将集分为训练数据和验证数据。从每组图像中选择 60% 的图像作为训练数据,其余 40% 的图像用于验证数据。随机化拆分以避免结果偏差。

上面的调用返回两个准备用于训练和验证任务对象。

四、创建视觉词汇表并训练图像类别分类器
词袋是一种适应自然语言处理世界的计算机视觉的技术。由于图像实际上不包含离散词,因此我们首先构建代表每个图像类别特征的“词汇表”。
此外,对象提供了一种计算图像中可视单词出现次数的方法。它产生了一个直方图,该直方图成为图像的新简化表示。
3.png

此直方图构成了训练分类器和实际图像分类的基础。本质上,它将图像编码为特征向量。

来自每个类别的编码训练图像被馈送到函数调用的分类器训练过程中。请注意,此函数依赖于统计和机器学习工具箱™中的多类线性 SVM 分类器。

五、评估分类器性能
现在我们有一个经过训练的分类器,让我们来评估它。作为健全性检查,让我们首先使用训练集对其进行测试,它应该产生近乎完美的混淆矩阵,即对角线上的混淆矩阵。
4.png

接下来,让我们评估分类器,该分类器在训练期间未使用。默认情况下,该函数返回混淆矩阵,这是分类器性能良好的初始指标。

六、在测试图像上尝试新训练的分类器
现在,您可以应用新训练的分类器对新图像进行分类。
5.png

目录
相关文章
|
7月前
|
人工智能 计算机视觉 Python
【超详细】【YOLOV8使用说明】一套框架解决CV的5大任务:目标检测、分割、姿势估计、跟踪和分类任务【含源码】(1)
【超详细】【YOLOV8使用说明】一套框架解决CV的5大任务:目标检测、分割、姿势估计、跟踪和分类任务【含源码】
【超详细】【YOLOV8使用说明】一套框架解决CV的5大任务:目标检测、分割、姿势估计、跟踪和分类任务【含源码】(1)
|
4月前
|
自然语言处理 数据挖掘
数据特征包括分布特征、统计特征、对比特征、帕累托特征和文本特征
数据特征包括分布特征、统计特征、对比特征、帕累托特征和文本特征
168 4
|
7月前
|
计算机视觉
【超详细】【YOLOV8使用说明】一套框架解决CV的5大任务:目标检测、分割、姿势估计、跟踪和分类任务【含源码】(2)
【超详细】【YOLOV8使用说明】一套框架解决CV的5大任务:目标检测、分割、姿势估计、跟踪和分类任务【含源码】
|
机器学习/深度学习 编解码 PyTorch
基于MeshCNN和PyTorch的三维对象分类和分割
基于MeshCNN和PyTorch的三维对象分类和分割
390 0
基于MeshCNN和PyTorch的三维对象分类和分割
|
JSON 算法 数据格式
优化cv2.findContours()函数提取的目标边界点,使语义分割进行远监督辅助标注
可以看到cv2.findContours()函数可以将目标的所有边界点都进行导出来,但是他的点存在一个问题,太过密集,如果我们想将语义分割的结果重新导出成labelme格式的json文件进行修正时,这就会存在点太密集没有办法进行修改,这里展示一个示例:没有对导出的结果进行修正,在labelme中的效果图。
255 0
|
存储 机器学习/深度学习 编解码
使用训练分类网络预处理多分辨率图像
说明如何准备用于读取和预处理可能不适合内存的多分辨率全玻片图像 (WSI) 的数据存储。肿瘤分类的深度学习方法依赖于数字病理学,其中整个组织切片被成像和数字化。生成的 WSI 具有高分辨率,大约为 200,000 x 100,000 像素。WSI 通常以多分辨率格式存储,以促进图像的高效显示、导航和处理。 读取和处理WSI数据。这些对象有助于使用多个分辨率级别,并且不需要将图像加载到核心内存中。此示例演示如何使用较低分辨率的图像数据从较精细的级别有效地准备数据。可以使用处理后的数据来训练分类深度学习网络。
363 0
|
机器学习/深度学习 数据可视化 计算机视觉
使用深度学习进行图像类别分类
使用预训练卷积神经网络 (CNN) 作为特征提取器来训练图像类别分类器。
139 0
|
机器学习/深度学习 算法 开发者
特征生成(特征创建)
特征生成(特征创建)
|
机器学习/深度学习 存储 缓存
【34】文本文档分类实战(哈希编码/权重编码提取特征 + 卡方过滤 + 搭建神经网络分类)
【34】文本文档分类实战(哈希编码/权重编码提取特征 + 卡方过滤 + 搭建神经网络分类)
200 0
【34】文本文档分类实战(哈希编码/权重编码提取特征 + 卡方过滤 + 搭建神经网络分类)
|
算法 数据挖掘 API
AutoML | AutoSklearn的基本分类、回归、多输出回归和多标签分类数据集的使用示例
AutoML | AutoSklearn的基本分类、回归、多输出回归和多标签分类数据集的使用示例
220 0
AutoML | AutoSklearn的基本分类、回归、多输出回归和多标签分类数据集的使用示例

热门文章

最新文章