目标检测基础(一)

本文涉及的产品
RDS DuckDB + QuickBI 企业套餐,8核32GB + QuickBI 专业版
简介: 目标检测基础(一)

开发者学习笔记【阿里云人工智能工程师ACA认证(2023版):目标检测基础(一)

课程地址:https://edu.aliyun.com/course/3112108/lesson/19275

 

目标检测基础(一)

 

内容介绍

一、 目标检测的定义

二、 目标检测的评估指标

三、 目标检测遇到的挑战

四、目标检测的常用数据集与网络

五、目标检测的典型应用

 

提问:

图片574.png

在了解目标测之前,我们来看一下这个图。图中有一只猫。现在让我们思考一个问题,不仅要识别这张图片中的猫,还要确定这只猫在图中的具体位置,也就是它在图片中的哪个区域。这可以通过目标检测技术来实现,即框出猫的位置并标出坐标。

 

一、目标检测的定义


图片575.png

目标检测是一种识别图像中存在哪些物体并确定它们的类别以及它们在图像中的位置的任务。人们很容易理解图中的眼镜的位置,这支笔的位置。我们希望计算机视觉也能做到这一点。

具体来说,目标检测的任务是给定一张图片,然后在图像中找到可能的目标,识别它们,并确定它们的位置。不仅要识别出目标,还要知道它们的具体位置,即用框标出它们的位置。这就是目标检测要完成的任务。


目标检测也被称为对象检测,它是计算机视觉领域的一个核心问题。由于物体具有不同的外观、形状、姿态以及可能受到光照和遮挡的影响,目标检测是一个具有挑战性的问题。

现在,让我们来看一下图像分类和目标检测之间的区别。图像分类只需要将图像分到一个类别中,因此它只会给出一个单一的标签,指示图像属于哪个类别。

图像分类的核心是从给定的集合中给图像分配一个标签。

图像分类读取该图片;


生成该图片属于集合{dog,cat,hat,mouse}中各个标签的概率。

这对于像识别猫这样的任务相对简单。然而,目标检测更为复杂,因为它需要识别图像中的目标,可能是一个或多个,并且需要找到它们在图像中的具体位置,然后用边界框标记出来。这两者之间的差异很大。

图片576.png

 

二、目标检测的评估指标


图片577.png

在目标检测中,最重要的评估指标之一是交并比(IoU),类似于分类任务中的分类准确率。在目标检测中,我们不能仅简单地说一个检测是正确的还是错误的,因此我们使用交并比来评估目标检测性能。在训练过程中,我们会有真实的边界框,这是在训练集中人工标注的真实位置。然后,在模型训练完成后,使用该模型进行预测,得到预测的边界框。如果这两个边界框重叠得很好,那么IoU得分很高,这表示模型性能好。IoU的最大值是1,表示完美匹配。

屏幕截图 2023-09-19 223900.png

精确度表示目标检测模型正确判断图像为正类别的概率,而召回率表示模型能够正确检测出所有正类别的能力。正类别通常用"P"表示,负类别用"N"表示。混淆矩阵用来表示模型的分类结果,包括真正例(TP)、假正例(FP)、真负例(TN)和假负例(FN)。

图片578.png

精确度衡量了模型在标记为正类别的图像中正确预测的比例,而召回率衡量了模型正确检测出的正类别图像占所有正类别图像的比例。


这些指标一起帮助我们评估目标检测模型的性能,特别是在处理正负样本不平衡的情况下。

无论你判断对还是判断错,TP加FN代表所有的正类别。TP表示你正确地找回来的。Recall的数值与精确度类似,介于0到1之间。数值越高,表示你找出所有正类别的能力更强。

图片579.png

此外,还有一个重要的目标检测评估指标,即平均精度值(mAP)。mAP,mean Average Precision即各类别平均精度均值针对每个类别的精度值(P)都被平均,并计算出所有类别的平均AP。每一个类别都可以根据Recall和Precision绘制一条曲线,那么AP就是该曲线下的面积,而mAP则是多个类别AP的平均信,这个值介于0到1之间。mAP是目标检测算法里最重要的一个评估指标。这个值反映了整体的目标检测性能,因为不同类别可能有不同的精度值。这些指标有助于全面评估目标检测模型的性能。

相关文章
|
SQL 关系型数据库 MySQL
gin框架学习-Gorm入门指南
Snake Case命名风格,就是各个单词之间用下划线(_)分隔,首字母大写区分一个单词,例如: CreateTime的Snake Case风格命名为create_time
957 0
gin框架学习-Gorm入门指南
|
1月前
|
机器学习/深度学习 人工智能 算法
公路表面裂缝目标检测数据集(1500 张图片已划分、已标注)| AI训练适用于目标检测任务
本数据集含1500张真实道路图像,已划分train/val/test并精准标注裂缝(crack)边界框,覆盖沥青/水泥路面、多光照与多角度场景,适配YOLO、RT-DETR等主流目标检测模型,专为道路病害智能巡检与小目标检测研究设计。
|
传感器 人工智能 自动驾驶
城市道路设施及道路安全隐患数据集(13000张图片已划分、已标注)| AI训练适用于目标检测任务
随着智慧城市与智能交通系统(ITS)的快速发展,城市道路的精细化管理成为基础设施建设中的关键课题。井盖缺失、井盖开启、路面坑洞、无标识减速带等问题,不仅影响道路通行质量,还可能引发交通事故。 在自动驾驶、智能巡检车、无人机道路巡检等应用场景中,对道路设施及安全隐患进行实时目标检测与识别,已成为核心技术模块之一。
|
12月前
|
SpringCloudAlibaba Java Nacos
尚硅谷SpringCloud教程 笔记
本文介绍了基于Spring Cloud Alibaba构建的cloud-demo工程创建步骤,包括父模块及子模块的配置。父模块采用pom打包方式,定义了Java 8、Spring Boot 2.4.2、Spring Cloud 2020.0.1及Spring Cloud Alibaba 2021.1版本。包含三个主要模块:services(依赖Nacos)、service-order和service-product(均依赖spring-boot-starter-web)。同时提供了discoveryClient的测试代码,展示服务发现功能的实现与验证过程。
718 12
尚硅谷SpringCloud教程 笔记
|
机器学习/深度学习 算法 PyTorch
DeepSeek 背后的技术:GRPO,基于群组采样的高效大语言模型强化学习训练方法详解
强化学习(RL)是提升大型语言模型(LLM)推理能力的重要手段,尤其在复杂推理任务中表现突出。DeepSeek团队通过群组相对策略优化(GRPO)方法,在DeepSeek-Math和DeepSeek-R1模型中取得了突破性成果,显著增强了数学推理和问题解决能力。GRPO无需价值网络,采用群组采样和相对优势估计,有效解决了传统RL应用于语言模型时的挑战,提升了训练效率和稳定性。实际应用中,DeepSeek-Math和DeepSeek-R1分别在数学推理和复杂推理任务中展现了卓越性能。未来研究将聚焦于改进优势估计、自适应超参数调整及理论分析,进一步拓展语言模型的能力边界。
2585 8
DeepSeek 背后的技术:GRPO,基于群组采样的高效大语言模型强化学习训练方法详解
|
机器学习/深度学习 监控 算法
傻傻分不清目标检测、语义分割和实例分割,看这篇就够了
傻傻分不清目标检测、语义分割和实例分割,看这篇就够了
4126 0
|
人工智能 安全 程序员
一文彻底搞清楚HarmonyOS元服务
本文介绍Harmony OS的元服务,这是一种轻量级应用程序形态,具备秒开直达、纯净清爽、服务相伴、即用即走等特性,支持多设备运行,提升服务获取效率。元服务开发流程包括创建项目、UI开发、真机调试、打包测试及上架发布。欢迎关注,一起成长!
4367 0
|
机器学习/深度学习 算法 固态存储
【目标检测】入门基础原理学一遍就够了吧
【目标检测】入门基础原理学一遍就够了吧
460 1
|
机器学习/深度学习 编解码 数据挖掘
实例分割综述总结综合整理版
实例分割综述总结综合整理版
1869 0
实例分割综述总结综合整理版
|
移动开发 JavaScript 前端开发
分享996个实用的JavaScript特效你要的全在这里
分享996个实用的JavaScript特效你要的全在这里
1849 0

热门文章

最新文章