图像分类_03分类器及损失:线性分类+ SVM损失+Softmax 分类+交叉熵损失

简介: 解释:w的每⼀⾏都是其中⼀个类的分类器。这些数字的⼏何解释是,当我们改变w的⼀行时,像素空间中相应的线将以不同的⽅向旋转。⽽其中的偏置是为了让我们避免所有的分类器都过原点。

815902569f6a467a99304f9ac1482386.png


2.3.1 线性分类


92279349a51e4f90afeae2a8da597d6b.png


2.3.1.1 线性分类解释


95124fa719554aae9b1803121d68c57f.png


上图图中的权重计算结果结果并不好,权重会给我们的猫图像分配⼀个⾮常低的猫分数。得出的结果偏向于狗。


如果可视化分类,我们为了⽅便,将⼀个图⽚理解成⼀个⼆维的点,在下⾯坐标中显示如下:



d2378efea8a44bed9a204c07bd93fb48.png


  • 解释:w的每⼀⾏都是其中⼀个类的分类器。这些数字的⼏何解释是,当我们改变w的⼀行时,像素空间中相应的线将以不同的⽅向旋转。⽽其中的偏置是为了让我们避免所有的分类器都过原点。


  • 总结:分类器的权重矩阵其实是对应分类的经过训练得到的⼀个分类模板,通过测试数据与分类模板间的数据计算来进⾏分类。在训练的过程中,其实可以看作是权重矩阵的学习过程,也可以看成是分类模板的学习过程,如何从训练样本中学习分类的模板。模板权重的⼤⼩,反映了样本中每个像素点对分类的贡献率。


学习到的权重


db31fe90d27346f7b3750326d3067563.png


2.3.2 损失函数


损失函数是⽤来告诉我们当前分类器性能好坏的评价函数,是⽤于指导分类器权重调整的指导性函数,通过该函数可以知道该如何改进权重系数。CV与深度学习课程之前,⼤家应该都接触过⼀些损失函数了,例如解决⼆分类问题的逻辑回归中⽤到的对数似然损失、SVM中的合⻚损失等等。


对数似然损失


88aee9d1a9d74f66b67094d0283fdd05.png


合⻚损失


e699b9706df54af885a4782b99e52262.png


现在回到前⾯的线性分类例⼦,该函数预测在“猫”、“狗”和“船”类中的分数,我们发现,在这个例⼦中,我们输⼊描绘猫的像素,但是猫的分数与其他类别(狗的分数437.9和船的分数61.95)相⽐⾮常低(-96.8)。那么这个结果并不好,我们将会去衡量这样的⼀个成本,如果分类做好了,这个损失将会减少。


多分类问题的损失该如何去衡量?下⾯会进⾏通常会使⽤的两种⽅式作对⽐,这⾥介绍在图像识别中最常⽤的两个损失——多类别SVM损失(合⻚损失hinge loss)和交叉熵损失,分别对应多类别SVM分类器和Softmax分类器


2.3.2.1 多分类SVM损失


337f476876cc453f8518e7888f7e35ad.png


我们正针对于前⾯简化例⼦,来复习理解下SVM损失,下图使我们得到的线性模型预测分数结果


1c307a3098e349e69b39869b1dc64475.png

573cd616beb740b28eb17681f6bf3658.png


573cd616beb740b28eb17681f6bf3658.png

987220a1936545cc95a1a2656db6c1f4.png


15bbcb3bcbea4748afff142eec506baf.png


2.2.2.2 Softmax 分类(Multinomial Logistic Regression)与cross-entropy(交叉熵损失)


1、Softmax


3bca560e75aa4acabb98fc6eb2291526.png

b0ce8349df7c47ddadbe5c84943a1be5.png


2、cross-entropy



43a7a3ddd42a403da0acf4aa950338c1.png

ae94fa5abacf422f8e2971a3ad74872c.png


20200506212804906.png


2.3.3 SVM与Softmax对比


下面这张图就清楚的展示了两个分类以及其损失计算方式的区别


da54e8b07a2e4b1ba0d97939edf13389.png


714bdc03605848ac99f4d2988b1ac011.png

175a71e750774577ac128f4384fb454c.png

目录
相关文章
|
3月前
|
机器学习/深度学习 人工智能 自动驾驶
斑马线目标检测数据集(1000 张图片已划分、已标注)| AI训练适用于目标检测任务
本数据集含1000张真实道路图像(700训练/200验证/100测试),专注单类别“斑马线”目标检测,覆盖多场景、多视角、多光照及复杂干扰条件,标注规范(YOLO格式),兼容主流检测框架,适用于自动驾驶、ADAS、智慧交通等AI视觉任务。
|
机器学习/深度学习 人工智能 安全
通义千问开源的QwQ模型,一个会思考的AI,阿里云百炼邀您第一时间体验
Qwen团队推出新成员QwQ-32B-Preview,专注于增强AI推理能力。通过深入探索和试验,该模型在数学和编程领域展现了卓越的理解力,但仍在学习和完善中。目前,QwQ-32B-Preview已上线阿里云百炼平台,提供免费体验。
5007 0
|
人工智能 测试技术
语言图像模型大一统!Meta将Transformer和Diffusion融合,多模态AI王者登场
【9月更文挑战第20天】Meta研究人员提出了一种名为Transfusion的创新方法,通过融合Transformer和Diffusion模型,实现了能同时处理文本和图像数据的多模态模型。此模型结合了语言模型的预测能力和Diffusion模型的生成能力,能够在单一架构中处理混合模态数据,有效学习文本与图像间的复杂关系,提升跨模态理解和生成效果。经过大规模预训练,Transfusion模型在多种基准测试中表现出色,尤其在图像压缩和模态特定编码方面具有优势。然而,其训练所需的大量计算资源和数据、以及潜在的伦理和隐私问题仍需关注。
475 8
|
机器学习/深度学习 存储 算法
Transformer、RNN和SSM的相似性探究:揭示看似不相关的LLM架构之间的联系
通过探索大语言模型(LLM)架构之间的潜在联系,我们可能开辟新途径,促进不同模型间的知识交流并提高整体效率。尽管Transformer仍是主流,但Mamba等线性循环神经网络(RNN)和状态空间模型(SSM)展现出巨大潜力。近期研究揭示了Transformer、RNN、SSM和矩阵混合器之间的深层联系,为跨架构的思想迁移提供了可能。本文深入探讨了这些架构间的相似性和差异,包括Transformer与RNN的关系、状态空间模型在自注意力机制中的隐含作用以及Mamba在特定条件下的重写方式。
892 7
Transformer、RNN和SSM的相似性探究:揭示看似不相关的LLM架构之间的联系
|
机器学习/深度学习 传感器 算法
OpenCV4工业缺陷检测的六种方法
OpenCV4工业缺陷检测的六种方法
|
机器学习/深度学习 算法
常见的分类算法介绍
常见的分类算法介绍
|
机器学习/深度学习 算法 异构计算
yolov7训练自己的数据集(pycharm上训练测试)
yolov7训练自己的数据集(pycharm上训练测试)
|
安全 Ubuntu Linux
Linux :远程访问的 16 个最佳工具(一)
Linux :远程访问的 16 个最佳工具(一)
1241 1
|
算法 数据可视化 计算机视觉
opencv Canny边缘检测(python)
opencv Canny边缘检测(python)