一、本文介绍
本文记录的是利用自适应阈值焦点损失(ATFL)优化YOLOv11目标检测的网络模型。ATFL
结合了阈值解耦的针对性和自适应调整损失权重的灵活性,有效地处理目标与背景不平衡问题。这一机制通过设置阈值区分目标和背景样本,并根据预测概率值自适应调整损失权重来适应不同的样本特性,提高了模型对目标特征的学习能力。在小目标检测中,ATFL
可以被用于提升对小目标的检测能力,特别是在目标和背景极度不平衡的情况下。
专栏目录:YOLOv11改进目录一览 | 涉及卷积层、轻量化、注意力、损失函数、Backbone、SPPF、Neck、检测头等全方位改进
专栏地址:YOLOv11改进专栏——以发表论文的角度,快速准确的找到有效涨点的创新点!
二、自适应阈值焦点损失原理
自适应阈值焦点损失(ATFL)
是一种用于解决红外小目标检测中目标与背景不平衡问题的创新方法。以下将从其设计出发点、原理、结构和优势进行详细介绍,并结合文中相关图示辅助说明。
2.1 设计出发点
在红外图像中,目标所占比例极小,背景占据主导,这使得模型在训练过程中更容易学习到背景特征,而忽略目标特征。传统的损失函数无法有效解决这种样本不平衡问题,因此需要一种新的损失函数来促使模型更加关注目标特征。
2.2 原理
- 基于阈值的解耦:通过设置阈值将易于识别的背景和难以识别的目标分离开。
例如,将预测概率值高于0.5的样本视为背景(容易样本),低于0.5的视为目标(困难样本)。
- 损失权重的调整:对不同类型的样本调整其损失权重。对于目标样本,增强其损失,使模型更加关注目标特征;对于背景样本,减轻其损失。
- 自适应机制:为了减少调整超参数带来的时间消耗,对超参数进行自适应设计。
例如,根据预测概率值和模型训练进度来动态调整焦点损失函数中的调制因子 γ 等参数。
2.3 结构
2.3.1 基础损失函数
从经典的交叉熵损失函数
出发,其表达式为$\mathcal{L}_{BCE}=-(y log (p)+(1-y) log (1-p))$(其中$P$代表预测概率,$y$代表真实标签),也可简记为:$$\mathcal{L}_{BCE}=-log \left(p_{t}\right)$$其中$$p_{t}= \begin{cases}p, & if y=1 \\ 1-p, & others \end{cases}$$
2.3.2 焦点损失函数改进
焦点损失函数$F L\left(p{t}\right)=-\left(1-p{t}\right)^{\gamma} log \left(p{t}\right)$通过引入调制因子$(1-p{t})^{\gamma}$来降低易分类样本的损失贡献,但在降低易样本损失的同时也会降低困难样本损失,不利于困难样本学习。
2.3.3 阈值焦点损失(TFL)函数
为解决上述问题,提出$$T F L=\left\{\begin{array}{ll} -\left(\lambda-p_{t}\right)^{\eta} log \left(p_{t}\right) & p_{t}<=0.5 \\ -\left(1-p_{t}\right)^{\gamma} log \left(p_{t}\right) & p_{t}>0.5 \end{array}\right.$$其中$\lambda(>1)$为超参数,对于不同数据集和模型需多次调整。
2.3.4 自适应阈值焦点损失(ATFL)函数
对$\gamma$和$\eta$进行自适应调整。$$\gamma=-ln \left(\hat{p}_{c}\right)$$(其中$\hat{p}{c}=0.05 × \frac{1}{t-1} \sum{i=0}^{t-1} \overline{p{i}}+0.95 × p{t}$),$\eta=-ln \left(p_{t}\right)$,最终得到:$$A T F L= \begin{cases}-\left(\lambda-p_{t}\right)^{-ln \left(p_{t}\right)} log \left(p_{t}\right) & p_{t}<=0.5 \\ -\left(1-p_{t}\right)^{-ln \left(\hat{p}_{c}\right)} log \left(p_{t}\right) & p_{t}>0.5\end{cases}$$
2.4 优势
- 缓解不平衡问题:对于容易样本,随着$p_{t}$增加,损失值会按照设计要求降低,进一步减少了容易样本产生的损失,从而有效缓解了目标与背景的不平衡,使模型能够更好地学习目标特征。
- 自适应调整:自适应机制避免了多次手动调整超参数,节省了时间成本,同时能够根据数据集和模型训练情况自动调整参数,提高了模型的性能和泛化能力。
- 提升困难样本学习:通过增加困难样本(目标)的损失权重,使模型更加关注难以检测的目标,提高了对红外小目标的检测性能。
论文:https://arxiv.org/abs/2307.14723
源码:https://github.com/YangBo0411/infrared-small-target
三、实现代码及YOLOv11修改步骤
模块完整介绍、个人总结、实现代码、模块改进、二次创新以及各模型添加步骤参考如下地址: