【APFN】从大佬论文中探索如何分析改进金字塔网络

简介: 【APFN】从大佬论文中探索如何分析改进金字塔网络

前言

  在计算机视觉领域,金字塔网络是一种经典而有效的图像处理方法,旨在实现多尺度的特征提取图像分析。通过构建不同尺度的图像金字塔,金字塔网络能够从粗糙到精细地分析图像内容,为许多视觉任务提供了强大的基础。然而,随着深度学习技术的快速发展,人们开始关注如何改进金字塔网络以更好地适应现代计算机视觉任务的挑战。

基础回顾

什么是特征金字塔:

  特征金字塔(Feature Pyramid)是一种计算机视觉中常用的图像处理技术,旨在提取不同尺度下的图像特征。它广泛应用于目标检测、语义分割和图像识别等任务中,以有效地捕捉图像中不同尺度上的语义信息。

image.png

  在提取图像特征时,如果只使用单一尺度,会导致对物体大小的不确定性,从而丢失一些细节信息。为了解决这个问题,目标检测模型通常采用特征金字塔架构。其中,最常用的特征金字塔架构是FPN(特征金字塔网络),通过使用FPN,无论是单级还是两级的检测器都能够得到更好的检测结果。

  在FPN的基础上,有一种改进的特征金字塔网络叫做PAFPN(金字塔自底向上特征网络)。PAFPN在特征金字塔网络中增加了一条自下而上的路径,这样就可以弥补FPN中高层特征缺乏底层特征细节的不足。也就是说,PAFPN能够更好地结合不同尺度的特征信息,使得目标检测模型在各个层次上都能获取到准确的细节特征,从而提高检测的效果。

渐近特征金字塔网络

启发思路:

  现有的特征金字塔网络通常是将骨干网络生成的高级特征上采样到低级特征上。受HRNet网络架构的启发,我们提出了一个渐进特征金字塔网络(AFPN)来解决上述限制。在主干自底向上的特征提取过程中,我们在第一阶段通过结合两个不同分辨率的低级特征来启动融合过程。随着我们进入后期阶段,我们逐渐将高级特征纳入融合过程,最终融合主干的顶级特征,这种融合方式可以避免非相邻层之间存在较大的语义差距。

设计思路:

  在此过程中,低级特征与高级特征的语义信息融合,高级特征与低级特征的细节信息融合。由于它们之间的直接相互作用,避免了多级传输过程中信息的丢失或退化。在整个特征融合过程中,由于层次之间的某一位置可能存在不同对象的矛盾,元素求和并不是一种有效的方法。为了解决这一问题,我们利用自适应空间融合运算对多层次融合过程中的特征进行过滤。这使我们能够保留有用的信息进行融合。

结构

  渐近特征金字塔网络(AFPN)的体系结构。在初始阶段,AFPN融合了两个低级特征。这个后续阶段融合更高层次的特征,而最后阶段在特征融合过程中添加顶级特征。缺少箭头表示卷积,海蓝宝线箭头代表自适应空间融合。

image.png

实验结果

  根据表1的数据,当输入图像尺寸为640 × 640时,我们的方法表现出很好的性能,平均精度(AP)达到了39.0%,甚至比一些分辨率更高的模型还要好。与FPN和PAFPN相比,我们的AFPN在val2017数据集上的AP分别提高了1.6%和0.9%,在其他指标上也超过了它们。需要注意的是,由于NASFPN是在RetinaNet框架上进行搜索的,它在Faster R-CNN框架上的表现并不是很出色。相比之下,我们的AFPN在AP方面比NASFPN高出了1.3%。另外,当输入图像尺寸为800 × 1000时,我们的AFPN实现了41.0%的AP,超过了其他方法的性能。

image.png


  在我们的研究中,我们评估了两种不同的检测器:Faster R-CNN和Dynamic R-CNN,并通过实验结果表三进行了比较。可以得到相对于FPN,我们的AFPN更适合用于高精度定位的场景。

image.png


  在yoloV5中实验,结果如下:与原始的版本颈部相比,改进(AFPN)在检测性能方面有显著提高,尤其是在检测大型物体,在AP,APS,APM和APL指标上保持领先地位。

image.png

结语

  从大佬们的顶刊文章中探索到特征金字塔的改进方向,这也为日后的研究指明了方向打下了基础。希望本篇探索对诸君有帮助。


相关文章
|
15天前
|
数据采集 缓存 定位技术
网络延迟对Python爬虫速度的影响分析
网络延迟对Python爬虫速度的影响分析
|
1月前
|
机器学习/深度学习 人工智能
类人神经网络再进一步!DeepMind最新50页论文提出AligNet框架:用层次化视觉概念对齐人类
【10月更文挑战第18天】这篇论文提出了一种名为AligNet的框架,旨在通过将人类知识注入神经网络来解决其与人类认知的不匹配问题。AligNet通过训练教师模型模仿人类判断,并将人类化的结构和知识转移至预训练的视觉模型中,从而提高模型在多种任务上的泛化能力和稳健性。实验结果表明,人类对齐的模型在相似性任务和出分布情况下表现更佳。
60 3
|
16天前
|
存储 安全 网络安全
网络安全法律框架:全球视角下的合规性分析
网络安全法律框架:全球视角下的合规性分析
29 1
|
1月前
|
机器学习/深度学习 Web App开发 人工智能
轻量级网络论文精度笔(一):《Micro-YOLO: Exploring Efficient Methods to Compress CNN based Object Detection Model》
《Micro-YOLO: Exploring Efficient Methods to Compress CNN based Object Detection Model》这篇论文提出了一种基于YOLOv3-Tiny的轻量级目标检测模型Micro-YOLO,通过渐进式通道剪枝和轻量级卷积层,显著减少了参数数量和计算成本,同时保持了较高的检测性能。
35 2
轻量级网络论文精度笔(一):《Micro-YOLO: Exploring Efficient Methods to Compress CNN based Object Detection Model》
|
1月前
|
机器学习/深度学习 编解码 算法
轻量级网络论文精度笔记(三):《Searching for MobileNetV3》
MobileNetV3是谷歌为移动设备优化的神经网络模型,通过神经架构搜索和新设计计算块提升效率和精度。它引入了h-swish激活函数和高效的分割解码器LR-ASPP,实现了移动端分类、检测和分割的最新SOTA成果。大模型在ImageNet分类上比MobileNetV2更准确,延迟降低20%;小模型准确度提升,延迟相当。
60 1
轻量级网络论文精度笔记(三):《Searching for MobileNetV3》
|
25天前
|
网络协议 安全 算法
网络空间安全之一个WH的超前沿全栈技术深入学习之路(9):WireShark 简介和抓包原理及实战过程一条龙全线分析——就怕你学成黑客啦!
实战:WireShark 抓包及快速定位数据包技巧、使用 WireShark 对常用协议抓包并分析原理 、WireShark 抓包解决服务器被黑上不了网等具体操作详解步骤;精典图示举例说明、注意点及常见报错问题所对应的解决方法IKUN和I原们你这要是学不会我直接退出江湖;好吧!!!
网络空间安全之一个WH的超前沿全栈技术深入学习之路(9):WireShark 简介和抓包原理及实战过程一条龙全线分析——就怕你学成黑客啦!
|
1月前
|
编解码 人工智能 文件存储
轻量级网络论文精度笔记(二):《YOLOv7: Trainable bag-of-freebies sets new state-of-the-art for real-time object ..》
YOLOv7是一种新的实时目标检测器,通过引入可训练的免费技术包和优化的网络架构,显著提高了检测精度,同时减少了参数和计算量。该研究还提出了新的模型重参数化和标签分配策略,有效提升了模型性能。实验结果显示,YOLOv7在速度和准确性上超越了其他目标检测器。
48 0
轻量级网络论文精度笔记(二):《YOLOv7: Trainable bag-of-freebies sets new state-of-the-art for real-time object ..》
|
25天前
|
网络协议 安全 算法
网络空间安全之一个WH的超前沿全栈技术深入学习之路(9-2):WireShark 简介和抓包原理及实战过程一条龙全线分析——就怕你学成黑客啦!
实战:WireShark 抓包及快速定位数据包技巧、使用 WireShark 对常用协议抓包并分析原理 、WireShark 抓包解决服务器被黑上不了网等具体操作详解步骤;精典图示举例说明、注意点及常见报错问题所对应的解决方法IKUN和I原们你这要是学不会我直接退出江湖;好吧!!!
|
1月前
|
安全 网络协议 物联网
物联网僵尸网络和 DDoS 攻击的 CERT 分析
物联网僵尸网络和 DDoS 攻击的 CERT 分析
|
1月前
|
存储 算法 数据可视化
单细胞分析 | Cicero+Signac 寻找顺式共可及网络
单细胞分析 | Cicero+Signac 寻找顺式共可及网络
26 0
下一篇
无影云桌面