【保姆级教程|YOLOv8改进】【5】精度与速度双提升，使用FasterNet替换主干网络-阿里云开发者社区

【保姆级教程|YOLOv8改进】【5】精度与速度双提升，使用FasterNet替换主干网络

2024-06-13 1708

版权

本文内容由阿里云实名注册用户自发贡献，版权归原作者所有，阿里云开发者社区不拥有其著作权，亦不承担相应法律责任。具体规则请查看《阿里云开发者社区用户服务协议》和《阿里云开发者社区知识产权保护指引》。如果您发现本社区中有涉嫌抄袭的内容，填写侵权投诉表单进行举报，一经查实，本社区将立刻删除涉嫌侵权内容。

简介： 【保姆级教程|YOLOv8改进】【5】精度与速度双提升，使用FasterNet替换主干网络

1.FasterNet简介

摘要：为了设计快速的神经网络，许多研究工作一直专注于减少浮点运算（FLOPs）的数量。然而，我们观察到，FLOPs的这种减少，并不一定导致相似水平的延迟降低。这主要是由于低效的每秒浮点运算数（FLOPS）造成的。为了实现更快的网络，我们重审了流行的运算符，并演示了这种低FLOPS主要是由于运算符的频繁内存访问，特别是深度卷积。因此，我们提出了一种新颖的局部卷积（PConv），它通过削减冗余计算和内存访问，更高效地提取空间特征。在我们的PConv上，我们进一步提出了FasterNet，一个新的神经网络家族，它在广泛的设备上实现了比其他网络更高的运行速度，同时在各种视觉任务上的精度不打折扣。例如，在ImageNet-1k上，我们的小型FasterNet-T0在GPU、CPU和ARM处理器上分别比MobileViT-XXS快3.1倍、3.1倍和2.5倍，同时精度提高了2.9%。我们的大型FasterNet-L取得了令人印象深刻的83.5%的top-1精度，与新兴的Swin-B不相上下，同时在GPU上的推理吞吐量提高了49%，以及在CPU上节省了42%的计算时间。

论文主要亮点如下：

• 强调了为了实现更快的神经网络，提升每秒浮点运算数（FLOPS）的重要性，而不仅仅是减少FLOPs。

• 引入了一个简单但快速且有效的运算符，称为PConv，它具有很高的潜力来替代现有的首选选项，即深度卷积（DWConv）。

• 介绍了FasterNet，它在GPU、CPU和ARM处理器等各种设备上都能流畅且普遍地快速运行。

• 在各种任务上进行了广泛的实验，并验证了我们的PConv和FasterNet的高速度和有效性。

1.1 网络结构

1.2 性能对比

2.YOLOv8替换主干步骤

YOLOv8网络结构前后对比

定义FasterNet相关类

在ultralytics/nn/modules/block.py中添加如下代码块，为FasterNet源码：

并在ultralytics/nn/modules/block.py中最上方添加如下代码：

修改指定文件

在ultralytics/nn/modules/__init__.py文件中的添加如下代码:

在 ultralytics/nn/tasks.py 上方导入相应类名,并在parse_model解析函数中添加如下代码：

elif m in [BasicStage]:
                args.pop(1)

在 ultralytics/nn/tasks.py 中搜索self.model.modules()，定位到如下代码，并且在下方添加如下方框中的代码内容：

在ultralytics/cfg/models/v8文件夹下新建yolov8-FasterNet.yaml文件，内容如下：

# Ultralytics YOLO 🚀, AGPL-3.0 license
# YOLOv8 object detection model with P3-P5 outputs. For Usage examples see https://docs.ultralytics.com/tasks/detect
# Parameters
nc: 80  # number of classes
scales: # model compound scaling constants, i.e. 'model=yolov8n.yaml' will call yolov8.yaml with scale 'n'
  # [depth, width, max_channels]
  n: [0.33, 0.25, 1024]  # YOLOv8n summary: 225 layers,  3157200 parameters,  3157184 gradients,   8.9 GFLOPs
  s: [0.33, 0.50, 1024]  # YOLOv8s summary: 225 layers, 11166560 parameters, 11166544 gradients,  28.8 GFLOPs
  m: [0.67, 0.75, 768]   # YOLOv8m summary: 295 layers, 25902640 parameters, 25902624 gradients,  79.3 GFLOPs
  l: [1.00, 1.00, 512]   # YOLOv8l summary: 365 layers, 43691520 parameters, 43691504 gradients, 165.7 GFLOPs
  x: [1.00, 1.25, 512]   # YOLOv8x summary: 365 layers, 68229648 parameters, 68229632 gradients, 258.5 GFLOPs
# YOLOv8.0n backbone
backbone:
  # [from, repeats, module, args]
  - [-1, 1, PatchEmbed_FasterNet, [40, 4, 4]]  # 0-P1/4
  - [-1, 1, BasicStage, [40, 1]]  # 1
  - [-1, 1, PatchMerging_FasterNet, [80, 2, 2]]  # 2-P2/8
  - [-1, 2, BasicStage, [80, 1]]  # 3-P3/16
  - [-1, 1, PatchMerging_FasterNet, [160, 2, 2]]  # 4
  - [-1, 8, BasicStage, [160, 1]]  # 5-P4/32
  - [-1, 1, PatchMerging_FasterNet, [320, 2, 2]] # 6
  - [-1, 2, BasicStage, [320, 1]] # 7
  - [-1, 1, SPPF, [320, 5]]  # 8
# YOLOv8.0n head
head:
  - [-1, 1, nn.Upsample, [None, 2, 'nearest']]
  - [[-1, 5], 1, Concat, [1]]  # cat backbone P4
  - [-1, 1, C2f, [512]]  # 11
  - [-1, 1, nn.Upsample, [None, 2, 'nearest']]
  - [[-1, 3], 1, Concat, [1]]  # cat backbone P3
  - [-1, 1, C2f, [256]]  # 14 (P3/8-small)
  - [-1, 1, Conv, [256, 3, 2]]
  - [[-1, 11], 1, Concat, [1]]  # cat head P4
  - [-1, 1, C2f, [512]]  # 17 (P4/16-medium)
  - [-1, 1, Conv, [512, 3, 2]]
  - [[-1, 8], 1, Concat, [1]]  # cat head P5
  - [-1, 1, C2f, [1024]]  # 20 (P5/32-large)
  - [[14, 17, 20], 1, Detect, [nc]]  # Detect(P3, P4, P5)

3.加载配置文件并训练

加载yolov8-BiLevelRoutingAttention.yaml配置文件，并运行train.py训练代码:

#coding:utf-8
from ultralytics import YOLO
if __name__ == '__main__':
    model = YOLO('ultralytics/cfg/models/v8/yolov8-FasterNet.yaml')
    model.load('yolov8n.pt') # loading pretrain weights
    model.train(data='datasets/TomatoData/data.yaml', epochs=30, batch=4)

注意观察，打印出的网络结构是否正常修改，如下图所示：

4.模型推理

模型训练完成后，我们使用训练好的模型对图片进行检测：

#coding:utf-8
from ultralytics import YOLO
import cv2
# 所需加载的模型目录
# path = 'models/best2.pt'
path = 'runs/detect/train/weights/best.pt'
# 需要检测的图片地址
img_path = "TestFiles/Riped tomato_8.jpeg"
# 加载预训练模型
# conf  0.25  object confidence threshold for detection
# iou 0.7 intersection over union (IoU) threshold for NMS
model = YOLO(path, task='detect')
# 检测图片
results = model(img_path)
res = results[0].plot()
# res = cv2.resize(res,dsize=None,fx=2,fy=2,interpolation=cv2.INTER_LINEAR)
cv2.imshow("YOLOv8 Detection", res)
cv2.waitKey(0)

【保姆级教程|YOLOv8改进】【5】精度与速度双提升，使用FasterNet替换主干网络

1.FasterNet简介

1.1 网络结构

1.2 性能对比

2.YOLOv8替换主干步骤

YOLOv8网络结构前后对比

定义FasterNet相关类

修改指定文件

3.加载配置文件并训练

4.模型推理

热门文章

最新文章

相关课程

相关电子书

相关实验场景

探索云世界

热门

云计算

大数据

云原生

人工智能

数据库

开发与运维

活动广场

任务中心

训练营

直播

乘风者计划

下载

镜像站

技术资料

【保姆级教程|YOLOv8改进】【5】精度与速度双提升，使用FasterNet替换主干网络

1.FasterNet简介

1.1 网络结构

1.2 性能对比

2.YOLOv8替换主干步骤

YOLOv8网络结构前后对比

定义FasterNet相关类

修改指定文件

3.加载配置文件并训练

4.模型推理

热门文章

最新文章

相关课程

相关电子书

相关实验场景