【保姆级教程】【YOLOv8替换主干网络】【1】使用efficientViT替换YOLOV8主干网络结构（1）-阿里云开发者社区

【保姆级教程】【YOLOv8替换主干网络】【1】使用efficientViT替换YOLOV8主干网络结构（1）

2024-06-13 277

版权

本文内容由阿里云实名注册用户自发贡献，版权归原作者所有，阿里云开发者社区不拥有其著作权，亦不承担相应法律责任。具体规则请查看《阿里云开发者社区用户服务协议》和《阿里云开发者社区知识产权保护指引》。如果您发现本社区中有涉嫌抄袭的内容，填写侵权投诉表单进行举报，一经查实，本社区将立刻删除涉嫌侵权内容。

简介： 【保姆级教程】【YOLOv8替换主干网络】【1】使用efficientViT替换YOLOV8主干网络结构

1. efficientViT简介

论文发表时间：2023.09.27

github地址：https://github.com/mit-han-lab/efficientvit

paper地址：https://arxiv.org/abs/2205.14756

摘要：高分辨率密集预测技术能够实现许多吸引人的实际应用，比如计算摄影、自动驾驶等。然而，巨大的计算成本使得在硬件设备上部署最先进的高分辨率密集预测模型变得困难。本研究提出了EfficientViT，一种新的高分辨率视觉模型家族，具有新颖的多尺度线性注意机制。与先前依赖于重型softmax注意力、硬件效率低下的大卷积核卷积或复杂的拓扑结构来获得良好性能的高分辨率密集预测模型不同，我们的多尺度线性注意力通过轻量级而且硬件高效的操作实现了全局感受野和多尺度学习（这对高分辨率密集预测是两个理想的特性）。因此，EfficientViT在各种硬件平台上实现了显著的性能提升，并且具有显著的加速能力，包括移动CPU、边缘GPU等。

论文亮点如下:

• 我们引入了一种新的多尺度线性注意力模块，用于高效的高分辨率密集预测。它在保持硬件效率的同时实现了全局感知域和多尺度学习。据我们所知，我们的工作是首次展示线性注意力对于高分辨率密集预测的有效性。

• 我们基于提出的多尺度线性注意力模块设计了一种新型的高分辨率视觉模型——EfficientViT。

• 我们的模型在语义分割、超分辨率、任意分割和ImageNet分类等各种硬件平台（移动CPU、边缘GPU和云GPU）上相对于先前的SOTA模型展现出了显著的加速效果。

1.1 efficientViT网络结构

1.2 性能对比

2.使用efficientViT替换YOLOV8主干网络结构

首先，在yolov8官网下载代码并解压，地址如下：

https://github.com/ultralytics/ultralytics

解压后，如下图所示：

【保姆级教程】【YOLOv8替换主干网络】【1】使用efficientViT替换YOLOV8主干网络结构（2）https://developer.aliyun.com/article/1536651

【保姆级教程】【YOLOv8替换主干网络】【1】使用efficientViT替换YOLOV8主干网络结构（1）

1. efficientViT简介

1.1 efficientViT网络结构

1.2 性能对比

2.使用efficientViT替换YOLOV8主干网络结构

热门文章

最新文章

相关课程

相关电子书

相关实验场景

热门

活动广场

任务中心

开发者评测

高校计划

乘风者计划

训练营

阿里云MVP

话题

直播

下载

镜像站

技术资料

插件

【保姆级教程】【YOLOv8替换主干网络】【1】使用efficientViT替换YOLOV8主干网络结构（1）

1. efficientViT简介

1.1 efficientViT网络结构

1.2 性能对比

2.使用efficientViT替换YOLOV8主干网络结构

热门文章

最新文章

相关课程

相关电子书

相关实验场景