文档备案控制台

开发者社区大数据文章正文

轻量化Backbone | 如何改进MobileViT-v1与MobileViT-v2？MobileViT-v3带你实验（二）

2023-05-25 395

版权

版权声明：

本文内容由阿里云实名注册用户自发贡献，版权归原作者所有，阿里云开发者社区不拥有其著作权，亦不承担相应法律责任。具体规则请查看《阿里云开发者社区用户服务协议》和《阿里云开发者社区知识产权保护指引》。如果您发现本社区中有涉嫌抄袭的内容，填写侵权投诉表单进行举报，一经查实，本社区将立刻删除涉嫌侵权内容。

简介： 轻量化Backbone | 如何改进MobileViT-v1与MobileViT-v2？MobileViT-v3带你实验（二）

3、实验

3.1、图像分类

3.2、目标检测

3.3、语义分割

3.4、可视化

4、参考

[1].MOBILEVITV3: MOBILE-FRIENDLY VISION TRANSFORMER WITH SIMPLE AND EFFECTIVE FUSION OF LOCAL, GLOBAL AND INPUT FEATURES.

5、推荐阅读

超轻目标检测 | 超越 NanoDet-Plus、YOLOv4-Tiny实时性、高精度都是你想要的！

必备技能 | YOLOv6中的用Channel-wise Distillation进行的量化感知训练来自哪里？

All are Worth Words | 当 ViT 遇到扩展模型会出现什么样子的火花？

文章标签：

计算机视觉

数据可视化

5i77ajz5u7ji6

目录

相关文章

蚝油菜花

|

机器学习/深度学习人工智能文字识别

POINTS 1.5：腾讯微信开源的多模态大模型，超越了业界其他的开源视觉语言模型，具备强大的视觉和语言处理能力

POINTS 1.5是腾讯微信推出的多模态大模型，基于LLaVA架构，具备强大的视觉和语言处理能力。它在复杂场景的OCR、推理能力、关键信息提取等方面表现出色，是全球10B以下开源模型中的佼佼者。

蚝油菜花

923 58 58

POINTS 1.5：腾讯微信开源的多模态大模型，超越了业界其他的开源视觉语言模型，具备强大的视觉和语言处理能力

YOLO创新改进大师

|

机器学习/深度学习计算机视觉知识图谱

【YOLOv8改进】MobileViT 更换主干网络：轻量级、通用且适合移动设备的视觉变压器 (论文笔记+引入代码)

MobileViT是针对移动设备的轻量级视觉Transformer网络，结合CNN的局部特征、Transformer的全局注意力和ViT的表示学习。在ImageNet-1k上，它以600万参数实现78.4%的top-1准确率，超越MobileNetv3和DeiT。MobileViT不仅适用于图像分类，还在目标检测等任务中表现出色，且优化简单，代码已开源。YOLOv8引入了MobileViT块，整合卷积和Transformer结构，提升模型性能。更多详情可参考相关专栏和链接。

YOLO创新改进大师

1320 1 1

蚝油菜花

|

机器学习/深度学习人工智能算法

ToddlerBot：告别百万经费！6000刀就能造人形机器人，斯坦福开源全套方案普及机器人研究

ToddlerBot 是斯坦福大学推出的低成本开源人形机器人平台，支持强化学习、模仿学习和零样本模拟到现实转移，适用于运动操作研究和多场景应用。

蚝油菜花

1353 3 3

ToddlerBot：告别百万经费！6000刀就能造人形机器人，斯坦福开源全套方案普及机器人研究

喵~来学编程啦

|

C++

图解哈夫曼树

图解哈夫曼树

喵~来学编程啦

633 0 0

gudanhero2018

|

数据可视化索引 Python

Tips：Matplotlib中柱状图Bar显示数值

Tips：Matplotlib中柱状图Bar显示数值

gudanhero2018

1825 0 0

小殊小殊

|

机器学习/深度学习算法大数据

提取图像特征方法总结是那种很传统的方法~

提取图像特征方法总结是那种很传统的方法~

小殊小殊

668 4 4

从大数据到人工智能

|

SQL 分布式计算资源调度

hive-3.1.2安装以及使用tez作为执行引擎指南

本文介绍hive-3.1.2安装以及使用tez作为执行引擎指南

从大数据到人工智能

2193 0 0

hive-3.1.2安装以及使用tez作为执行引擎指南

JAVA旭阳

|

Java API

开发利器Hutool之MapBuilder的使用

开发利器Hutool之MapBuilder的使用

JAVA旭阳

1597 0 1

开发利器Hutool之MapBuilder的使用

Lwcah

|

并行计算算法计算机视觉

【MATLAB 】 VMD 信号分解+模糊熵（近似熵）算法

【MATLAB 】 VMD 信号分解+模糊熵（近似熵）算法

Lwcah

1138 0 0

热门文章

最新文章

Team 版 OpenClaw：HiClaw 开源，5 分钟完成本地安装

十年磨一剑 | 淘宝如何打造承载亿级流量的首页？

[CentOS]安装软件：/lib/ld-linux.so.2: bad ELF interpreter 解决

linux搭建邮件服务器

什么是OTA升级管理系统？

易天光通信与您相约第21届光博会CIOE，不见不散-2019

无法创建工具栏

Win10显示时间月日、星期

基于注解的SpringMVC简单介绍

Vue简单使用

高压电线电力巡检六类图像识别数据集分享（适用于YOLO系列深度学习分类检测任务）

HSL 色彩模型，为什么设计师不直接用 RGB

雾锁王国(Enshrouded)游戏联机服务器怎样搭建？阿里云一键部署全流程详解

OpenClaw 与 Hermes 全面对比与一键部署指南

Claude 3.5 Haiku 极速响应测试，DМ‌XΑ‌РΙ 降低边缘节点接入时延

阿里云免费Tokens领取——开通百炼就能领，纯免费，超过7000万的Tokens有效期90天

阿里云服务器管理控制台（后台）在哪登录？统一阿里云后台链接入口整理，一键直达

阿里云管理控制台入口链接大全：云服务器ECS和轻量应用服务器入口整理

新手必藏！阿里云服务器控制台首页打开教程，附直达链接

2026年阿里云学生优惠券领取及使用指南

相关电子书

更多

低代码开发师（初级）实战教程

冬季实战营第三期：MySQL数据库进阶实战

阿里巴巴DevOps 最佳实践手册

下一篇

阿里云重磅发布Agentic SOC，企业级AI Agent驱动的安全运营平台