DL之MobileNetV2:MobileNetV2算法的简介(论文介绍)、架构详解、案例应用等配图集合之详细攻略

简介: DL之MobileNetV2:MobileNetV2算法的简介(论文介绍)、架构详解、案例应用等配图集合之详细攻略

MobileNetV2算法的简介(论文介绍)

image.png



    作者在MobileNet基础上,又提出了改进的模型MobileNetV2,该模型可用于不同的任务,比如图像分类、目标检测、图像分割等。



Abstract  

      In this paper we describe a new mobile architecture,  MobileNetV2, that improves the state of the art performance  of mobile models on multiple tasks and benchmarks  as well as across a spectrum of different model  sizes. We also describe efficient ways of applying these  mobile models to object detection in a novel framework  we call SSDLite. Additionally, we demonstrate how  to build mobile semantic segmentation models through  a reduced form of DeepLabv3 which we call Mobile  DeepLabv3.  is based on an inverted residual structure where  the shortcut connections are between the thin bottleneck  layers. The intermediate expansion layer uses  lightweight depthwise convolutions to filter features as  a source of non-linearity.      

      Additionally, we find that it is  important to remove non-linearities in the narrow layers  in order to maintain representational power. We demonstrate  that this improves performance and provide an intuition  that led to this design.  

      Finally, our approach allows decoupling of the input/output  domains from the expressiveness of the transformation,  which provides a convenient framework for  further analysis. We measure our performance on  ImageNet [1] classification, COCO object detection [2],  VOC image segmentation [3]. We evaluate the trade-offs  between accuracy, and number of operations measured  by multiply-adds (MAdd), as well as actual latency, and  the number of parameters.

摘要

      在本文中,我们描述了一种新的移动架构mobilenet2,它改善了移动模型在多个任务和基准上以及在不同模型大小的范围内的最新性能。我们还描述了在一个称为SSDLite的新框架中,将这些移动模型应用于目标检测的有效方法。此外,我们还演示了如何通过DeepLabv3 (我们称之为Mobile DeepLabv3 )的简化形式来构建移动语义分割模型。是基于一个倒置的residual结构,其中的快捷连接是在薄的bottleneck 层之间。中间扩展层使用轻量级的垂直卷积来过滤作为非线性源的特征。

      此外,我们发现为了保持具有代表性的能力,在狭窄的层面上去除非线性是很重要的。我们证明,这提高了性能,并提供了带来此设计的直觉(即灵感来源)。

      最后,我们的方法允许将输入/输出域与转换的表现性分离,这为进一步分析提供了一个方便的框架。我们在ImageNet[1]分类、COCO目标检测[2]和VOC图像分割[3]上测量我们的性能。我们评估了精度、乘法加法(MAdd)度量的操作数、实际延迟和参数数之间的权衡。

Conclusions and future work  

      We described a very simple network architecture that  allowed us to build a family of highly efficient mobile  models. Our basic building unit, has several properties  that make it particularly suitable for mobile applications.  It allows very memory-efficient inference and  relies utilize standard operations present in all neural  frameworks.  

      For the ImageNet dataset, our architecture improves  the state of the art for wide range of performance points.  

      For object detection task, our network outperforms  state-of-art realtime detectors on COCO dataset both in  terms of accuracy and model complexity. Notably, our  architecture combined with the SSDLite detection module  is 20× less computation and 10× less parameters  than YOLOv2.  

      On the theoretical side: the proposed convolutional  block has a unique property that allows to separate the  network expressiviness (encoded by expansion layers)  from its capacity (encoded by bottleneck inputs). Exploring  this is an important direction for future research.

结论与未来工作

      我们描述了一个非常简单的网络架构,它允许我们构建一系列高效的移动模型。我们的基本建筑单元有几个特性,使其特别适合移动应用。它允许非常有记忆效率的推理,并且依赖于使用所有神经框架中存在的标准操作。

      对于ImageNet数据集,我们的架构改善了各种性能点的艺术状态。

      对于目标检测任务,我们的网络在准确性和模型复杂性方面都优于COCO数据集上的最新实时检测器。值得注意的是,我们的架构与SSDLite 检测模块相结合,比YOLOv2的计算量少20倍,参数少10倍。

      理论方面:所提出的卷积块具有独特的特性,允许将网络表现性(由扩展层编码)与其容量(由瓶颈输入编码)分开。探索这是今后研究的一个重要方向。



论文

Mark Sandler, Andrew Howard, MenglongZhu, Andrey Zhmoginov, Liang-ChiehChen.

MobileNetV2: Inverted Residuals and Linear Bottlenecks.

https://arxiv.org/abs/1801.04381v3



MobileNet V2算法的架构详解


1、MobileNet V1 → MobileNet V2


image.png





2、主要贡献是一个新颖的层模块


image.png


      具有线性瓶颈的反转残差(inverted residual ):该模块将低维压缩表示作为输入,首先将其扩展为高维度并使用轻量级沿深度卷积(depthwiseconvolution)进行滤波。随后通过线性卷积将特征投射回低维表示。

      中间层使用轻量级的沿深度卷积来对特征进行滤波作为非线性的来源。



3、实验结果


ImageNet上的分类结果的性能,不同网络的比较 Performance on ImageNet, comparison for different networks.




image.png





MobileNet V2算法的案例应用


更新……






 


相关文章
|
2月前
|
人工智能 自然语言处理 算法
首届大模型顶会COLM 高分论文:偏好搜索算法PairS,让大模型进行文本评估更高效
【8月更文挑战第26天】在人工智能领域,尽管大型语言模型(LLMs)作为自动评估工具展现了巨大潜力,但在自然语言生成质量评估中仍存偏见问题,且难以确保一致性。为解决这一挑战,研究者开发了Pairwise-preference Search(PairS)算法,一种基于不确定性的搜索方法,通过成对比较及不确定性引导实现高效文本排名,有效减少了偏见、提升了评估效率和可解释性。PairS在多项任务中表现出色,相较于传统评分法有显著提升,为自然语言处理评估提供了新思路。更多详情参阅论文:https://arxiv.org/abs/2403.16950。
44 4
|
1天前
|
机器学习/深度学习 人工智能 自然语言处理
【MM2024】阿里云 PAI 团队图像编辑算法论文入选 MM2024
阿里云人工智能平台 PAI 团队发表的图像编辑算法论文在 MM2024 上正式亮相发表。ACM MM(ACM国际多媒体会议)是国际多媒体领域的顶级会议,旨在为研究人员、工程师和行业专家提供一个交流平台,以展示在多媒体领域的最新研究成果、技术进展和应用案例。其主题涵盖了图像处理、视频分析、音频处理、社交媒体和多媒体系统等广泛领域。此次入选标志着阿里云人工智能平台 PAI 在图像编辑算法方面的研究获得了学术界的充分认可。
【MM2024】阿里云 PAI 团队图像编辑算法论文入选 MM2024
|
2月前
|
机器学习/深度学习 存储 算法
【博士每天一篇论文-算法】Continual Learning Through Synaptic Intelligence,SI算法
本文介绍了一种名为"Synaptic Intelligence"(SI)的持续学习方法,通过模拟生物神经网络的智能突触机制,解决了人工神经网络在学习新任务时的灾难性遗忘问题,并保持了计算效率。
39 1
【博士每天一篇论文-算法】Continual Learning Through Synaptic Intelligence,SI算法
|
2月前
|
数据采集 机器学习/深度学习 算法
【python】python客户信息审计风险决策树算法分类预测(源码+数据集+论文)【独一无二】
【python】python客户信息审计风险决策树算法分类预测(源码+数据集+论文)【独一无二】
|
2月前
|
算法 Python
【python】python基于 Q-learning 算法的迷宫游戏(源码+论文)【独一无二】
【python】python基于 Q-learning 算法的迷宫游戏(源码+论文)【独一无二】
|
5天前
|
存储 缓存 监控
探索微服务架构中的API网关模式
【10月更文挑战第1天】探索微服务架构中的API网关模式
28 2
|
21天前
|
安全 应用服务中间件 API
微服务分布式系统架构之zookeeper与dubbo-2
微服务分布式系统架构之zookeeper与dubbo-2
|
21天前
|
负载均衡 Java 应用服务中间件
微服务分布式系统架构之zookeeper与dubbor-1
微服务分布式系统架构之zookeeper与dubbor-1
|
2天前
|
Kubernetes 安全 微服务
使用 Istio 缓解电信 5G IoT 微服务 Pod 架构的安全挑战
使用 Istio 缓解电信 5G IoT 微服务 Pod 架构的安全挑战
21 8
|
1天前
|
缓存 监控 API
探索微服务架构中的API网关模式
【10月更文挑战第5天】随着微服务架构的兴起,企业纷纷采用这一模式构建复杂应用。在这种架构下,应用被拆分成若干小型、独立的服务,每个服务围绕特定业务功能构建并通过HTTP协议协作。随着服务数量增加,统一管理这些服务间的交互变得至关重要。API网关作为微服务架构的关键组件,承担起路由请求、聚合数据、处理认证与授权等功能。本文通过一个在线零售平台的具体案例,探讨API网关的优势及其实现细节,展示其在简化客户端集成、提升安全性和性能方面的关键作用。
11 2