DL之MobileNetV2:MobileNetV2算法的简介(论文介绍)、架构详解、案例应用等配图集合之详细攻略

简介: DL之MobileNetV2:MobileNetV2算法的简介(论文介绍)、架构详解、案例应用等配图集合之详细攻略

MobileNetV2算法的简介(论文介绍)

image.png



    作者在MobileNet基础上,又提出了改进的模型MobileNetV2,该模型可用于不同的任务,比如图像分类、目标检测、图像分割等。



Abstract  

      In this paper we describe a new mobile architecture,  MobileNetV2, that improves the state of the art performance  of mobile models on multiple tasks and benchmarks  as well as across a spectrum of different model  sizes. We also describe efficient ways of applying these  mobile models to object detection in a novel framework  we call SSDLite. Additionally, we demonstrate how  to build mobile semantic segmentation models through  a reduced form of DeepLabv3 which we call Mobile  DeepLabv3.  is based on an inverted residual structure where  the shortcut connections are between the thin bottleneck  layers. The intermediate expansion layer uses  lightweight depthwise convolutions to filter features as  a source of non-linearity.      

      Additionally, we find that it is  important to remove non-linearities in the narrow layers  in order to maintain representational power. We demonstrate  that this improves performance and provide an intuition  that led to this design.  

      Finally, our approach allows decoupling of the input/output  domains from the expressiveness of the transformation,  which provides a convenient framework for  further analysis. We measure our performance on  ImageNet [1] classification, COCO object detection [2],  VOC image segmentation [3]. We evaluate the trade-offs  between accuracy, and number of operations measured  by multiply-adds (MAdd), as well as actual latency, and  the number of parameters.

摘要

      在本文中,我们描述了一种新的移动架构mobilenet2,它改善了移动模型在多个任务和基准上以及在不同模型大小的范围内的最新性能。我们还描述了在一个称为SSDLite的新框架中,将这些移动模型应用于目标检测的有效方法。此外,我们还演示了如何通过DeepLabv3 (我们称之为Mobile DeepLabv3 )的简化形式来构建移动语义分割模型。是基于一个倒置的residual结构,其中的快捷连接是在薄的bottleneck 层之间。中间扩展层使用轻量级的垂直卷积来过滤作为非线性源的特征。

      此外,我们发现为了保持具有代表性的能力,在狭窄的层面上去除非线性是很重要的。我们证明,这提高了性能,并提供了带来此设计的直觉(即灵感来源)。

      最后,我们的方法允许将输入/输出域与转换的表现性分离,这为进一步分析提供了一个方便的框架。我们在ImageNet[1]分类、COCO目标检测[2]和VOC图像分割[3]上测量我们的性能。我们评估了精度、乘法加法(MAdd)度量的操作数、实际延迟和参数数之间的权衡。

Conclusions and future work  

      We described a very simple network architecture that  allowed us to build a family of highly efficient mobile  models. Our basic building unit, has several properties  that make it particularly suitable for mobile applications.  It allows very memory-efficient inference and  relies utilize standard operations present in all neural  frameworks.  

      For the ImageNet dataset, our architecture improves  the state of the art for wide range of performance points.  

      For object detection task, our network outperforms  state-of-art realtime detectors on COCO dataset both in  terms of accuracy and model complexity. Notably, our  architecture combined with the SSDLite detection module  is 20× less computation and 10× less parameters  than YOLOv2.  

      On the theoretical side: the proposed convolutional  block has a unique property that allows to separate the  network expressiviness (encoded by expansion layers)  from its capacity (encoded by bottleneck inputs). Exploring  this is an important direction for future research.

结论与未来工作

      我们描述了一个非常简单的网络架构,它允许我们构建一系列高效的移动模型。我们的基本建筑单元有几个特性,使其特别适合移动应用。它允许非常有记忆效率的推理,并且依赖于使用所有神经框架中存在的标准操作。

      对于ImageNet数据集,我们的架构改善了各种性能点的艺术状态。

      对于目标检测任务,我们的网络在准确性和模型复杂性方面都优于COCO数据集上的最新实时检测器。值得注意的是,我们的架构与SSDLite 检测模块相结合,比YOLOv2的计算量少20倍,参数少10倍。

      理论方面:所提出的卷积块具有独特的特性,允许将网络表现性(由扩展层编码)与其容量(由瓶颈输入编码)分开。探索这是今后研究的一个重要方向。



论文

Mark Sandler, Andrew Howard, MenglongZhu, Andrey Zhmoginov, Liang-ChiehChen.

MobileNetV2: Inverted Residuals and Linear Bottlenecks.

https://arxiv.org/abs/1801.04381v3



MobileNet V2算法的架构详解


1、MobileNet V1 → MobileNet V2


image.png





2、主要贡献是一个新颖的层模块


image.png


      具有线性瓶颈的反转残差(inverted residual ):该模块将低维压缩表示作为输入,首先将其扩展为高维度并使用轻量级沿深度卷积(depthwiseconvolution)进行滤波。随后通过线性卷积将特征投射回低维表示。

      中间层使用轻量级的沿深度卷积来对特征进行滤波作为非线性的来源。



3、实验结果


ImageNet上的分类结果的性能,不同网络的比较 Performance on ImageNet, comparison for different networks.




image.png





MobileNet V2算法的案例应用


更新……






 


相关文章
|
7月前
|
存储 监控 JavaScript
基于布隆过滤器的 Node.js 算法在局域网电脑桌面监控设备快速校验中的应用研究
本文探讨了布隆过滤器在局域网电脑桌面监控中的应用,分析其高效空间利用率、快速查询性能及动态扩容优势,并设计了基于MAC地址的校验模型,提供Node.js实现代码,适用于设备准入控制与重复数据过滤场景。
278 0
|
6月前
|
运维 监控 JavaScript
基于 Node.js 图结构的局域网设备拓扑分析算法在局域网内监控软件中的应用研究
本文探讨图结构在局域网监控系统中的应用,通过Node.js实现设备拓扑建模、路径分析与故障定位,提升网络可视化、可追溯性与运维效率,结合模拟实验验证其高效性与准确性。
371 3
|
6月前
|
机器学习/深度学习 资源调度 算法
遗传算法模型深度解析与实战应用
摘要 遗传算法(GA)作为一种受生物进化启发的优化算法,在复杂问题求解中展现出独特优势。本文系统介绍了GA的核心理论、实现细节和应用经验。算法通过模拟自然选择机制,利用选择、交叉、变异三大操作在解空间中进行全局搜索。与梯度下降等传统方法相比,GA不依赖目标函数的连续性或可微性,特别适合处理离散优化、多目标优化等复杂问题。文中详细阐述了染色体编码、适应度函数设计、遗传操作实现等关键技术,并提供了Python代码实现示例。实践表明,GA的成功应用关键在于平衡探索与开发,通过精心调参维持种群多样性同时确保收敛效率
|
6月前
|
机器学习/深度学习 边缘计算 人工智能
粒子群算法模型深度解析与实战应用
蒋星熠Jaxonic是一位深耕智能优化算法领域多年的技术探索者,专注于粒子群优化(PSO)算法的研究与应用。他深入剖析了PSO的数学模型、核心公式及实现方法,并通过大量实践验证了其在神经网络优化、工程设计等复杂问题上的卓越性能。本文全面展示了PSO的理论基础、改进策略与前沿发展方向,为读者提供了一份详尽的技术指南。
粒子群算法模型深度解析与实战应用
|
6月前
|
机器学习/深度学习 算法 安全
小场景大市场:猫狗识别算法在宠物智能设备中的应用
将猫狗识别算法应用于宠物智能设备,是AIoT领域的重要垂直场景。本文从核心技术、应用场景、挑战与趋势四个方面,全面解析这一融合算法、硬件与用户体验的系统工程。
|
5月前
|
Cloud Native Serverless API
微服务架构实战指南:从单体应用到云原生的蜕变之路
🌟蒋星熠Jaxonic,代码为舟的星际旅人。深耕微服务架构,擅以DDD拆分服务、构建高可用通信与治理体系。分享从单体到云原生的实战经验,探索技术演进的无限可能。
微服务架构实战指南:从单体应用到云原生的蜕变之路
|
弹性计算 API 持续交付
后端服务架构的微服务化转型
本文旨在探讨后端服务从单体架构向微服务架构转型的过程,分析微服务架构的优势和面临的挑战。文章首先介绍单体架构的局限性,然后详细阐述微服务架构的核心概念及其在现代软件开发中的应用。通过对比两种架构,指出微服务化转型的必要性和实施策略。最后,讨论了微服务架构实施过程中可能遇到的问题及解决方案。
|
Cloud Native Devops 云计算
云计算的未来:云原生架构与微服务的革命####
【10月更文挑战第21天】 随着企业数字化转型的加速,云原生技术正迅速成为IT行业的新宠。本文深入探讨了云原生架构的核心理念、关键技术如容器化和微服务的优势,以及如何通过这些技术实现高效、灵活且可扩展的现代应用开发。我们将揭示云原生如何重塑软件开发流程,提升业务敏捷性,并探索其对企业IT架构的深远影响。 ####
427 3
|
8月前
|
缓存 Cloud Native Java
Java 面试微服务架构与云原生技术实操内容及核心考点梳理 Java 面试
本内容涵盖Java面试核心技术实操,包括微服务架构(Spring Cloud Alibaba)、响应式编程(WebFlux)、容器化(Docker+K8s)、函数式编程、多级缓存、分库分表、链路追踪(Skywalking)等大厂高频考点,助你系统提升面试能力。
828 0

热门文章

最新文章