DL之MobileNet:MobileNet算法的简介(论文介绍)、架构详解、案例应用等配图集合之详细攻略(一)

简介: DL之MobileNet:MobileNet算法的简介(论文介绍)、架构详解、案例应用等配图集合之详细攻略

MobileNet算法的简介(论文介绍)


     深度学习在图像分类,目标检测和图像分割等任务表现出了巨大的优越性。但是伴随着模型精度的提升是计算量,存储空间以及能耗方面的巨大开销,对于嵌入式应用,比如移动或车载应用都是难以接受的。



Abstract  

     We present a class of efficient models called MobileNets  for mobile and embedded vision applications. MobileNets  are based on a streamlined architecture that uses depthwise  separable convolutions to build light weight deep  neural networks. We introduce two simple global hyperparameters  that efficiently trade off between latency and  accuracy. These hyper-parameters allow the model builder  to choose the right sized model for their application based  on the constraints of the problem. We present extensive  experiments on resource and accuracy tradeoffs and show  strong performance compared to other popular models on  ImageNet classification. We then demonstrate the effectiveness  of MobileNets across a wide range of applications and  use cases including object detection, finegrain classification,  face attributes and large scale geo-localization.

摘要

     我们为移动和嵌入式视觉应用提供了一类称为MobileNets的高效模型。Mobilenets基于一种流线型的架构,它使用纵向的可分离卷积来构建轻量级的深层神经网络。我们引入了两个简单的全局超参数,有效地在延迟和精度之间进行权衡。这些超参数允许模型生成器根据问题的约束为其应用程序选择合适大小的模型。我们在资源和精度权衡方面进行了广泛的实验,并在图像网分类方面与其他流行的模型相比表现出很强的性能。然后,我们展示了MobileNet在广泛应用和使用案例中的有效性,包括目标检测、细粒度分类、人脸属性和大规模地理定位。

Conclusion

     We proposed a new model architecture called MobileNets  based on depthwise separable convolutions. We  investigated some of the important design decisions leading  to an efficient model. We then demonstrated how to build  smaller and faster MobileNets using width multiplier and  resolution multiplier by trading off a reasonable amount of  accuracy to reduce size and latency. We then compared different  MobileNets to popular models demonstrating superior  size, speed and accuracy characteristics. We concluded  by demonstrating MobileNet’s effectiveness when applied  to a wide variety of tasks. As a next step to help adoption  and exploration of MobileNets, we plan on releasing models  in TensorFlow.

结论

     我们提出了一种新的模型体系结构,称为基于非纵向可分离卷积的MobileNets 。我们研究了导致有效模型的一些重要设计决策。然后,我们演示了如何利用宽度倍增器和分辨率倍增器来构建更小更快的移动网络,通过牺牲合理的精度来减少大小和延迟。然后,我们将不同的MobileNets 与流行的模型进行了比较,显示出优越的尺寸、速度和精度特性。最后,我们展示了Mobilenet在广泛应用于各种任务时的有效性。作为帮助采用和探索MobileNets的下一步,我们计划在TensorFlow中发布模型。


论文

Andrew G. Howard, MenglongZhu, Bo Chen, Dmitry Kalenichenko, et al.

MobileNets: Efficient Convolutional Neural Networks for Mobile Vision Applications. 2017.

https://arxiv.org/abs/1704.04861




1、研究背景


       深度学习在图像分类,目标检测和图像分割等任务表现出了巨大的优越性。但是伴随着模型精度的提升是计算量,存储空间以及能耗方面的巨大开销,对于移动或车载应用都是难以接受的。



2、传统的模型轻量化常用的方法


(1)、卷积核分解,使用1×N和N×1的卷积核代替N×N的卷积核

(2)、使用bottleneck结构,以SqueezeNet为代表

(3)、进行深度压缩,以低精度浮点数保存,例如Deep Compression,比如将32bit降维到8bit,进行保存!

(4)、冗余卷积核剪枝及哈弗曼编码



3、MobileNet 模型可应用于各种识别任务,以实现高效的设备智能


    可以应用在各种嵌入式设备上。MobileNet models can be applied to various recognition tasks for efficient on device intelligence


image.png


MobileNet使用了一种称之为深度可分离卷积,来替代原有的传统3D卷积,减少了卷积核的冗余表达。

计算量和参数数量明显下降,卷积网络可以应用在更多的移动端平台。

深度可分离卷积的相关文章

DL之Xception:Xception算法的简介(论文介绍)、架构详解、案例应用等配图集合之详细攻略

https://yunyaniu.blog.csdn.net/article/details/97934175




相关文章
|
8月前
|
存储 机器学习/深度学习 编解码
双选择性信道下正交啁啾分复用(OCDM)的低复杂度均衡算法研究——论文阅读
本文提出统一相位正交啁啾分复用(UP-OCDM)方案,利用循环矩阵特性设计两种低复杂度均衡算法:基于带状近似的LDL^H分解和基于BEM的迭代LSQR,将复杂度由$O(N^3)$降至$O(NQ^2)$或$O(iNM\log N)$,在双选择性信道下显著提升高频谱效率与抗多普勒性能。
468 0
双选择性信道下正交啁啾分复用(OCDM)的低复杂度均衡算法研究——论文阅读
|
8月前
|
机器学习/深度学习 人工智能 缓存
面向边缘通用智能的多大语言模型系统:架构、信任与编排——论文阅读
本文提出面向边缘通用智能的多大语言模型(Multi-LLM)系统,通过协同架构、信任机制与动态编排,突破传统边缘AI的局限。融合合作、竞争与集成三种范式,结合模型压缩、分布式推理与上下文优化技术,实现高效、可靠、低延迟的边缘智能,推动复杂场景下的泛化与自主决策能力。
709 3
面向边缘通用智能的多大语言模型系统:架构、信任与编排——论文阅读
|
9月前
|
传感器 资源调度 算法
DDMA-MIMO雷达多子带相干累积目标检测算法——论文阅读
本文提出一种多子带相干累积(MSCA)算法,通过引入空带和子带相干处理,解决DDMA-MIMO雷达的多普勒模糊与能量分散问题。该方法在低信噪比下显著提升检测性能,实测验证可有效恢复目标速度,适用于车载雷达高精度感知。
1012 4
DDMA-MIMO雷达多子带相干累积目标检测算法——论文阅读
|
9月前
|
数据采集 机器学习/深度学习 搜索推荐
MIT新论文:数据即上限,扩散模型的关键能力来自图像统计规律,而非复杂架构
MIT与丰田研究院研究发现,扩散模型的“局部性”并非源于网络架构的精巧设计,而是自然图像统计规律的产物。通过线性模型仅学习像素相关性,即可复现U-Net般的局部敏感模式,揭示数据本身蕴含生成“魔法”。
369 3
MIT新论文:数据即上限,扩散模型的关键能力来自图像统计规律,而非复杂架构
|
9月前
|
机器学习/深度学习 人工智能 资源调度
MicroNAS:面向MCU的零样本神经架构搜索——论文阅读
MicroNAS是一种专为微控制器单元(MCU)设计的零样本神经架构搜索(NAS)框架,无需训练即可通过理论驱动的性能指标评估网络架构。相比传统NAS方法,其搜索效率提升高达1104倍,同时兼顾精度与硬件效率,适用于边缘计算场景。该框架结合神经切线核(NTK)条件数、线性区域计数及硬件感知延迟模型,实现快速、高效的架构搜索,为资源受限设备上的AI部署提供了新思路。
521 2
MicroNAS:面向MCU的零样本神经架构搜索——论文阅读
|
9月前
|
机器学习/深度学习 人工智能 vr&ar
H4H:面向AR/VR应用的NPU-CIM异构系统混合卷积-Transformer架构搜索——论文阅读
H4H是一种面向AR/VR应用的混合卷积-Transformer架构,基于NPU-CIM异构系统,通过神经架构搜索实现高效模型设计。该架构结合卷积神经网络(CNN)的局部特征提取与视觉Transformer(ViT)的全局信息处理能力,提升模型性能与效率。通过两阶段增量训练策略,缓解混合模型训练中的梯度冲突问题,并利用异构计算资源优化推理延迟与能耗。实验表明,H4H在相同准确率下显著降低延迟和功耗,为AR/VR设备上的边缘AI推理提供了高效解决方案。
1479 0
|
8月前
|
Cloud Native Serverless API
微服务架构实战指南:从单体应用到云原生的蜕变之路
🌟蒋星熠Jaxonic,代码为舟的星际旅人。深耕微服务架构,擅以DDD拆分服务、构建高可用通信与治理体系。分享从单体到云原生的实战经验,探索技术演进的无限可能。
微服务架构实战指南:从单体应用到云原生的蜕变之路
|
弹性计算 API 持续交付
后端服务架构的微服务化转型
本文旨在探讨后端服务从单体架构向微服务架构转型的过程,分析微服务架构的优势和面临的挑战。文章首先介绍单体架构的局限性,然后详细阐述微服务架构的核心概念及其在现代软件开发中的应用。通过对比两种架构,指出微服务化转型的必要性和实施策略。最后,讨论了微服务架构实施过程中可能遇到的问题及解决方案。
|
Cloud Native Devops 云计算
云计算的未来:云原生架构与微服务的革命####
【10月更文挑战第21天】 随着企业数字化转型的加速,云原生技术正迅速成为IT行业的新宠。本文深入探讨了云原生架构的核心理念、关键技术如容器化和微服务的优势,以及如何通过这些技术实现高效、灵活且可扩展的现代应用开发。我们将揭示云原生如何重塑软件开发流程,提升业务敏捷性,并探索其对企业IT架构的深远影响。 ####
482 3