超越GhostNet!吊打MobileNetV3!MicroNet通过极低FLOPs实现图像识别(文末获取论文)(一)

简介: 超越GhostNet!吊打MobileNetV3!MicroNet通过极低FLOPs实现图像识别(文末获取论文)(一)

1 简介


在本文中介绍了MicroNet,它是一种高效的卷积神经网络具有极低的计算成本。在边缘设备上非常需要这样的低成本网络,但是通常会遭受明显的性能下降。

MicroNet基于2个设计原则来处理极低的FLOPs:

  • 1、通过降低节点连接性来避免网络宽度的减小;
  • 2、通过在每层引入更复杂的非线性来补偿网络深度的减小。

首先,提出Micro-Factorized卷积,将点和深度卷积分解为低秩矩阵,以便在通道数量和输入/输出连接性之间取得良好的平衡。其次,提出了一个新的激活函数,称为Dynamic Shift-Max,以通过最大化输入特征图与其圆形通道移位之间的多次动态融合来改善非线性。融合是动态的,因为它们的参数适用于输入。

基于Micro-Factorized卷积和动态Shift-Max,MicroNet系列在低FLOPs情况下比现有技术具有显著的性能提升。


2 相关工作


2.1、高效卷积

MobileNets将卷积分解为深度卷积和点态卷积;ShuffleNets采用Group卷积和Channels随机简化PointWise Convolution;也有学者利用Butterfly transform逼近Pointwise Convolution;EfficientNet找到输入分辨率和网络宽度/深度之间的适当关系;MixNet在一个卷积中将多个内核大小混合在一起;AdderNet用加法代替了大量的乘法;GhostNet应用线性变换来生成ghost feature maps;Sandglass翻转反向残块结构,减少信息损失,并训练一个网络支持多个子网络。

2.2、高效推理

高效推理为每个输入自适应定制合适的子网络。并使用强化学习来学习控制器,以跳过现有模型的一部分。MSDNet允许基于预测可信度的简单样本提前退出。搜索最佳的MSDNet。采用图像分辨率实现有效的推理。

2.3、动态神经网络

动态网络通过对输入参数的自适应调整来提高模型的表达能力。HyperNet使用另一个网络为主网络生成参数。SENet通过压缩全局上下文重新衡量Channel。SKNet适应关注不同大小的卷积核。Dynamic 卷积是根据多个卷积核的关注程度对它们进行聚合的结果。Dynamic ReLU适应ReLU中两个线性函数的斜率和截距,使用分组全连接层直接生成卷积权值。将动态卷积从空间不可知扩展到空间特定。提出了一种动态群卷积算法,可对输入通道进行自适应分组。将动态卷积应用于实例分割。学习跨尺度的语义分割的动态路由。


3 MicroNet


image.png

3.1、设计原理

极低延迟同时限制了网络宽度和深度。如果把卷积层看作一个图,输入和输出之间的连接由核参数的加权。这里将连接性定义为每个输出节点的连接数。因此,连接的数量等于输出通道的数量和连接的乘积。当计算成本固定时,通道数便与连接数发生冲突。作者认为,两者之间的良好平衡可以有效地避免通道缩减,提高层的表达能力。因此,第1个设计原则是通过降低节点连通性来规避网络宽度的降低。我们通过在更小的尺度上分解点态和深度卷积来实现这一点。

当一个网络的深度显著降低时,它的非线性便会受到约束,导致性能下降。于是作者提出了第2个设计原则通过提高每层的非线性度来补偿网络深度的减小,这里通过设计一个新的激活函数(动态Shift-Max激活函数)来实现这一点。

3.2、 Micro-Factorized卷积

为了平衡通道数量和输入/输出的连接性。作者在一个更小的尺度上对PointWise和DepthWise的卷积进行因式分解。

1)、Micro-Factorized Pointwise卷积

image.png

文中提出Group自适应卷积来分解PointWise卷积。假设卷积核W具有相同数量的输入和输出通道。将核矩阵W分解为两个Group自适应卷积,其中群数G依赖于通道数C,从数学上可以表示为:

image.png

式中,w是c x c的矩阵;Q的shape为,channel压缩率为R;的shape为,扩展返回到C作为输出的通道数量。

注意,Group数量不是固定的,它与通道数C和减少比R相适应:

image.png

这种平方根关系是通过平衡通道C和输入/输出连接性得到的。

image.png

如图3所示。随着group数G的增加C增加E减少。当G=R时,两条曲线相交(C=E),此时每个输出通道与所有输入通道连接一次。将得到的卷积矩阵W在数学上划分为块,每个块的秩为1。

2)、Micro-Factorized Depthwise卷积

image.png

如图所示,将一个的深度卷积核分解成一个的核和一个的核。每个通道W的核矩阵的形状为,它被分解为向量P和向量。是一个标量值1。这种低秩近似将计算复杂度从降低到。

3)、结合Micro-Factorized Pointwise and Depthwise卷积

image.png

作者以2种不同的方式组合了微因数分解的Pointwise和Depthwise卷积:(a)规则组合和(b)lite组合。前者只是将两个卷积连接起来。lite组合使用微因子分解的Depthwise卷积通过对每个通道应用多个Spatial卷积核来扩展通道的数量。然后应用1组自适应卷积来融合和压缩通道的数量。lite组合更有效,因为它节省了来自通道融合的计算,以弥补学习更多的Spatial卷积核。

3.3、动态Shift-Max激活函数

本文还提出了一种新的增强非线性的激活函数。它能够动态地将输入特征图与其循环组移位融合,其中的一组通道移位。动态Shift-Max也加强了Group之间的联系。这是对专注于组内连接的微因数分解Pointwise卷积的补充。

设表示一个输入向量(或张量),它有C个通道,被分成G个Groups。每个Group都有个通道。其中N通道的循环移位可以表示为。通过定义Group循环函数将通道移位扩展为Group移位:

image.png

其中,对应于将第个通道平移个Group。动态Shift-Max将多个(J)Group移位组合如下:

image.png

其中参数可以通过平均池化后的两个FC层轻松实现,,类似于SENet的实现方式。

image.png

相关实践学习
基于函数计算实现AI推理
本场景基于函数计算建立一个TensorFlow Serverless AI推理平台。
相关文章
|
编解码 计算机视觉
超越GhostNet!吊打MobileNetV3!MicroNet通过极低FLOPs实现图像识别(文末获取论文)(二)
超越GhostNet!吊打MobileNetV3!MicroNet通过极低FLOPs实现图像识别(文末获取论文)(二)
256 0
|
机器学习/深度学习 编解码 计算机视觉
ICCV2021 | MicroNet:以极低的 FLOPs 改进图像识别
这篇论文旨在以极低的计算成本解决性能大幅下降的问题。提出了微分解卷积,将卷积矩阵分解为低秩矩阵,将稀疏连接整合到卷积中。提出了一个新的动态激活函数-- Dynamic Shift Max,通过最大化输入特征图与其循环通道移位之间的多个动态融合来改善非线性。
ICCV2021 | MicroNet:以极低的 FLOPs 改进图像识别
|
16小时前
|
机器学习/深度学习 传感器 算法
深度学习在图像识别中的应用与挑战
【5月更文挑战第20天】 随着人工智能技术的飞速发展,深度学习已经成为计算机视觉领域的核心动力,尤其在图像识别任务中展现出了非凡的能力。本文将探讨深度学习技术在图像识别中的应用,涉及的关键算法如卷积神经网络(CNN),以及在实际应用中遇到的挑战和解决方案。通过分析现有文献和最新研究成果,我们将概述深度学习如何推动图像识别的边界,并讨论未来的发展方向。
|
16小时前
|
机器学习/深度学习 传感器 自动驾驶
基于深度学习的图像识别技术在自动驾驶领域的应用进展
【5月更文挑战第20天】 随着人工智能技术的飞速发展,深度学习在图像识别领域取得了显著成果。这些进展为自动驾驶技术的安全性与可靠性提供了强大的技术支持。本文综述了深度学习在图像识别中的关键算法,分析了其在自动驾驶环境感知、决策制定和控制系统中的应用,并探讨了当前技术面临的主要挑战及潜在的解决策略。通过实验验证,深度学习模型表现出卓越的性能,推动了自动驾驶技术的进一步发展。
|
16小时前
|
机器学习/深度学习 传感器 自动驾驶
基于深度学习的图像识别技术在自动驾驶系统中的应用
【5月更文挑战第20天】 随着人工智能技术的飞速发展,尤其是深度学习在图像处理领域的广泛应用,自动驾驶汽车逐渐成为现实。本文旨在探讨一种基于深度学习的图像识别技术,该技术能够有效提升自动驾驶系统的环境感知能力。通过构建一个多层次的卷积神经网络(CNN),我们能够实现对道路场景中多种元素的精确识别,包括行人、车辆以及交通标志等。文中详细介绍了网络架构的设计、训练过程以及优化策略,并分析了模型在实车测试中的表现。
|
16小时前
|
机器学习/深度学习 传感器 自动驾驶
基于深度学习的图像识别技术在自动驾驶系统中的应用
【5月更文挑战第20天】 随着人工智能技术的飞速发展,深度学习已成为推动技术创新的关键力量之一。特别是在图像识别领域,深度学习模型已经展示了超越传统算法的性能,为多个行业带来了革命性的变化。本文将探讨深度学习在自动驾驶系统中图像识别的应用,重点分析卷积神经网络(CNN)的结构、训练过程以及如何通过数据增强和迁移学习提升模型性能。此外,文章还将讨论深度学习在实时环境感知、决策制定以及安全性保障等方面的挑战和未来发展趋势。
|
17小时前
|
机器学习/深度学习 传感器 人工智能
深度学习在图像识别中的创新应用
【5月更文挑战第20天】 随着人工智能的飞速发展,深度学习技术在图像识别领域取得了显著的进步。本文将探讨深度学习如何革新图像识别技术,提高准确性和效率,并介绍最新的研究成果与实际应用案例。通过深度神经网络的不断优化和新算法的提出,图像识别正逐渐克服以往的限制,实现更为复杂的视觉理解任务。
|
17小时前
|
机器学习/深度学习 自动驾驶 算法
探索基于深度学习的图像识别在自动驾驶中的应用
【5月更文挑战第20天】 在自动驾驶技术的迅猛发展过程中,图像识别技术作为其核心组成部分之一,正逐渐从传统的算法转向更加高效和智能的深度学习方法。本文将详细探讨深度学习在图像识别领域的最新进展及其在自动驾驶系统中的具体应用。首先,文章概述了深度学习的基础理论和关键技术,然后通过案例分析展示了这些技术如何提升自动驾驶车辆对环境的感知能力。最后,讨论了当前面临的挑战和未来的发展方向,为该领域的研究者和工程师提供了宝贵的参考。
|
17小时前
|
机器学习/深度学习 传感器 自动驾驶
基于深度学习的图像识别技术在自动驾驶系统中的应用
【5月更文挑战第20天】 随着人工智能技术的飞速发展,特别是深度学习在图像处理领域的突破性进展,自动驾驶汽车逐渐成为现实。本文主要探讨了深度学习技术在图像识别中的关键作用以及其在自动驾驶系统中的具体应用。通过对卷积神经网络(CNN)等深度学习模型的研究,分析了这些模型如何提升车辆对周围环境的感知能力,实现实时准确的道路标识、行人和其他车辆检测。文章还讨论了当前技术面临的挑战和未来的发展方向。
|
1天前
|
机器学习/深度学习 边缘计算 算法
深度学习在图像识别中的应用及其挑战
【5月更文挑战第19天】 本文旨在探讨深度学习技术在图像识别领域的应用及其面临的主要挑战。通过分析当前流行的卷积神经网络(CNN)架构,并结合最新的研究进展,本文揭示了深度学习如何革新了传统的图像处理流程。同时,文章也指出了数据偏差、模型泛化能力不足以及计算资源消耗等关键问题,并对可能的解决方案进行了简要讨论。
17 4