向频域方向演进的卷积网络:OctConv用更低计算力做到更高准确率

简介: 便捷有效,喜闻乐见

雷锋网 AI 科技评论按:近几天,一篇改进卷积网络的论文引发了不小的关注和讨论。简单来说,这篇论文对传统的卷积操作做了简单的通用改进,就同时获得了更低的计算能力消耗和更高的准确率。知名机器学习研究员、「GANs 之父」Ian Goodfellow 就在推特上公开称赞了这篇论文。

TB1..JDSAvoK1RjSZFNXXcxMVXa.jpg

这篇论文的一作是陈云鹏,目前在新加坡国立大学(NUS)读最后一年博士生,他的导师是冯佳时助理教授和颜水成副教授。此前,陈云鹏在华中科技大学获得学士学位,并曾在香港大学做助理研究员、在 Facebook 机器学习应用部门(Facebook AML) 做实习研究员。从新加坡国立大学毕业之后,陈云鹏将于今年正式加入 Facebook,成为一名研究科学家。

下面雷锋网 AI 科技评论简单介绍一下论文的主要内容。

TB1WqlKSwHqK1RjSZFkXXX.WFXa.jpg

(降低一个八度:通过 Octave Convoluation 减少卷积神经网络中的空间冗余度)

卷积神经网络(CNN)在许多计算机视觉任务中都取得了前所未有的成功,并且随着近期研究中对于密集的模型参数以及 feature map 通道维度的固有冗余性的改进,CNN 的效率也在不断提高。不过,CNN 生成的 feature map 中仍然存在着显著的空间冗余度,具体来说,feature map 中的每个位置都只独立存储自己的特征描述器,但相邻的位置其实也会存储一些相同信息;这些信息可以共同存储并处理。

TB1i.pASrvpK1RjSZFqXXcXUVXa.jpg

图 1 - (a) 研究出发点:通过视觉的空间频域模型可以把自然图像分解为低频部分和高频部分

TB10HlASCzqK1RjSZFHXXb3CpXa.jpg

图 1 - (b) 卷积层输出的特征图也可以被分解并根据不同的空间频率重新分组。(c) 论文中提出的多频率特征表征会在低分辨率张量中存储平滑变化的低频特征图,这样就降低了空间冗余度。(d) 论文中提出的 Octave Convoluation 直接在这种表征上进行运算,它会更新每一组中的信息,并更进一步地允许不同组之间交换信息。

如上方图 1 - (a) 所示,一张自然图像可以被分解为低空间频率部分和高空间频率部分,前者描述了平滑变化的结构,后者描述了快速变化的图像细节。与之类似,论文作者们提出卷积层的特征图输出也可以被分解为具有不同空间频率的部分,并提出了一个新的多频率特征表征,它在不同的组中分别存储高频和低频的特征图,如图 1 - (b) 所示。这样,低频组的空间分辨率就可以安全地降低,通过在相邻的位置之间共享信息的方式降低空间冗余度,如图 1 - (c) 所示。为了与这种新的特征表示方法相容,作者们从原始的卷积操作进行了泛化,提出了 Octave Convolution (OctConv),它的输入是含有高低不同频率张量的特征图,然后直接从低频的特征图中提取信息,不需要把它解码回高频,如图 1 - (d) 所示。

作为原始的卷积操作的替代方案,OctConv 消耗的存储和计算资源明显更小。同时,OctConv 处理低频信息时使用的是对应的低频卷积,这种做法显著增大了原像素空间中的感知域大小,所以还能提升识别性能。

作者们把 OctConv 设计为了一种通用的方法,它可以作为现有卷积网络中卷积操作的直接替换。由于 OctConv 的重点在于在不同空间频率上处理特征图并降低空间冗余度,它就形成了对现有的各种改进 CNN 网络方案的另一个方向的补充;现有的方法包含更好的拓扑结构、降低卷积特征图中的通道冗余度、降低密集模型参数冗余度等等。

作者们还进一步讨论了如何把 OctConv 集成在分组、深度优先、以及三维卷积用例中。此外,与尝试利用多尺度信息的方法不同,OctConv 可以轻松地替换原本的卷积操作,不需要更改网络结构或者超参数调节。

论文中的实验表明,只需要简单地把原本的卷积替换为 OctConv ,就可以稳定提高各种热门二维 CNN 主干网络的表现,包括 ResNet、ResNeXt、DenseNet、MobileNet、Se-Net 在 ImageNet 上的二维图像识别,以及 C2D、I3D 在 Kinetics 数据集上的三维视频动作识别。换装了 OctConv 后的 ResNet-152 可以达到目前最先进的手工设计网络的表现,同时消耗的存储和计算却要小很多。

论文原文:https://arxiv.org/abs/1904.05049,相关代码近期会在 GitHub 上开源。雷锋网(公众号:雷锋网) AI 科技评论编译

雷锋网版权文章,未经授权禁止转载。详情见转载须知。

目录
相关文章
|
6月前
|
机器学习/深度学习 PyTorch TensorFlow
卷积神经网络深度解析:从基础原理到实战应用的完整指南
蒋星熠Jaxonic,深度学习探索者。深耕TensorFlow与PyTorch,分享框架对比、性能优化与实战经验,助力技术进阶。
|
机器学习/深度学习 编解码 自动驾驶
RT-DETR改进策略【模型轻量化】| 替换骨干网络为MoblieNetV1,用于移动视觉应用的高效卷积神经网络
RT-DETR改进策略【模型轻量化】| 替换骨干网络为MoblieNetV1,用于移动视觉应用的高效卷积神经网络
652 3
RT-DETR改进策略【模型轻量化】| 替换骨干网络为MoblieNetV1,用于移动视觉应用的高效卷积神经网络
|
7月前
|
机器学习/深度学习 人工智能 算法
卷积神经网络深度解析:从基础原理到实战应用的完整指南
蒋星熠Jaxonic带你深入卷积神经网络(CNN)核心技术,从生物启发到数学原理,详解ResNet、注意力机制与模型优化,探索视觉智能的演进之路。
678 11
|
10月前
|
机器学习/深度学习 算法 数据安全/隐私保护
基于PSO粒子群优化TCN-LSTM时间卷积神经网络时间序列预测算法matlab仿真
本内容展示了一种基于粒子群优化(PSO)与时间卷积神经网络(TCN)的时间序列预测方法。通过 MATLAB2022a 实现,完整程序运行无水印,核心代码附详细中文注释及操作视频。算法利用 PSO 优化 TCN 的超参数(如卷积核大小、层数等),提升非线性时间序列预测性能。TCN 结构包含因果卷积层与残差连接,结合 LSTM 构建混合模型,经多次迭代选择最优超参数,最终实现更准确可靠的预测效果,适用于金融、气象等领域。
|
11月前
|
机器学习/深度学习 人工智能 算法
深度解析:基于卷积神经网络的宠物识别
宠物识别技术随着饲养规模扩大而兴起,传统手段存在局限性,基于卷积神经网络的宠物识别技术应运而生。快瞳AI通过优化MobileNet-SSD架构、多尺度特征融合及动态网络剪枝等技术,实现高效精准识别。其在智能家居、宠物医疗和防走失领域展现广泛应用前景,为宠物管理带来智能化解决方案,推动行业迈向新高度。
1148 66
|
7月前
|
机器学习/深度学习 传感器 数据采集
【故障识别】基于CNN-SVM卷积神经网络结合支持向量机的数据分类预测研究(Matlab代码实现)
【故障识别】基于CNN-SVM卷积神经网络结合支持向量机的数据分类预测研究(Matlab代码实现)
484 0
|
9月前
|
机器学习/深度学习 人工智能 PyTorch
零基础入门CNN:聚AI卷积神经网络核心原理与工业级实战指南
卷积神经网络(CNN)通过局部感知和权值共享两大特性,成为计算机视觉的核心技术。本文详解CNN的卷积操作、架构设计、超参数调优及感受野计算,结合代码示例展示其在图像分类、目标检测等领域的应用价值。
528 7
|
11月前
|
机器学习/深度学习 算法 数据安全/隐私保护
基于PSO粒子群优化TCN时间卷积神经网络时间序列预测算法matlab仿真
本内容介绍了一种基于PSO(粒子群优化)改进TCN(时间卷积神经网络)的时间序列预测方法。使用Matlab2022a运行,完整程序无水印,附带核心代码中文注释及操作视频。TCN通过因果卷积层与残差连接处理序列数据,PSO优化其卷积核权重等参数以降低预测误差。算法中,粒子根据个体与全局最优位置更新速度和位置,逐步逼近最佳参数组合,提升预测性能。
|
机器学习/深度学习 算法 数据安全/隐私保护
基于GA遗传优化TCN-GRU时间卷积神经网络时间序列预测算法matlab仿真
本项目基于MATLAB2022a开发,提供无水印算法运行效果预览及核心程序(含详细中文注释与操作视频)。通过结合时间卷积神经网络(TCN)和遗传算法(GA),实现复杂非线性时间序列的高精度预测。TCN利用因果卷积层与残差连接提取时间特征,GA优化超参数(如卷积核大小、层数等),显著提升模型性能。项目涵盖理论概述、程序代码及完整实现流程,适用于金融、气象、工业等领域的时间序列预测任务。
|
10月前
|
机器学习/深度学习 数据采集 监控
基于CNN卷积神经网络和GEI步态能量提取的步态识别算法matlab仿真,对比不同角度下的步态识别性能
本项目基于CNN卷积神经网络与GEI步态能量提取技术,实现高效步态识别。算法使用不同角度(0°、45°、90°)的步态数据库进行训练与测试,评估模型在多角度下的识别性能。核心流程包括步态图像采集、GEI特征提取、数据预处理及CNN模型训练与评估。通过ReLU等激活函数引入非线性,提升模型表达能力。项目代码兼容Matlab2022a/2024b,提供完整中文注释与操作视频,助力研究与应用开发。