Exploring the Regularity of Sparse Structure in Convolutional Neural Networks(在卷积神经网络中探索稀疏结构的规律性)

简介: 作者提出基于论文Learning both weights and connections for efficient neural network修剪的方法在保留精度以及实现更高的压缩率方面确实很好。但是,这种改进是以稀疏计算模式的不规则性为代价的。另一方面结构化的剪枝(例如修剪掉整个过滤器),但是比修剪单个权重会引起更大的精度损失。

作者提出

基于论文Learning both weights and connections for efficient neural network修剪的方法在保留精度以及实现更高的压缩率方面确实很好。但是,这种改进是以稀疏计算模式的不规则性为代价的。

另一方面结构化的剪枝(例如修剪掉整个过滤器),但是比修剪单个权重会引起更大的精度损失。

因此作者提出了三个问题:规律性和准确性之间的权衡是什么?是否可以在规律性范围内找到一个最佳位置?最佳位置如何提高硬件实施效率?

现存的很多工作尽力去用对卷积核和通道剪枝来代替个别权重的修剪,然而由于它们使用的是不同的方法,我们无法直接对剪枝规律性和准确率之间的关系做出评估。所以在做对比实验作者采用相同的方法和配置。

贡献有

我们探索了一个完整的剪枝规律性范围(从0D到1D到2D到3D),对模型的规律性和准确率之间的平衡做了评估;

我们展示了粗粒度剪枝与细粒度剪枝相比,能够达到相似甚至更好的压缩率,即使它的稀疏度小一点;

我们展示了粗粒度剪枝可以以一种结构化方式跳过计算和减少存储,从而导致了一种更加高效的硬件加速实现。

感觉总结的综述很好,也就贴出来了。


剪枝方法:稀疏性已被证明是节省深度神经网络模型参数的有效方法。大量的工作研究了怎样了选择重要的连接关系和如何高效地恢复准确率。二阶导数(Optimal brain damage)、绝对值(Learning both weights and connections for efficient neural network)、损失近似泰勒展开( Pruning convolutional neural networks for resource efficient transfer learning)和输出灵敏度(A new pruning heuristic based on variance analysis of sensitivity information)是用于修剪的重要度量的示例。还有一些方法试图更好地整合修剪和训练,例如迭代修剪( Learning both weights and connections for efficient


neural network)和动态修剪(Dynamic network surgery for efficient DNNs)。

稀疏粒度:在所有的稀疏类型中,细粒度稀疏和filter-wise稀疏是两种极端情况,细粒度稀疏指的是个别权重被删除,它已经被证明可以在CNN和RNN上工作的很好;还有一种通道和卷积核稀疏,减少卷积核的通道数或者个数,这可以看作是一种非常粗粒度的稀疏化——在卷积层上移除3D的子张量,这样的粗粒度稀疏由于其规则性是十分有利于加速的,然而,这样的稀疏化有可能导致比细粒度的精度要低很多。在vanilla稀疏化到通道(卷积核)稀疏化之间有很宽的粒度范围,一些文献试图探索一些可能性。

加速稀疏模型。对于滤波器稀疏和通道稀疏这种粗粒度的稀疏,在通用处理器上实现加速很容易,因为它等同于获得较小的密集模型。对于细粒度的稀疏,需要开发特定加速器来减少计算。


相关文章
|
4月前
|
机器学习/深度学习 PyTorch TensorFlow
卷积神经网络深度解析:从基础原理到实战应用的完整指南
蒋星熠Jaxonic,深度学习探索者。深耕TensorFlow与PyTorch,分享框架对比、性能优化与实战经验,助力技术进阶。
|
4月前
|
数据采集 监控 网络安全
VMware Cloud Foundation Operations for Networks 9.0.1.0 发布 - 云网络监控与分析
VMware Cloud Foundation Operations for Networks 9.0.1.0 发布 - 云网络监控与分析
429 3
VMware Cloud Foundation Operations for Networks 9.0.1.0 发布 - 云网络监控与分析
|
5月前
|
机器学习/深度学习 人工智能 算法
卷积神经网络深度解析:从基础原理到实战应用的完整指南
蒋星熠Jaxonic带你深入卷积神经网络(CNN)核心技术,从生物启发到数学原理,详解ResNet、注意力机制与模型优化,探索视觉智能的演进之路。
546 11
|
8月前
|
机器学习/深度学习 算法 数据安全/隐私保护
基于PSO粒子群优化TCN-LSTM时间卷积神经网络时间序列预测算法matlab仿真
本内容展示了一种基于粒子群优化(PSO)与时间卷积神经网络(TCN)的时间序列预测方法。通过 MATLAB2022a 实现,完整程序运行无水印,核心代码附详细中文注释及操作视频。算法利用 PSO 优化 TCN 的超参数(如卷积核大小、层数等),提升非线性时间序列预测性能。TCN 结构包含因果卷积层与残差连接,结合 LSTM 构建混合模型,经多次迭代选择最优超参数,最终实现更准确可靠的预测效果,适用于金融、气象等领域。
|
5月前
|
机器学习/深度学习 传感器 数据采集
【故障识别】基于CNN-SVM卷积神经网络结合支持向量机的数据分类预测研究(Matlab代码实现)
【故障识别】基于CNN-SVM卷积神经网络结合支持向量机的数据分类预测研究(Matlab代码实现)
400 0
|
7月前
|
机器学习/深度学习 人工智能 PyTorch
零基础入门CNN:聚AI卷积神经网络核心原理与工业级实战指南
卷积神经网络(CNN)通过局部感知和权值共享两大特性,成为计算机视觉的核心技术。本文详解CNN的卷积操作、架构设计、超参数调优及感受野计算,结合代码示例展示其在图像分类、目标检测等领域的应用价值。
446 7
|
7月前
|
监控 数据可视化 Java
VMware Aria Operations for Networks 6.14 - 网络和应用监控工具
VMware Aria Operations for Networks 6.14 - 网络和应用监控工具
160 0
VMware Aria Operations for Networks 6.14 - 网络和应用监控工具
|
机器学习/深度学习 运维 自然语言处理
VMware Cloud Foundation Operations for Networks 9.0 发布 - 云网络监控与分析
VMware Cloud Foundation Operations for Networks 9.0 发布 - 云网络监控与分析
118 0
|
8月前
|
机器学习/深度学习 数据采集 监控
基于CNN卷积神经网络和GEI步态能量提取的步态识别算法matlab仿真,对比不同角度下的步态识别性能
本项目基于CNN卷积神经网络与GEI步态能量提取技术,实现高效步态识别。算法使用不同角度(0°、45°、90°)的步态数据库进行训练与测试,评估模型在多角度下的识别性能。核心流程包括步态图像采集、GEI特征提取、数据预处理及CNN模型训练与评估。通过ReLU等激活函数引入非线性,提升模型表达能力。项目代码兼容Matlab2022a/2024b,提供完整中文注释与操作视频,助力研究与应用开发。
|
8月前
|
机器学习/深度学习 算法 数据安全/隐私保护
基于WOA鲸鱼优化的TCN-GRU时间卷积神经网络时间序列预测算法matlab仿真
本内容包含时间序列预测算法的相关资料,涵盖以下几个方面:1. 算法运行效果预览(无水印);2. 运行环境为Matlab 2022a/2024b;3. 提供部分核心程序,完整版含中文注释及操作视频;4. 理论概述:结合时间卷积神经网络(TCN)与鲸鱼优化算法(WOA),优化TCN超参数以提升非线性时间序列预测性能。通过因果卷积层与残差连接构建TCN模型,并用WOA调整卷积核大小、层数等参数,实现精准预测。适用于金融、气象等领域决策支持。

热门文章

最新文章