DL之ShuffleNet:ShuffleNet算法的简介(论文介绍)、架构详解、案例应用等配图集合之详细攻略

简介: DL之ShuffleNet:ShuffleNet算法的简介(论文介绍)、架构详解、案例应用等配图集合之详细攻略

ShuffleNet算法的简介(论文介绍)


       ShuffleNet也是应用在移动设备上的网络架构模型。


Abstract

We introduce an extremely computation-efficient CNN  architecture named ShuffleNet, which is designed specially  for mobile devices with very limited computing power (e.g.,  10-150 MFLOPs). The new architecture utilizes two new  operations, pointwise group convolution and channel shuffle,  to greatly reduce computation cost while maintaining  accuracy. Experiments on ImageNet classification and MS  COCO object detection demonstrate the superior performance  of ShuffleNet over other structures, e.g. lower top-1  error (absolute 7.8%) than recent MobileNet [12] on ImageNet  classification task, under the computation budget of  40 MFLOPs. On an ARM-based mobile device, ShuffleNet  achieves ∼13× actual speedup over AlexNet while maintaining  comparable accuracy.

摘要

我们介绍了一个非常高效的CNN架构,名为ShuffleNet,专门为计算能力非常有限的移动设备(如10-150 MFLOPs)设计。新的体系结构利用了两种新的运算,即点态组卷积和channel shuffle,在保持精度的同时,大大降低了计算成本。图像网络分类和MS-COCO目标检测实验表明,在40 MFLOPs的计算预算下,与其他结构相比,在图像网络分类任务上,ShuffleNet 具有更好的性能,例如比最近的MobileNet [12]更低的Top-1错误(绝对7.8%)。在基于ARM的移动设备上,ShuffleNet 比AlexNet实现了~13倍的实际加速,同时保持了相当的准确性。



4、Experiment


实验在ImageNet的分类集上做评估,大多数遵循ResNeXt的设置,除了两点:


权重衰减从1e-4降低到了4e-5

数据增强使用较少的aggressive scale 增强

这样做的原因是小型网络在训练过程通常会遇到欠拟合而不是过拟合问题。


1、Classification error vs. number of groups g

image.png



2、Classification error vs. various structures

image.png



3、ShuffleNet vs. MobileNet on ImageNet Classification

image.png






论文

Xiangyu Zhang, XinyuZhou, MengxiaoLin, Jian Sun.

ShuffleNet: An Extremely Efficient Convolutional Neural Network for Mobile Devices. CVPR 2017.

https://arxiv.org/abs/1707.01083




ShuffleNet算法的架构详解


更新……


DL之ShuffleNet:ShuffleNet算法的架构详解https://yunyaniu.blog.csdn.net/article/details/98389299




ShuffleNet算法的案例应用


更新……


 


目录
打赏
0
0
0
0
1042
分享
相关文章
DeepSeek加持的通义灵码2.0 AI程序员实战案例:助力嵌入式开发中的算法生成革新
本文介绍了通义灵码2.0 AI程序员在嵌入式开发中的实战应用。通过安装VS Code插件并登录阿里云账号,用户可切换至DeepSeek V3模型,利用其强大的代码生成能力。实战案例中,AI程序员根据自然语言描述快速生成了C语言的base64编解码算法,包括源代码、头文件、测试代码和CMake编译脚本。即使在编译错误和需求迭代的情况下,AI程序员也能迅速分析问题并修复代码,最终成功实现功能。作者认为,通义灵码2.0显著提升了开发效率,打破了编程语言限制,是AI编程从辅助工具向工程级协同开发转变的重要标志,值得开发者广泛使用。
6049 65
DeepSeek加持的通义灵码2.0 AI程序员实战案例:助力嵌入式开发中的算法生成革新
NeurIPS 2024最佳论文,扩散模型的创新替代:基于多尺度预测的视觉自回归架构
本文详细解读NeurIPS 2024最佳论文《视觉自回归建模:基于下一尺度预测的可扩展图像生成》。该研究提出VAR模型,通过多尺度token图和VAR Transformer结构,实现高效、高质量的图像生成,解决了传统自回归模型在二维结构信息、泛化能力和计算效率上的局限。实验表明,VAR在图像质量和速度上超越现有扩散模型,并展示出良好的扩展性和零样本泛化能力。未来研究将聚焦于文本引导生成和视频生成等方向。
244 8
NeurIPS 2024最佳论文,扩散模型的创新替代:基于多尺度预测的视觉自回归架构
调研180多篇论文,这篇综述终于把大模型做算法设计理清了
《A Systematic Survey on Large Language Models for Algorithm Design》综述了过去三年大型语言模型(LLMs)在算法设计中的应用。LLMs通过自然语言处理技术,助力生成、优化和验证算法,在优化、机器学习、数学推理等领域展现出广泛应用前景。尽管存在资源需求高、结果不确定等挑战,LLMs仍为算法设计带来新机遇。论文地址:https://arxiv.org/abs/2410.14716。
107 14
这些算法在实际应用中有哪些具体案例呢
【10月更文挑战第19天】这些算法在实际应用中有哪些具体案例呢
103 1
计算机前沿技术-人工智能算法-大语言模型-最新论文阅读-2024-09-23(下)
计算机前沿技术-人工智能算法-大语言模型-最新论文阅读-2024-09-23(下)
70 0
计算机前沿技术-人工智能算法-大语言模型-最新论文阅读-2024-09-23(上)
计算机前沿技术-人工智能算法-大语言模型-最新论文阅读-2024-09-23(上)
52 0
计算机前沿技术-人工智能算法-大语言模型-最新论文阅读-2024-09-21(下)
计算机前沿技术-人工智能算法-大语言模型-最新论文阅读-2024-09-21(下)
57 0
计算机前沿技术-人工智能算法-大语言模型-最新论文阅读-2024-09-21(上)
计算机前沿技术-人工智能算法-大语言模型-最新论文阅读-2024-09-21(上)
49 0
后端服务架构的微服务化转型
本文旨在探讨后端服务从单体架构向微服务架构转型的过程,分析微服务架构的优势和面临的挑战。文章首先介绍单体架构的局限性,然后详细阐述微服务架构的核心概念及其在现代软件开发中的应用。通过对比两种架构,指出微服务化转型的必要性和实施策略。最后,讨论了微服务架构实施过程中可能遇到的问题及解决方案。
云计算的未来:云原生架构与微服务的革命####
【10月更文挑战第21天】 随着企业数字化转型的加速,云原生技术正迅速成为IT行业的新宠。本文深入探讨了云原生架构的核心理念、关键技术如容器化和微服务的优势,以及如何通过这些技术实现高效、灵活且可扩展的现代应用开发。我们将揭示云原生如何重塑软件开发流程,提升业务敏捷性,并探索其对企业IT架构的深远影响。 ####
86 3

热门文章

最新文章