pytorch_YOLOX剪枝【附代码】

本文涉及的产品
日志服务 SLS,月写入数据量 50GB 1个月
简介: 笔记

环境


pytorch 1.7


loguru 0.5.3


NVIDIA 1650 4G


intel i5-9th


torch-pruning 0.2.7


安装包


pip install torch_pruning


Note:本项目是在b站up主Bubbliiiing和原YOLOX官方代码进行了整合。


1.添加了feature可视化功能


2.训练中可开启EMA功能


3.网络剪枝(支持s,m,l,x)


3.1支持单个卷积剪枝


3.2支持网络层剪枝


4.剪枝后微调训练


5.Conv与BN层的融合推理加速


6.保存log信息


数据集格式:采用voc数据集格式


feature视化


在tools/Net_Vision.py为可视化代码实现。可以通过在网络层导入NV函数,实现通道可视化。


eg:

features = [out_features[f] for f in self.in_features]
[x2, x1, x0] = features  # shape is (batch_size,channels,w,h)
NV(x2)

5.jpeg6.jpeg


网络剪枝


参考论文:Pruning Filters for Efficient ConvNets


导入剪枝工具


import torch_pruning as tp

采用通道剪枝,而不是权重剪枝。


在剪枝之前需要通过tools/prunmodel.py save_whole_model(weights_path, num_classes) 函数将模型的权重和结构都保存下来。


weights_path:权重路径


num_classes:自己类别数量


model = YOLOX(num_classes, 's')  # 这里需要根据自己的类数量修改  s指yolox-s

支持对某个卷积的剪枝:调用Conv_pruning(whole_model_weights):


pruning_idxs = strategy(v, amount=0.4)  # 0.4是剪枝率 根据需要自己修改,数越大剪的越多

对于单独一个卷积的剪枝,需要修改两个地方值,这里的卷积层需要打印模型获得,不要自己盲目瞎猜:


if k == 'backbone.backbone.dark2.0.conv.weight'
pruning_plan = DG.get_pruning_plan((model.backbone.backbone.dark2)[0].conv, tp.prune_conv, idxs=pruning_idxs)

支持网络层的剪枝:调用layer_pruning(whole_model_weights):


included_layers = list((model.backbone.backbone.dark2.modules()))  # 针对某层剪枝

Note:剪枝成功以后,会打印模型的参数变化量!如果没有打印,说明你剪的不对,好好检查一下!


剪枝以后的log日志文件会保存在logs文件下


剪枝后的微调训练


将train.py中的pruned_train设置为True.


False为正常训练,然后自己修改batch_size。


注意修改model_path和classes_path,不然会报错!


剪枝前的网络输入大小和微调训练以及推理时的大小必须一致!


训练自己的数据集


如果你有用过Bubbliiiing up主的代码,你将很快就能上手。数据集采用的是VOC的形式


VOCdevkit/
`-- VOC2007
    |-- Annotations  (存放xml标签文件)
    |-- ImageSets
    |   `-- Main
    `-- JPEGImages (存放图像)

在model_data中新建一个new_classes.txt,里面写入自己的类。运行voc_annotation.py,会在当前目录生成2007_train.txt文件和2007_val.txt文件。(可以检查一下里面有没有生成成功)


在train.py中,将classes_path修改为model_data/new_classes.txt【等预测的时候,也是需要在yolo.py中修改这里】


然后根据需要修改其他超参即可训练,训练权重会保存在logs文件中(默认保存权值,不含网络结构)


预测



image.png

参数说明:下面终端的输入都是可选的


--predict:预测模式


--pruned:开启剪枝预测或训练


--image:图像检测


--video:开始视频检测


--video_path:视频路径


--camid:摄像头id 默认0


--fps:FPS测试


--dir_predict:对一个文件夹下图像进行预测


--phi:可以选择s,m,l,x等


--input_shape:网络输入大小,默认640


--confidence:置信度阈值


--nms_iou:iou阈值


--num_classes:类别数量,默认80


--fuse:是否开启卷积层和BN层融合加速,默认False


终端输入:


# 图像预测
python demo.py --predict --image
# 视频预测
python demo.py --predict --video --camdi 0
# fps测试
python demo.py --predict --fps

默认预测都为yolox_s,如果要指定其他网络,输入:(需要注意的是在yolo.py修改权重路径,如果是自己数据集,还需要修改classes_path)


# 使用yolox_l预测
python demo.py --predict --image --phi l

Conv与BN层的融合推理加速


其他命令可以搭配使用,比如采用conv和bn融合的方式进行推理


python demo.py --predict --image --fuse

通过测试发现FPS提升了3帧/s左右(我的GPU是1650)


日志文件的保存


本项目采用loguru工具捕获日志,检测和训练中的一些日志记录会自动记录,保存在logs文件下,一个log文件的大小我设置的上限大小为1 MB,如果超过该范围,会自动生成一个新的.log文件,可以自己修改这个值,或者修改日志保存时间(以免保存了太多的日志)。如果不想要这个功能,可以找到相应的位置注释掉即可。


这里只是帮助大家造轮子,用尽可能简单的代码实现一些功能,不用大家再去看复杂的工程代码,最终的效果需要自己耐心调试,慢慢“炼丹”!



相关实践学习
【涂鸦即艺术】基于云应用开发平台CAP部署AI实时生图绘板
【涂鸦即艺术】基于云应用开发平台CAP部署AI实时生图绘板
目录
相关文章
|
机器学习/深度学习 PyTorch 算法框架/工具
pytorch中的模型剪枝
pytorch中的模型剪枝
238 0
|
2月前
|
机器学习/深度学习 数据采集 人工智能
PyTorch学习实战:AI从数学基础到模型优化全流程精解
本文系统讲解人工智能、机器学习与深度学习的层级关系,涵盖PyTorch环境配置、张量操作、数据预处理、神经网络基础及模型训练全流程,结合数学原理与代码实践,深入浅出地介绍激活函数、反向传播等核心概念,助力快速入门深度学习。
163 1
|
6月前
|
机器学习/深度学习 PyTorch API
PyTorch量化感知训练技术:模型压缩与高精度边缘部署实践
本文深入探讨神经网络模型量化技术,重点讲解训练后量化(PTQ)与量化感知训练(QAT)两种主流方法。PTQ通过校准数据集确定量化参数,快速实现模型压缩,但精度损失较大;QAT在训练中引入伪量化操作,使模型适应低精度环境,显著提升量化后性能。文章结合PyTorch实现细节,介绍Eager模式、FX图模式及PyTorch 2导出量化等工具,并分享大语言模型Int4/Int8混合精度实践。最后总结量化最佳策略,包括逐通道量化、混合精度设置及目标硬件适配,助力高效部署深度学习模型。
905 21
PyTorch量化感知训练技术:模型压缩与高精度边缘部署实践
|
1月前
|
边缘计算 人工智能 PyTorch
130_知识蒸馏技术:温度参数与损失函数设计 - 教师-学生模型的优化策略与PyTorch实现
随着大型语言模型(LLM)的规模不断增长,部署这些模型面临着巨大的计算和资源挑战。以DeepSeek-R1为例,其671B参数的规模即使经过INT4量化后,仍需要至少6张高端GPU才能运行,这对于大多数中小型企业和研究机构来说成本过高。知识蒸馏作为一种有效的模型压缩技术,通过将大型教师模型的知识迁移到小型学生模型中,在显著降低模型复杂度的同时保留核心性能,成为解决这一问题的关键技术之一。
|
2月前
|
机器学习/深度学习 存储 PyTorch
Neural ODE原理与PyTorch实现:深度学习模型的自适应深度调节
Neural ODE将神经网络与微分方程结合,用连续思维建模数据演化,突破传统离散层的限制,实现自适应深度与高效连续学习。
124 3
Neural ODE原理与PyTorch实现:深度学习模型的自适应深度调节
|
8月前
|
机器学习/深度学习 JavaScript PyTorch
9个主流GAN损失函数的数学原理和Pytorch代码实现:从经典模型到现代变体
生成对抗网络(GAN)的训练效果高度依赖于损失函数的选择。本文介绍了经典GAN损失函数理论,并用PyTorch实现多种变体,包括原始GAN、LS-GAN、WGAN及WGAN-GP等。通过分析其原理与优劣,如LS-GAN提升训练稳定性、WGAN-GP改善图像质量,展示了不同场景下损失函数的设计思路。代码实现覆盖生成器与判别器的核心逻辑,为实际应用提供了重要参考。未来可探索组合优化与自适应设计以提升性能。
651 7
9个主流GAN损失函数的数学原理和Pytorch代码实现:从经典模型到现代变体
|
3月前
|
PyTorch 算法框架/工具 异构计算
PyTorch 2.0性能优化实战:4种常见代码错误严重拖慢模型
我们将深入探讨图中断(graph breaks)和多图问题对性能的负面影响,并分析PyTorch模型开发中应当避免的常见错误模式。
225 9
|
5月前
|
机器学习/深度学习 存储 PyTorch
PyTorch + MLFlow 实战:从零构建可追踪的深度学习模型训练系统
本文通过使用 Kaggle 数据集训练情感分析模型的实例,详细演示了如何将 PyTorch 与 MLFlow 进行深度集成,实现完整的实验跟踪、模型记录和结果可复现性管理。文章将系统性地介绍训练代码的核心组件,展示指标和工件的记录方法,并提供 MLFlow UI 的详细界面截图。
237 2
PyTorch + MLFlow 实战:从零构建可追踪的深度学习模型训练系统
|
4月前
|
机器学习/深度学习 数据可视化 PyTorch
Flow Matching生成模型:从理论基础到Pytorch代码实现
本文将系统阐述Flow Matching的完整实现过程,包括数学理论推导、模型架构设计、训练流程构建以及速度场学习等关键组件。通过本文的学习,读者将掌握Flow Matching的核心原理,获得一个完整的PyTorch实现,并对生成模型在噪声调度和分数函数之外的发展方向有更深入的理解。
1669 0
Flow Matching生成模型:从理论基础到Pytorch代码实现
|
5月前
|
机器学习/深度学习 PyTorch 算法框架/工具
提升模型泛化能力:PyTorch的L1、L2、ElasticNet正则化技术深度解析与代码实现
本文将深入探讨L1、L2和ElasticNet正则化技术,重点关注其在PyTorch框架中的具体实现。关于这些技术的理论基础,建议读者参考相关理论文献以获得更深入的理解。
164 4
提升模型泛化能力:PyTorch的L1、L2、ElasticNet正则化技术深度解析与代码实现

热门文章

最新文章

推荐镜像

更多