【YOLOv8量化】普通CPU上加速推理可达100+FPS-阿里云开发者社区

【YOLOv8量化】普通CPU上加速推理可达100+FPS

2024-06-07 888

版权

本文内容由阿里云实名注册用户自发贡献，版权归原作者所有，阿里云开发者社区不拥有其著作权，亦不承担相应法律责任。具体规则请查看《阿里云开发者社区用户服务协议》和《阿里云开发者社区知识产权保护指引》。如果您发现本社区中有涉嫌抄袭的内容，填写侵权投诉表单进行举报，一经查实，本社区将立刻删除涉嫌侵权内容。

简介： 【YOLOv8量化】普通CPU上加速推理可达100+FPS

NNCF介绍

OpenVINO2023版本衍生出了一个新支持工具包NNCF(Neural Network Compression Framework – 神经网络压缩框架)，通过对OpenVINO IR格式模型的压缩与量化更好的提升模型在OpenVINO框架上部署的推理性能，github。

https://github.com/openvinotoolkit/nncf

安装NNCF

pip install nncf

NNCF关键特性

训练后压缩算法支持权重压缩与量化，训练时压缩算法支持感知量化、混合精度量化、二值、稀疏、过滤剪枝、运动剪枝等算法。图示如下：

YOLOv8量化压缩

基于NNCF实现YOLOv8预训练模型的训练后量化压缩（PTQ），实现INT8量化YOLOv8模型生成。首先需要使用YOLOv8命令行工具导出OpenVINO格式模型，命令行如下：

yolo export model=yolov8n.pt format=openvino

然后基于YOLOv8框架的函数构建一个YOLOv8模型对应的COCO数据集的Validator，相关的代码如下：

官方给出的代码里面是有个ValidatorClass，但是我发现YOLOv8框架早已经不支持，这里其实主要是构建自己的Dataset跟DataLoader而已，简单粗暴的点是可以自己直接构建，就是要写点代码。我发现了YOLOv8框架里面有个DetectionValidator是可以用的，于是我就用这个，然后直接给一个图像文件夹就可以获取dataloader实例了。准备好验证数据以后，就是最后一步了，启动模型INT8量化，相关的代码如下：