量化部署必卷 | EasyQuant量化通过Scale优化轻松超越TensorRT量化(二)

简介: 量化部署必卷 | EasyQuant量化通过Scale优化轻松超越TensorRT量化(二)

4、实验


4.1、INT8与INT7的对比

1、图像分类

image.png

2、目标检测

image.png

3、人脸识别

4.2、INT7训练后量化

4.3、在小于7-bits时的比较


5、总结


本文从保持量化精度和部署延迟的角度,提出了一种基于Scale优化的方法来提高训练后的量化。作者提出的INT7量化推理不依赖于任何特定的框架,可以应用于任何线性训练后方案,以提高推理速度和准确性。它有利于真正的工业INT8训练后量化,而没有复杂的量化感知微调。

实验表明,该方法可以在各种任务和卷积结构中获得更好的量化模型精度。通过设计Int16中间存储和整数Winograd算法,在实际硬件平台上,与TRT方法相比可以以更低的精度降低进一步提高推理速度。


6、参考


[1].EasyQuant: Post-training Quantization via Scale Optimization.


7、推荐阅读


FasterX实时目标检测 | 依托NanoDet思想,使用辅助Head进一步提升YOLOX性能

量化部署篇 | Vision Transformer应该如何进行PTQ量化?这个方法或许可以参考!

3D检测经典 | 第一个Anchor-Free、第一个NMS-Free 3D目标检测算法!!!

相关文章
|
消息中间件 存储 负载均衡
微服务与分布式系统设计看这篇就够了!
【10月更文挑战第12天】 在现代软件架构中,微服务和分布式系统设计已经成为构建可扩展、灵活和可靠应用程序的主流方法。本文将深入探讨微服务架构的核心概念、设计原则和挑战,并提供一些关于如何在分布式系统中实现微服务的实用指导。
483 2
|
监控 Oracle Java
JVM工作原理与实战(一):初识JVM
JVM作为Java程序的运行环境,其负责解释和执行字节码,管理内存,确保安全,支持多线程和提供性能监控工具,以及确保程序的跨平台运行。同时,JVM还具备动态优化功能,可以根据实际运行情况进行调整和优化。本文主要介绍了JVM的概念、JVM的三大核心功能、常见的JVM虚拟机等内容。
820 4
|
Linux Apache
Linux设置开机启动
以上步骤允许您在Linux系统上配置开机启动服务或程序。确保将"service-name"替换为实际要配置的服务或程序的名称。
434 0
|
监控 物联网 Java
打造高可用系统:深入了解心跳检测机制
本文介绍了分布式系统中**心跳检测**的重要机制,用于监测系统节点的健康状态和通信畅通。心跳检测通过定期发送信号,若节点在预定期限内未响应则视为可能失效。处理机制包括重试、报警和自动修复。文章还提到了**周期检测**和**累计失效检测**两种策略,并给出Java代码示例展示心跳检测实现。此外,列举了心跳检测在分布式数据库、微服务和物联网等场景的应用,以及优化策略如动态调整心跳频率和优化超时机制。最后,强调了心跳检测对系统稳定性和高可用性的关键作用。
2170 2
|
机器学习/深度学习 存储 算法
量化部署必卷 | EasyQuant量化通过Scale优化轻松超越TensorRT量化(一)
量化部署必卷 | EasyQuant量化通过Scale优化轻松超越TensorRT量化(一)
419 0
阿里云资源包到期通知及添加联系人设置操作指导
资源包为预付费的抵扣包,是指您根据业务量级预估一次性付费购买相应规格的商品资源包。自购买日起,一年内有效,有效期内产生的计费调用量优先使用资源包抵扣额度,超出有效期未抵扣的资源包额度自动失效。资源包过期或额度耗尽时,服务将会自动切换为后付费进行按量计费。为了避免购买的资源包超出有效期,额度自动失效。设置资源包到期通知后,则当资源包快到期时,会通过短信、邮箱或站内信方式向您推送通知。阿里云虽然提供了资源包到期通知设置,但是由于对阿里云控制台的不熟悉,往往不知如果进行开启和关闭以及修改添加联系人。本文简单介绍设置资源包到期通知及修改联系人操作步骤,以供参考。
1436 1
阿里云资源包到期通知及添加联系人设置操作指导
|
SQL 关系型数据库 MySQL
【Unity 3D】C#从mysql数据库中读取、封装SQL语句(附源码)
【Unity 3D】C#从mysql数据库中读取、封装SQL语句(附源码)
532 0
|
机器学习/深度学习 存储 算法
量化部署必卷 | EasyQuant量化通过Scale优化轻松超越TensorRT量化
量化部署必卷 | EasyQuant量化通过Scale优化轻松超越TensorRT量化
934 0
量化部署必卷 | EasyQuant量化通过Scale优化轻松超越TensorRT量化
|
安全 数据安全/隐私保护
[ACTF新生赛2020]fungame 题解
[ACTF新生赛2020]fungame 题解
277 0