Inception 新结构 | 究竟卷积与Transformer如何结合才是最优的?(二)

简介: Inception 新结构 | 究竟卷积与Transformer如何结合才是最优的?(二)

3实验


3.1 消融实验

1、Inception token mixer

image.png表 5

为了评估Inception mixer中组件的效果,越来越多地从完整模型中删除每个分支,然后在表 5 中报告结果,其中 √ 和 × 表示是否启用了相应的分支。可以观察到,将注意力与卷积和最大池化相结合可以比仅注意力混合器获得更好的准确度,同时使用更少的计算复杂度,这暗示了 Inception Token Mixer 的有效性。

image.png

图4

为了进一步探索这个方案,图 4 可视化了 Inception mixerAttentionMaxPoolDwConv 分支的傅里叶谱。可以看到Attention mixer在低频上有更高的浓度;使用high-frequency mixer,即卷积和最大池可以促使模型学习高频信息。

总体而言,这些结果证明了 Inception mixer 在扩展 Transformer 在频谱中的感知能力方面的有效性。

2、Frequency ramp structure

表5

在表5中可以清楚地看到,具有 Cl/C↑、Ch/C↓ 的模型优于其他两个模型,这与之前的研究一致。因此,这表明了Frequency ramp structure的合理性及其在学习辨别视觉表征方面的潜力。

3、可视化

图 5

在图 5 中可视化了 iFormer-SSwin-T 模型在 ImageNet-1K 上训练的 Grad-CAM 激活图。可以看出,与Swin相比,iFormer能够更准确、更完整地定位物体。例如,在蜂鸟图像中,iFormer 会跳过树枝并准确地关注包括尾巴在内的整只鸟。

3.2 图像分类

3.3 目标检测与实例分割

3.4 语义分割


4参考


[1].Inception Transformer


5推荐阅读


即插即用 | SIoU 实现50.3 AP+7.6ms检测速度精度、速度完美超越YoloV5、YoloX

Sparse RCNN再升级 | ResNet50在不需要NMS和二分匹配的情况下达到48.1AP

即插即用 | RandomMix 集百家之长实现超越Mixup的数据增强方法!

相关文章
|
2月前
|
机器学习/深度学习 存储 自然语言处理
卷积神经元网络CNN基础
卷积神经元网络CNN基础
37 1
|
4月前
|
机器学习/深度学习
RNN 和 Transformer 复杂度比较
RNN 和 Transformer 复杂度比较
60 0
|
3月前
|
机器学习/深度学习 存储 算法
模型部署系列 | 卷积Backbone量化技巧集锦
模型部署系列 | 卷积Backbone量化技巧集锦
42 0
|
9月前
|
机器学习/深度学习 自然语言处理 索引
【Transformer系列(4)】Transformer模型结构超详细解读
【Transformer系列(4)】Transformer模型结构超详细解读
194 0
【Transformer系列(4)】Transformer模型结构超详细解读
|
12月前
|
机器学习/深度学习 SQL 编解码
Inception 新结构 | 究竟卷积与Transformer如何结合才是最优的?(一)
Inception 新结构 | 究竟卷积与Transformer如何结合才是最优的?(一)
179 0
|
12月前
|
机器学习/深度学习 编解码 算法
What?UFO! | UFO-ViT用X-Norm让你的Transformer模型回归线性复杂度(一)
What?UFO! | UFO-ViT用X-Norm让你的Transformer模型回归线性复杂度(一)
74 0
|
12月前
|
机器学习/深度学习 数据挖掘 计算机视觉
What?UFO! | UFO-ViT用X-Norm让你的Transformer模型回归线性复杂度(二)
What?UFO! | UFO-ViT用X-Norm让你的Transformer模型回归线性复杂度(二)
107 0
|
12月前
|
编解码 数据可视化 计算机视觉
全新池化方法AdaPool | 让ResNet、DenseNet、ResNeXt等在所有下游任务轻松涨点(二)
全新池化方法AdaPool | 让ResNet、DenseNet、ResNeXt等在所有下游任务轻松涨点(二)
170 0
|
12月前
|
机器学习/深度学习 编解码 算法
全新池化方法AdaPool | 让ResNet、DenseNet、ResNeXt等在所有下游任务轻松涨点(一)
全新池化方法AdaPool | 让ResNet、DenseNet、ResNeXt等在所有下游任务轻松涨点(一)
166 0
|
12月前
|
PyTorch 算法框架/工具 计算机视觉
RMNet推理去除残差结构让ResNet、MobileNet、RepVGG Great Again(必看必看)(二)
RMNet推理去除残差结构让ResNet、MobileNet、RepVGG Great Again(必看必看)(二)
126 0

相关实验场景

更多