超实时语义分割 | DWR-Seg超越STDC-1/2、BiSeNet v1/v2,1080ti单卡320+FPS(二)

简介: 超实时语义分割 | DWR-Seg超越STDC-1/2、BiSeNet v1/v2,1080ti单卡320+FPS(二)

3、实验


3.1、消融实验

1、DWR模块中的非共享Region-Residualization

表2-I说明了DWR模块中非共享Region-Residualization('w')和Region-Residualization的结果('w/o')。结果表明,非共享Region-Residualization显著提高了性能。

2、DWR模块中不同感受野的比例

表2-II研究了DWR模块中3个分支(d-1:d-3:d-5)的输出通道数的不同比值α的影响。当调整α时,当比例为2:1:1时,效果最好。

3、DWR模块中Region-Residualization的通道数

表2-III显示了在DWR模块中设置输出通道数与Region-Residualization的输入通道数的不同比率β的结果。当β设置为0.5时,可以获得最佳输出。

4、DWR模块中的非线性

表2-IV说明了在DWR模块中不同程度的非线性的影响。Sitch 1表示没有ReLU的Region-Residualization,Sitch 2表示没有BN的Region-Residualization,Sitch 3表示没有BN的semantic-residualization,Sitch 4表示在semantic-residualization的BN后添加一个ReLU,Sitch5表示在点卷积后添加一个BN。

结果表明,当非线性度较低时,影响显著降低;然而,非线性度的增加并不能提高输出效率。

5、SIR模块中的深度卷积

如表2-V,与BN层(w)进行深度卷积获得的改进小于增加SIR模块中模块数量(w/o)获得的改进。

6、SIR模块中的通道扩展

表2-VI显示了在SIR模块中将开始卷积的通道数扩展到λ次数的效果。当通道数扩展到3倍时,得到了最佳的结果。

7、Block Number

更多Block的收益明显减少,更深的网络不利于并行计算和FPS。

3.2、SOTA对比

1、Cityscapes数据集

2、CamVid数据集


4、参考


[1].DWRSeg: Dilation-wise Residual Network for Real-time Semantic Segmentation.


5、推荐阅读


不盲目 | 客观、科学的看待Pytorch2.0更新的新特性,没你想的那么快!

Efficient-HRNet | EfficientNet思想+HRNet技术会不会更强更快呢?

DETR也需要学习 | DETR-Distill模型蒸馏让DETR系类模型持续发光发热!!!

相关文章
|
人工智能 计算机视觉 Python
【YOLOv8-Seg】实战二:LabVIEW+OpenVINO加速YOLOv8-seg实例分割
【YOLOv8-Seg】实战二:LabVIEW+OpenVINO加速YOLOv8-seg实例分割
487 0
【YOLOv8-Seg】实战二:LabVIEW+OpenVINO加速YOLOv8-seg实例分割
|
存储 机器学习/深度学习 算法
语义检索系统排序模块:基于ERNIE-Gram的Pair-wise和基于RocketQA的CrossEncoder训练单塔模型
语义检索系统排序模块:基于ERNIE-Gram的Pair-wise和基于RocketQA的CrossEncoder训练单塔模型
语义检索系统排序模块:基于ERNIE-Gram的Pair-wise和基于RocketQA的CrossEncoder训练单塔模型
|
7月前
|
编解码 算法 知识图谱
ICCV 2023 | DAT:利用双重聚合的Transformer进行图像超分
ICCV 2023 | DAT:利用双重聚合的Transformer进行图像超分
170 0
|
7月前
|
机器学习/深度学习 5G 知识图谱
视觉Backbone怎么使用1/8的FLOPs实现比Baseline更高的精度?
视觉Backbone怎么使用1/8的FLOPs实现比Baseline更高的精度?
75 0
|
机器学习/深度学习 人工智能 计算机视觉
【YOLOv8-Seg】实战三:LabVIEW+TensoRT实现YOLOv8-seg的极速推理(毫秒级)
【YOLOv8-Seg】实战三:LabVIEW+TensoRT实现YOLOv8-seg的极速推理(毫秒级)
413 0
【YOLOv8-Seg】实战三:LabVIEW+TensoRT实现YOLOv8-seg的极速推理(毫秒级)
|
监控 自动驾驶 数据可视化
超实时语义分割 | DWR-Seg超越STDC-1/2、BiSeNet v1/v2,1080ti单卡320+FPS(一)
超实时语义分割 | DWR-Seg超越STDC-1/2、BiSeNet v1/v2,1080ti单卡320+FPS(一)
203 0
|
机器学习/深度学习 数据可视化 计算机视觉
YOLO超快时代终结了 | RT-DETR用114FPS实现54.8AP,远超YOLOv8(二)
YOLO超快时代终结了 | RT-DETR用114FPS实现54.8AP,远超YOLOv8(二)
1152 0
|
机器学习/深度学习 并行计算 监控
YOLO超快时代终结了 | RT-DETR用114FPS实现54.8AP,远超YOLOv8(一)
YOLO超快时代终结了 | RT-DETR用114FPS实现54.8AP,远超YOLOv8(一)
549 0
|
并行计算 算法 数据可视化
432.4 FPS 快STDC 2.84倍 | LPS-Net 结合内存、FLOPs、CUDA实现超快语义分割模型(二)
432.4 FPS 快STDC 2.84倍 | LPS-Net 结合内存、FLOPs、CUDA实现超快语义分割模型(二)
123 0
|
机器学习/深度学习 编解码 并行计算
432.4 FPS 快STDC 2.84倍 | LPS-Net 结合内存、FLOPs、CUDA实现超快语义分割模型(一)
432.4 FPS 快STDC 2.84倍 | LPS-Net 结合内存、FLOPs、CUDA实现超快语义分割模型(一)
200 0