超实时语义分割 | DWR-Seg超越STDC-1/2、BiSeNet v1/v2,1080ti单卡320+FPS(二)

简介: 超实时语义分割 | DWR-Seg超越STDC-1/2、BiSeNet v1/v2,1080ti单卡320+FPS(二)

3、实验


3.1、消融实验

1、DWR模块中的非共享Region-Residualization

表2-I说明了DWR模块中非共享Region-Residualization('w')和Region-Residualization的结果('w/o')。结果表明,非共享Region-Residualization显著提高了性能。

2、DWR模块中不同感受野的比例

表2-II研究了DWR模块中3个分支(d-1:d-3:d-5)的输出通道数的不同比值α的影响。当调整α时,当比例为2:1:1时,效果最好。

3、DWR模块中Region-Residualization的通道数

表2-III显示了在DWR模块中设置输出通道数与Region-Residualization的输入通道数的不同比率β的结果。当β设置为0.5时,可以获得最佳输出。

4、DWR模块中的非线性

表2-IV说明了在DWR模块中不同程度的非线性的影响。Sitch 1表示没有ReLU的Region-Residualization,Sitch 2表示没有BN的Region-Residualization,Sitch 3表示没有BN的semantic-residualization,Sitch 4表示在semantic-residualization的BN后添加一个ReLU,Sitch5表示在点卷积后添加一个BN。

结果表明,当非线性度较低时,影响显著降低;然而,非线性度的增加并不能提高输出效率。

5、SIR模块中的深度卷积

如表2-V,与BN层(w)进行深度卷积获得的改进小于增加SIR模块中模块数量(w/o)获得的改进。

6、SIR模块中的通道扩展

表2-VI显示了在SIR模块中将开始卷积的通道数扩展到λ次数的效果。当通道数扩展到3倍时,得到了最佳的结果。

7、Block Number

更多Block的收益明显减少,更深的网络不利于并行计算和FPS。

3.2、SOTA对比

1、Cityscapes数据集

2、CamVid数据集


4、参考


[1].DWRSeg: Dilation-wise Residual Network for Real-time Semantic Segmentation.


5、推荐阅读


不盲目 | 客观、科学的看待Pytorch2.0更新的新特性,没你想的那么快!

Efficient-HRNet | EfficientNet思想+HRNet技术会不会更强更快呢?

DETR也需要学习 | DETR-Distill模型蒸馏让DETR系类模型持续发光发热!!!

相关文章
|
5月前
|
人工智能
Gemini 1.5:最高支持100万tokens,超长上下文有什么用?
【2月更文挑战第2天】Gemini 1.5:最高支持100万tokens,超长上下文有什么用?
201 1
Gemini 1.5:最高支持100万tokens,超长上下文有什么用?
|
人工智能 计算机视觉 Python
【YOLOv8-Seg】实战二:LabVIEW+OpenVINO加速YOLOv8-seg实例分割
【YOLOv8-Seg】实战二:LabVIEW+OpenVINO加速YOLOv8-seg实例分割
408 0
【YOLOv8-Seg】实战二:LabVIEW+OpenVINO加速YOLOv8-seg实例分割
|
4月前
|
机器学习/深度学习 编解码 算法
【YOLOv8改进】MLCA(Mixed local channel attention):混合局部通道注意力(论文笔记+引入代码)
**摘要:** 本文提出轻量级MLCA模块,结合通道、空间、局部及全局信息,提升网络表达效率。在MobileNet-Attention-YOLO(MAY)中应用MLCA,于PASCAL VOC和SMID数据集上对比SE和CA,mAP提升1.0%和1.5%。论文及代码链接提供。MLCA通过局部池化和反池化处理,增强通道交互和空间信息,实现更精确的目标检测。详情见YOLO改进与实战专栏。
|
5月前
|
存储 人工智能 并行计算
加速44%!RT-DETR量化无损压缩优秀实战
加速44%!RT-DETR量化无损压缩优秀实战
190 0
|
机器学习/深度学习 人工智能 计算机视觉
【YOLOv8-Seg】实战三:LabVIEW+TensoRT实现YOLOv8-seg的极速推理(毫秒级)
【YOLOv8-Seg】实战三:LabVIEW+TensoRT实现YOLOv8-seg的极速推理(毫秒级)
370 0
【YOLOv8-Seg】实战三:LabVIEW+TensoRT实现YOLOv8-seg的极速推理(毫秒级)
|
监控 自动驾驶 数据可视化
超实时语义分割 | DWR-Seg超越STDC-1/2、BiSeNet v1/v2,1080ti单卡320+FPS(一)
超实时语义分割 | DWR-Seg超越STDC-1/2、BiSeNet v1/v2,1080ti单卡320+FPS(一)
183 0
|
机器学习/深度学习 编解码 并行计算
432.4 FPS 快STDC 2.84倍 | LPS-Net 结合内存、FLOPs、CUDA实现超快语义分割模型(一)
432.4 FPS 快STDC 2.84倍 | LPS-Net 结合内存、FLOPs、CUDA实现超快语义分割模型(一)
187 0
|
并行计算 算法 数据可视化
432.4 FPS 快STDC 2.84倍 | LPS-Net 结合内存、FLOPs、CUDA实现超快语义分割模型(二)
432.4 FPS 快STDC 2.84倍 | LPS-Net 结合内存、FLOPs、CUDA实现超快语义分割模型(二)
113 0
|
机器学习/深度学习 并行计算 监控
YOLO超快时代终结了 | RT-DETR用114FPS实现54.8AP,远超YOLOv8(一)
YOLO超快时代终结了 | RT-DETR用114FPS实现54.8AP,远超YOLOv8(一)
515 0
|
机器学习/深度学习 数据可视化 计算机视觉
YOLO超快时代终结了 | RT-DETR用114FPS实现54.8AP,远超YOLOv8(二)
YOLO超快时代终结了 | RT-DETR用114FPS实现54.8AP,远超YOLOv8(二)
1036 0