3、实验
3.1、消融实验
1、DWR模块中的非共享Region-Residualization
表2-I说明了DWR模块中非共享Region-Residualization('w')和Region-Residualization的结果('w/o')。结果表明,非共享Region-Residualization显著提高了性能。
2、DWR模块中不同感受野的比例
表2-II研究了DWR模块中3个分支(d-1:d-3:d-5)的输出通道数的不同比值α的影响。当调整α时,当比例为2:1:1时,效果最好。
3、DWR模块中Region-Residualization的通道数
表2-III显示了在DWR模块中设置输出通道数与Region-Residualization的输入通道数的不同比率β的结果。当β设置为0.5时,可以获得最佳输出。
4、DWR模块中的非线性
表2-IV说明了在DWR模块中不同程度的非线性的影响。Sitch 1表示没有ReLU的Region-Residualization,Sitch 2表示没有BN的Region-Residualization,Sitch 3表示没有BN的semantic-residualization,Sitch 4表示在semantic-residualization的BN后添加一个ReLU,Sitch5表示在点卷积后添加一个BN。
结果表明,当非线性度较低时,影响显著降低;然而,非线性度的增加并不能提高输出效率。
5、SIR模块中的深度卷积
如表2-V,与BN层(w)进行深度卷积获得的改进小于增加SIR模块中模块数量(w/o)获得的改进。
6、SIR模块中的通道扩展
表2-VI显示了在SIR模块中将开始卷积的通道数扩展到λ次数的效果。当通道数扩展到3倍时,得到了最佳的结果。
7、Block Number
更多Block的收益明显减少,更深的网络不利于并行计算和FPS。
3.2、SOTA对比
1、Cityscapes数据集
2、CamVid数据集
4、参考
[1].DWRSeg: Dilation-wise Residual Network for Real-time Semantic Segmentation.
5、推荐阅读
不盲目 | 客观、科学的看待Pytorch2.0更新的新特性,没你想的那么快!