解读deepLabV3+时遇到的问题总结

简介: 环境问题python :3.10.12ModuleNotFoundError: No module named ‘torchvision.models.utils起初pip以下这个包,也没有解决问题;后来发现是版本的问题。

环境问题

python :3.10.12

ModuleNotFoundError: No module named ‘torchvision.models.utils

起初pip以下这个包,也没有解决问题;后来发现是版本的问题。

#from torchvision.models.utils import load_state_dict_from_url
from torch.hub import load_state_dict_from_url

No module named ‘visdom’

  1. pip该包。
pip install visdom 

接着出现该问题:

pip._vendor.urllib3.exceptions.ReadTimeoutError: HTTPSConnectionPool(host=‘files.pythonhosted.org’, port=443): Read timed out.

  1. pip如下包:
pip install jsonpatch
  1. 成功后再次执行步骤1即可。

V3+由来

V3+继承了,V3编码的部分,但是V3的解码器部分因为多层卷积,导致分辨率下降,丢失了很多细节,还原为原图相关不太好。因此在解码器部分加了一个简单的操作,既保留了边界特征,还不增大计算量!如图下图模型:

994bea3b9d4f42aea33f0c0cb6d95c57.png

空洞卷积

语义分割网络,通常会经过一系列下采样对图片进行压缩,然后再经过一系列上采样还原图片的大小。通常对于分类任务我们都是对图像进行 32 倍下采样(比如224*224分辨率的图片->变成7*7),然后再经过一系列上采样还原为原图,如果下采样倍率过大时,想要还原为原图像就没那么容易。丢失细节信息,所以在语义分割效果不是那么理想。

==因此要想增大感受野就得下采样,但是下采样会丢失信息。==有没有两全其美的办法呢?

那就是空洞卷积。空洞卷积可以在不改变图片分辨率的情况下,增加感受野。

  • 空洞卷积设计之初是为了获取长程,也就是距离较远像素之间的相关信息,采用 rate 较大空洞卷积有利一些大目标分割有效,而对于小目标来说则有弊无利。想要很好同时处理大小目标,则需要设计一个好的空洞网络。

计算卷积\池化\反卷积\空洞卷积后图像大小的方法:

7a25e400fe2a427a9a6773aaa5dec831.png

前向传播流程:

注意是backbone输出了两个特征。一组是encoder的’out’经过多层卷积,包含着丰富特征的高阶特征,一组是Decoder的’low_level’,只进行了几层的卷积,保留着边界特征的底层特征。


网络异常,图片无法展示
|

总结

第一次接触,backbone的卷积网络,研究了老半天,才弄懂网络结构,目前只有这么浅显的理解,后续如果有更深入的问题,会继续补充。

目录
相关文章
|
6月前
|
机器学习/深度学习 PyTorch 算法框架/工具
Pytorch CIFAR10图像分类 Swin Transformer篇(一)
Pytorch CIFAR10图像分类 Swin Transformer篇(一)
|
6月前
|
机器学习/深度学习 数据可视化 算法
Pytorch CIFAR10图像分类 Swin Transformer篇(二)
Pytorch CIFAR10图像分类 Swin Transformer篇(二)
|
机器学习/深度学习 编解码
EfficientNet介绍
EfficientNet介绍
154 0
EfficientNet介绍
|
机器学习/深度学习 编解码 自然语言处理
EfficientNet、ShuffleNet、NFNet…你都掌握了吗?一文总结图像分类必备经典模型(三)
EfficientNet、ShuffleNet、NFNet…你都掌握了吗?一文总结图像分类必备经典模型(三)
202 0
EfficientNet、ShuffleNet、NFNet…你都掌握了吗?一文总结图像分类必备经典模型(三)
|
机器学习/深度学习 编解码
UNet介绍及其相关思考
UNet介绍及其相关思考
|
机器学习/深度学习 人工智能 搜索推荐
DeepLab、DeepLabv3、RefineNet、PSPNet…你都掌握了吗?一文总结图像分割必备经典模型(二)(2)
DeepLab、DeepLabv3、RefineNet、PSPNet…你都掌握了吗?一文总结图像分割必备经典模型(二)
379 0
|
机器学习/深度学习 编解码 算法
DeepLab、DeepLabv3、RefineNet、PSPNet…你都掌握了吗?一文总结图像分割必备经典模型(二)(1)
DeepLab、DeepLabv3、RefineNet、PSPNet…你都掌握了吗?一文总结图像分割必备经典模型(二)
174 0
|
计算机视觉
CVPR2023最新Backbone |FasterNet远超ShuffleNet、MobileNet、MobileViT等模型(二)
CVPR2023最新Backbone |FasterNet远超ShuffleNet、MobileNet、MobileViT等模型(二)
224 0
|
机器学习/深度学习 安全 数据处理
CVPR2023最新Backbone |FasterNet远超ShuffleNet、MobileNet、MobileViT等模型(一)
CVPR2023最新Backbone |FasterNet远超ShuffleNet、MobileNet、MobileViT等模型(一)
372 0
|
机器学习/深度学习 数据采集 编解码
R-FCN、Mask RCNN、YoLo、SSD、FPN、RetinaNet…你都掌握了吗?一文总结目标识别必备经典模型(1)
R-FCN、Mask RCNN、YoLo、SSD、FPN、RetinaNet…你都掌握了吗?一文总结目标识别必备经典模型
170 0