解读deepLabV3+时遇到的问题总结

简介: 环境问题python :3.10.12ModuleNotFoundError: No module named ‘torchvision.models.utils起初pip以下这个包,也没有解决问题;后来发现是版本的问题。

环境问题

python :3.10.12

ModuleNotFoundError: No module named ‘torchvision.models.utils

起初pip以下这个包,也没有解决问题;后来发现是版本的问题。

#from torchvision.models.utils import load_state_dict_from_url
from torch.hub import load_state_dict_from_url

No module named ‘visdom’

  1. pip该包。
pip install visdom 

接着出现该问题:

pip._vendor.urllib3.exceptions.ReadTimeoutError: HTTPSConnectionPool(host=‘files.pythonhosted.org’, port=443): Read timed out.

  1. pip如下包:
pip install jsonpatch
  1. 成功后再次执行步骤1即可。

V3+由来

V3+继承了,V3编码的部分,但是V3的解码器部分因为多层卷积,导致分辨率下降,丢失了很多细节,还原为原图相关不太好。因此在解码器部分加了一个简单的操作,既保留了边界特征,还不增大计算量!如图下图模型:

994bea3b9d4f42aea33f0c0cb6d95c57.png

空洞卷积

语义分割网络,通常会经过一系列下采样对图片进行压缩,然后再经过一系列上采样还原图片的大小。通常对于分类任务我们都是对图像进行 32 倍下采样(比如224*224分辨率的图片->变成7*7),然后再经过一系列上采样还原为原图,如果下采样倍率过大时,想要还原为原图像就没那么容易。丢失细节信息,所以在语义分割效果不是那么理想。

==因此要想增大感受野就得下采样,但是下采样会丢失信息。==有没有两全其美的办法呢?

那就是空洞卷积。空洞卷积可以在不改变图片分辨率的情况下,增加感受野。

  • 空洞卷积设计之初是为了获取长程,也就是距离较远像素之间的相关信息,采用 rate 较大空洞卷积有利一些大目标分割有效,而对于小目标来说则有弊无利。想要很好同时处理大小目标,则需要设计一个好的空洞网络。

计算卷积\池化\反卷积\空洞卷积后图像大小的方法:

7a25e400fe2a427a9a6773aaa5dec831.png

前向传播流程:

注意是backbone输出了两个特征。一组是encoder的’out’经过多层卷积,包含着丰富特征的高阶特征,一组是Decoder的’low_level’,只进行了几层的卷积,保留着边界特征的底层特征。


网络异常,图片无法展示
|

总结

第一次接触,backbone的卷积网络,研究了老半天,才弄懂网络结构,目前只有这么浅显的理解,后续如果有更深入的问题,会继续补充。

目录
相关文章
|
算法 计算机视觉 开发者
镜头边界检测(上)| 学习笔记
快速学习镜头边界检测(上),介绍了镜头边界检测(上)系统机制, 以及在实际应用过程中如何使用。
镜头边界检测(上)| 学习笔记
|
11月前
|
SQL 数据库连接 Linux
数据库编程:在PHP环境下使用SQL Server的方法。
看看你吧,就像一个调皮的小丑鱼在一片广阔的数据库海洋中游弋,一路上吞下大小数据如同海中的珍珠。不管有多少难关,只要记住这个流程,剩下的就只是探索未知的乐趣,沉浸在这个充满挑战的数据库海洋中。
329 16
|
机器学习/深度学习 计算机视觉
【YOLOv8改进 - 注意力机制】c2f结合CBAM:针对卷积神经网络(CNN)设计的新型注意力机制
【YOLOv8改进 - 注意力机制】c2f结合CBAM:针对卷积神经网络(CNN)设计的新型注意力机制
|
编解码 数据可视化 定位技术
60行代码就可以训练/微调 Segment Anything 2 (SAM 2)
本文演示了如何在仅60行代码内(不包括标注和导入)对SAM2进行微调。
1378 1
60行代码就可以训练/微调 Segment Anything 2 (SAM 2)
|
API 计算机视觉 开发者
【Python】已解决:(pip安装PIL库报错) ERROR: Could not find a version that satisfies the requirement PIL (from v
【Python】已解决:(pip安装PIL库报错) ERROR: Could not find a version that satisfies the requirement PIL (from v
2782 0
|
并行计算 Linux C语言
【Deepin 20系统】解决Error: unsupported compiler: 8.3.0. Use --override to override this check.
本文介绍了在Deepin 20系统中解决安装CUDA 10.0时遇到的GCC版本不支持问题的具体步骤。
215 2
|
弹性计算
阿里云账号注册流程图文详解、账户实名认证和申请免费服务器全流程
阿里云账号注册支持手机号、支付宝等验证方式。使用手机号需手动验证,而支付宝等可自动完成实名认证。注册后须进行个人或企业实名认证才能正常使用服务。个人认证推荐使用支付宝快速完成;企业认证也支持支付宝法人扫描完成。完成认证后,可在免费中心申请最长达3个月的免费服务器试用,或选择付费方案获得更多资源。
|
算法 Java Linux
java制作海报一:java使用Graphics2D 在图片上写字,文字换行算法详解
这篇文章介绍了如何在Java中使用Graphics2D在图片上绘制文字,并实现自动换行的功能。
901 0
|
机器学习/深度学习 算法
时间复杂度与O(1), O(n), O(logn), O(nlogn) 的区别
时间复杂度与O(1), O(n), O(logn), O(nlogn) 的区别
771 0