DL之DeconvNet:DeconvNet算法的简介(论文介绍)、架构详解、案例应用等配图集合之详细攻略

简介: DL之DeconvNet:DeconvNet算法的简介(论文介绍)、架构详解、案例应用等配图集合之详细攻略

DeconvNet算法的简介(论文介绍)


       DeconvNet网络架构,是由Convolution network、Deconvolution network两种架构组成。


Convolution network:feature extractor,采用VGG-16提取特征;

Deconvolution network:shape generator,通过上采样,计算像素的类别得分图。

Abstract  

      We propose a novel semantic segmentation algorithm by  learning a deconvolution network. We learn the network  on top of the convolutional layers adopted from VGG 16-  layer net. The deconvolution network is composed of deconvolution  and unpooling layers, which identify pixel-wise  class labels and predict segmentation masks. We apply the  trained network to each proposal in an input image, and  construct the final semantic segmentation map by combining  the results from all proposals in a simple manner. The  proposed algorithm mitigates the limitations of the existing  methods based on fully convolutional networks by integrating  deep deconvolution network and proposal-wise  prediction; our segmentation method typically identifies detailed  structures and handles objects in multiple scales naturally.  Our network demonstrates outstanding performance  in PASCAL VOC 2012 dataset, and we achieve the best accuracy  (72.5%) among the methods trained with no external  data through ensemble with the fully convolutional network.

      本文提出了一种新的基于反卷积网络的语义分割算法。我们学习了VGG 16层网在卷积层之上的网络。反卷积网络由反褶积层和反池层组成,它们识别像素级标签并预测分割掩码。我们将训练好的网络应用于输入图像中的每个提案,并将所有提案的结果以一种简单的方式结合起来,构造出最终的语义分割图。该算法将深度反卷积网络与建议预测相结合,克服了现有全卷积网络方法的局限性;我们的分割方法通常识别详细的结构和处理对象在多个尺度自然。我们的网络在PASCAL VOC 2012数据集中表现出色,通过全卷积网络集成,在没有外部数据训练的方法中,我们的准确率最高(72.5%)。

Conclusion  

      We proposed a novel semantic segmentation algorithm  by learning a deconvolution network. The proposed deconvolution  network is suitable to generate dense and pre-cise object segmentation masks since coarse-to-fine structures  of an object is reconstructed progressively through  a sequence of deconvolution operations. Our algorithm  based on instance-wise prediction is advantageous to handle  object scale variations by eliminating the limitation  of fixed-size receptive field in the fully convolutional network.  We further proposed an ensemble approach, which  combines the outputs of the proposed algorithm and FCNbased  method, and achieved substantially better performance  thanks to complementary characteristics of both algorithms.  Our network demonstrated the state-of-the-art  performance in PASCAL VOC 2012 segmentation benchmark  among the methods trained with no external data.

      本文提出了一种新的基于反卷积网络的语义分割算法。该反褶积网络通过一系列的反卷积操作,逐步重构出由粗到细的目标结构,适用于生成密集的预分割掩码。我们的基于实例预测的算法消除了全卷积网络中固定大小接受域的限制,有利于处理对象尺度变化。我们进一步提出了一种集成方法,将所提算法的输出与基于FCN的方法相结合,由于两种算法的互补特性,取得了较好的性能。在没有外部数据训练的方法中,我们的网络在PASCAL VOC 2012分割基准测试中展示了最先进的性能。



论文

Hyeonwoo Noh, SeunghoonHong, BohyungHan.

Learning deconvolution network for semantic segmentation, ICLR, 2015.

https://arxiv.org/abs/1505.04366


 


相关文章
|
2月前
|
人工智能 自然语言处理 开发工具
统一多模态 Transformer 架构在跨模态表示学习中的应用与优化
本文介绍统一多模态 Transformer(UMT)在跨模态表示学习中的应用与优化,涵盖模型架构、实现细节与实验效果,探讨其在图文检索、图像生成等任务中的卓越性能。
统一多模态 Transformer 架构在跨模态表示学习中的应用与优化
|
3月前
|
存储 编解码 Serverless
Serverless架构下的OSS应用:函数计算FC自动处理图片/视频转码(演示水印添加+缩略图生成流水线)
本文介绍基于阿里云函数计算(FC)和对象存储(OSS)构建Serverless媒体处理流水线,解决传统方案资源利用率低、运维复杂、成本高等问题。通过事件驱动机制实现图片水印添加、多规格缩略图生成及视频转码优化,支持毫秒级弹性伸缩与精确计费,提升处理效率并降低成本,适用于高并发媒体处理场景。
175 0
|
2月前
|
人工智能 数据可视化 Java
什么是低代码(Low-Code)?低代码核心架构技术解析与应用展望
低代码开发正成为企业应对业务增长与IT人才短缺的重要解决方案。相比传统开发方式效率提升60%,预计2026年市场规模达580亿美元。它通过可视化界面与少量代码,让非专业开发者也能快速构建应用,推动企业数字化转型。随着AI技术发展,低代码与AIGC结合,正迈向智能化开发新时代。
|
24天前
|
机器学习/深度学习 算法 数据挖掘
没发论文的注意啦!重磅更新!GWO-BP-AdaBoost预测!灰狼优化、人工神经网络与AdaBoost集成学习算法预测研究(Matlab代码实现)
没发论文的注意啦!重磅更新!GWO-BP-AdaBoost预测!灰狼优化、人工神经网络与AdaBoost集成学习算法预测研究(Matlab代码实现)
|
18天前
|
机器学习/深度学习 算法 新能源
【优化调度】基于matlab粒子群算法求解水火电经济调度优化问题研究(Matlab代码实现)
【优化调度】基于matlab粒子群算法求解水火电经济调度优化问题研究(Matlab代码实现)
|
20天前
|
算法 机器人 定位技术
基于机器视觉和Dijkstra算法的平面建筑群地图路线规划matlab仿真
本程序基于机器视觉与Dijkstra算法,实现平面建筑群地图的路径规划。通过MATLAB 2022A读取地图图像,识别障碍物并进行路径搜索,支持鼠标选择起点与终点,最终显示最优路径及长度,适用于智能导航与机器人路径规划场景。
|
21天前
|
机器学习/深度学习 算法 数据安全/隐私保护
基于PSO粒子群优化的XGBoost时间序列预测算法matlab仿真
本程序基于Matlab 2024b实现,结合粒子群优化(PSO)与XGBoost算法,用于时间序列预测。通过PSO优化XGBoost超参数,提升预测精度。程序包含完整注释与操作视频,运行后生成预测效果图及性能评估指标RMSE。
|
18天前
|
传感器 并行计算 算法
【无人机编队】基于非支配排序遗传算法II NSGA-II高效可行的无人机离线集群仿真研究(Matlab代码实现)
【无人机编队】基于非支配排序遗传算法II NSGA-II高效可行的无人机离线集群仿真研究(Matlab代码实现)
|
18天前
|
存储 算法 安全
【无人机】基于灰狼优化算法的无人机路径规划问题研究(Matlab代码实现)
【无人机】基于灰狼优化算法的无人机路径规划问题研究(Matlab代码实现)
111 0

热门文章

最新文章