开发者社区> wangxiaocvpr> 正文
阿里云
为了无法计算的价值
打开APP
阿里云APP内打开

到底什么是 ROI Pooling Layer ???

简介: 到底什么是 ROI Pooling Layer ???    只知道 faster rcnn 中有 ROI pooling, 而且其他很多算法也都有用这个layer 来做一些事情,如:SINT,检测的文章等等。
+关注继续查看

到底什么是 ROI Pooling Layer ??? 

 

只知道 faster rcnn 中有 ROI pooling, 而且其他很多算法也都有用这个layer 来做一些事情,如:SINT,检测的文章等等。那么,到底什么是 ROI pooling 呢???

参考:http://blog.csdn.net/lanran2/article/details/60143861 

 

在 faster rcnn 中,RPN 会产生很多的候选 proposal,这里出来的是 BBox 的位置,也就是我们感兴趣的区域,即: region of interest (ROI) 。

ROI pooling 操作的对象就是这些 proposal (BBOx)。

 

==>> ROI Pooling 的输入是:

1. RPN layer 前面的 feature map,

2. RPN 输出的 BBOx,形状为:1*5*1*1 (4个坐标 + 索引 index);

 

==>> ROI Pooling 的输出是:

mini-batch 个 vector,batch的值是 ROI 的个数,vector的长度为:channel * w * h;

整个 ROI 的过程,就是将这些 proposal 抠出来的过程,得到大小统一的 feature map。

 

 

  

版权声明:本文内容由阿里云实名注册用户自发贡献,版权归原作者所有,阿里云开发者社区不拥有其著作权,亦不承担相应法律责任。具体规则请查看《阿里云开发者社区用户服务协议》和《阿里云开发者社区知识产权保护指引》。如果您发现本社区中有涉嫌抄袭的内容,填写侵权投诉表单进行举报,一经查实,本社区将立刻删除涉嫌侵权内容。

相关文章
Faster R-CNN : end2end 和 alternative 训练
Faster R-CNN 实际上就是由 Fast R-CNN 和 RPN 两个网络结合的,可以使用 end2end 和 alternative 两种方式来训练,两种方法训练出来的网络准确度基本没有多大的区别,但是使用 end2end 训练,即端到端训练可以节省很多时间。这篇文章参考 Ross' Girshick 在 ICCV15 上的演讲报告,主要讲 end2end 方法。
0 0
目标检测的Tricks | 【Trick3】IoU loss与focal loss(包含一些变体介绍)
目标检测的Tricks | 【Trick3】IoU loss与focal loss(包含一些变体介绍)
0 0
TF之BN:BN算法对多层中的每层神经网络加快学习QuadraticFunction_InputData+Histogram+BN的Error_curve
TF之BN:BN算法对多层中的每层神经网络加快学习QuadraticFunction_InputData+Histogram+BN的Error_curve
0 0
TF之CNN:CNN实现mnist数据集预测 96%采用placeholder用法+2层C及其max_pool法+隐藏层dropout法+输出层softmax法+目标函数cross_entropy法+
TF之CNN:CNN实现mnist数据集预测 96%采用placeholder用法+2层C及其max_pool法+隐藏层dropout法+输出层softmax法+目标函数cross_entropy法+
0 0
CV预备(一): conv2, filter2, imfilter的差别
目录 前言 filter2 实操 conv2 imfilter 最后 前言 最近开始准备深入学习一下计算机视觉(CV)方面的内容, 这里会更新几期基础知识, 主要是Matlab和Python方面的.
1142 0
word2vec原理(二) 基于Hierarchical Softmax的模型
在word2vec原理(一) CBOW与Skip-Gram模型基础中,我们讲到了使用神经网络的方法来得到词向量语言模型的原理和一些问题,现在我们开始关注word2vec的语言模型如何改进传统的神经网络的方法。
2090 0
Split Shape by Plane in OpenCASCADE
Split Shape by Plane in OpenCASCADE eryar@163.com Abstract. Sometimes you want to split a shape by plane or even split a shape by a B Spline surfac...
991 0
(转)几种范数的解释 l0-Norm, l1-Norm, l2-Norm, … , l-infinity Norm
几种范数的解释 l0-Norm, l1-Norm, l2-Norm, … , l-infinity Norm    from Rorasa's blog   l0-Norm, l1-Norm, l2-Norm, … , l-infinity Norm 13/05/2012rorasa ...
1573 0
Tutorial: Triplet Loss Layer Design for CNN
Tutorial:  Triplet Loss Layer Design for CNN Xiao Wang  2016.05.02     Triplet Loss Layer could be a trick for further improving the accuracy of CNN.
1030 0
+关注
wangxiaocvpr
编程语言,算法相关技术专家
文章
问答
文章排行榜
最热
最新
相关电子书
更多
Investigation of Transformer based Spelling Correction Model for CTC-based End-to-End Mandarin Speech Recognition
立即下载
Softmax Function Vs Sigmoid Fu
立即下载
Large-Scale Ads CTR prediction
立即下载