DL之FastR-CNN:Fast R-CNN算法的简介(论文介绍)、架构详解、案例应用等配图集合之详细攻略

简介: DL之FastR-CNN:Fast R-CNN算法的简介(论文介绍)、架构详解、案例应用等配图集合之详细攻略

Fast R-CNN算法的简介(论文介绍)


Abstract  

      This paper proposes a Fast Region-based Convolutional  Network method (Fast R-CNN) for object detection. Fast  R-CNN builds on previous work to efficiently classify object  proposals using deep convolutional networks. Compared  to previous work, Fast R-CNN employs several innovations  to improve training and testing speed while also  increasing detection accuracy. Fast R-CNN trains the very  deep VGG16 network 9× faster than R-CNN, is 213× faster  at test-time, and achieves a higher mAP on PASCAL VOC  2012. Compared to SPPnet, Fast R-CNN trains VGG16 3×  faster, tests 10× faster, and is more accurate. Fast R-CNN  is implemented in Python and C++ (using Caffe) and is  available under the open-source MIT License at https:  //github.com/rbgirshick/fast-rcnn.

摘要

      本文提出了一种基于区域卷积网络的快速目标检测方法(Fast R-CNN)。Fast  R-CNN建立在以前工作的基础上,使用深度卷积网络有效地分类对象建议。与之前的工作相比,Fast R-CNN在提高训练和测试速度的同时,也提高了检测精度。Fast R-CNN训练了非常深的VGG16网络,速度比R-CNN快9倍,测试时速度213倍,在PASCAL VOC 2012上实现了更高的mAP。与SPPnet相比,Fast R-CNN训练VGG16 更快3倍,测试速度更快10倍,更准确。Fast R-CNN是用Python和c++(使用Caffe)实现的,可以通过https: //github.com/rbgirshick/fast-rcnn获得MIT的开源许可。

Conclusion  

      This paper proposes Fast R-CNN, a clean and fast update  to R-CNN and SPPnet. In addition to reporting state-of-theart  detection results, we present detailed experiments that  we hope provide new insights. Of particular note, sparse  object proposals appear to improve detector quality. This  issue was too costly (in time) to probe in the past, but becomes  practical with Fast R-CNN. Of course, there may exist  yet undiscovered techniques that allow dense boxes to  perform as well as sparse proposals. Such methods, if developed,  may help further accelerate object detection.

结论

      本文提出了一种Fast R-CNN,对R-CNN和SPPnet进行了干净、快速的更新。除了报告最新的检测结果,我们还提供了详细的实验,希望能提供新的见解。特别值得注意的是,稀疏对象建议似乎可以提高检测器的质量。这个问题在过去花费太多(时间)去探索,但在Fast R-CNN中变得实用。当然,可能存在一些尚未发现的技术,允许密集的框执行稀疏的建议。如果开发出这样的方法,将有助于进一步加速目标检测。


论文

Ross Girshick.

Fast R-CNN. ICCV 2015

https://arxiv.org/abs/1504.08083



1、实验结果


image.png

1、mAPbased on PASCAL VOC 2007, results from Girshick


图示可知,SPP比R-CNN的测试速度快了24倍,而Fast R-CNN又比SPP加快了10倍以上!




2、Fast R-CNN: Result


image.png




2、三者架构对比——R-CNN、Fast R-CNN、Faster R-CNN


多任务学习、引入RoI pooling来对齐不同尺度的建议框的特征大小。


image.png

相关文章:DL之FasterR-CNN:Faster R-CNN算法的简介(论文介绍)、架构详解、案例应用等配图集合之详细攻略



相关文章
|
14天前
|
机器学习/深度学习 人工智能 自动驾驶
深度学习中的卷积神经网络(CNN)及其在图像识别中的应用
【8月更文挑战第28天】本文将深入探讨深度学习领域的核心概念之一——卷积神经网络(CNN),并展示其在图像识别任务中的强大能力。文章首先介绍CNN的基本结构,然后通过一个简单的代码示例来演示如何构建一个基础的CNN模型。接着,我们将讨论CNN如何处理图像数据以及它在图像分类、检测和分割等任务中的应用。最后,文章将指出CNN面临的挑战和未来的发展方向。
|
18天前
|
机器学习/深度学习 人工智能 自动驾驶
深度学习中的卷积神经网络(CNN)及其在图像识别中的应用
【8月更文挑战第24天】本文将带你走进深度学习的神奇世界,特别是卷积神经网络(CNN)这一强大的工具。我们将从CNN的基础概念出发,通过直观的例子和简单的代码片段,探索其在图像识别领域的应用。无论你是深度学习的初学者还是希望深化理解的进阶者,这篇文章都将为你提供有价值的见解。
|
2月前
|
机器学习/深度学习 计算机视觉 异构计算
【YOLOv8改进 - Backbone主干】ShuffleNet V2:卷积神经网络(CNN)架构
【YOLOv8改进 - Backbone主干】ShuffleNet V2:卷积神经网络(CNN)架构
|
14天前
|
机器学习/深度学习 算法框架/工具 计算机视觉
深度学习中的卷积神经网络(CNN)及其在图像识别中的应用
【8月更文挑战第28天】本文深入探讨了深度学习领域中的一个核心概念——卷积神经网络(CNN),并详细解释了其在图像识别任务中的强大应用。从CNN的基本结构出发,我们逐步展开对其工作原理的解析,并通过实际代码示例,展示如何利用CNN进行有效的图像处理和识别。文章旨在为初学者提供一个清晰的学习路径,同时也为有经验的开发者提供一些深入的见解和应用技巧。
29 1
|
12天前
|
机器学习/深度学习 人工智能 自然语言处理
深度学习中的卷积神经网络(CNN)简介
【8月更文挑战第30天】在人工智能的浪潮中,深度学习以其强大的数据处理能力成为时代的宠儿。本文将深入浅出地介绍深度学习的一个重要分支——卷积神经网络(CNN),并探讨其如何在图像识别等领域大放异彩。通过实例,我们将一窥CNN的神秘面纱,理解其背后的原理,并探索如何利用这一工具解锁数据的深层价值。
|
1月前
|
算法
突击面试:解密面试官的算法题集合
突击面试:解密面试官的算法题集合
|
13天前
|
机器学习/深度学习 网络安全 TensorFlow
探索操作系统的心脏:内核与用户空间的奥秘云计算与网络安全:技术挑战与未来趋势深度学习中的卷积神经网络(CNN)及其在图像识别中的应用
【8月更文挑战第29天】在数字世界的每一次点击与滑动背后,都隐藏着一个不为人知的故事。这个故事关于操作系统——计算机的灵魂,它如何协调硬件与软件,管理资源,并确保一切运行得井井有条。本文将带你走进操作系统的核心,揭示内核与用户空间的秘密,展现它们如何共同编织出我们日常数字生活的底层结构。通过深入浅出的讲解和代码示例,我们将一同解锁操作系统的神秘面纱,理解其对现代计算的重要性。 【8月更文挑战第29天】本文将深入探讨卷积神经网络(CNN)的基本原理和结构,以及它们如何被广泛应用于图像识别任务中。我们将通过代码示例来展示如何使用Python和TensorFlow库构建一个简单的CNN模型,并训练
|
18天前
|
机器学习/深度学习 算法框架/工具 计算机视觉
深度学习中的卷积神经网络(CNN)及其应用
【8月更文挑战第24天】本文将深入探讨深度学习中的一种重要模型——卷积神经网络(CNN)。我们将了解CNN的基本结构,包括其核心组成部分:卷积层、池化层和全连接层。同时,我们还将探索CNN在图像分类、物体检测和面部识别等任务中的应用,并展示如何通过Python和Keras库实现一个简单的CNN模型。无论你是深度学习的新手,还是希望深化理解CNN的研究者,这篇文章都将为你提供有价值的见解。
|
2月前
|
机器学习/深度学习 人工智能 自然语言处理
算法金 | 秒懂 AI - 深度学习五大模型:RNN、CNN、Transformer、BERT、GPT 简介
**RNN**,1986年提出,用于序列数据,如语言模型和语音识别,但原始模型有梯度消失问题。**LSTM**和**GRU**通过门控解决了此问题。 **CNN**,1989年引入,擅长图像处理,卷积层和池化层提取特征,经典应用包括图像分类和物体检测,如LeNet-5。 **Transformer**,2017年由Google推出,自注意力机制实现并行计算,优化了NLP效率,如机器翻译。 **BERT**,2018年Google的双向预训练模型,通过掩码语言模型改进上下文理解,适用于问答和文本分类。
113 9
|
3月前
|
机器学习/深度学习 自动驾驶 TensorFlow
【机器学习】卷积神经(CNN)在图像识别中的革命性应用:自动驾驶的崛起
【机器学习】卷积神经(CNN)在图像识别中的革命性应用:自动驾驶的崛起
82 1

热门文章

最新文章

下一篇
DDNS