DL之RetinaNet:RetinaNet算法的简介(论文介绍)、架构详解、案例应用等配图集合之详细攻略

简介: DL之RetinaNet:RetinaNet算法的简介(论文介绍)、架构详解、案例应用等配图集合之详细攻略

RetinaNet算法的简介(论文介绍)


        RetinaNet源自论文Focal Loss for Dense Object Detection用于密集目标检测的焦损失。


Abstract  

      The highest accuracy object detectors to date are based  on a two-stage approach popularized by R-CNN, where a  classifier is applied to a sparse set of candidate object locations.  In contrast, one-stage detectors that are applied  over a regular, dense sampling of possible object locations  have the potential to be faster and simpler, but have trailed  the accuracy of two-stage detectors thus far. In this paper,  we investigate why this is the case. We discover that the extreme  foreground-background class imbalance encountered  during training of dense detectors is the central cause. We  propose to address this class imbalance by reshaping the  standard cross entropy loss such that it down-weights the  loss assigned to well-classified examples. Our novel Focal  Loss focuses training on a sparse set of hard examples and  prevents the vast number of easy negatives from overwhelming  the detector during training. To evaluate the effectiveness  of our loss, we design and train a simple dense detector  we call RetinaNet. Our results show that when trained with  the focal loss, RetinaNet is able to match the speed of previous  one-stage detectors while surpassing the accuracy of  all existing state-of-the-art two-stage detectors. Code is at: https://github.com/facebookresearch/Detectron.

      迄今为止,精度最高的目标检测器是基于R-CNN推广的两阶段方法,其中分类器应用于稀疏的一组候选对象位置。相比之下,对可能的目标位置进行常规、密集采样的单级探测器有可能更快、更简单,但迄今仍落后于两级探测器的精度。在本文中,我们将探讨为什么会出现这种情况。我们发现,在密集探测器训练过程中所遇到的极端的前-后级不平衡是其主要原因。我们建议通过重新构造标准的交叉熵损失来解决这个类的不平衡,这样它就可以降低分配给分类良好的示例的损失。我们的新焦失聚焦训练集中在一组稀疏的硬例子上,防止大量的容易的负片在训练中压倒检测器。为了评估我们的损失的有效性,我们设计并训练了一个简单的高密度探测器,我们称之为RetinaNet。我们的结果表明,当使用聚焦损失训练时,视黄连能够在超过现有所有最先进的两级探测器精度的同时,与以前的单级探测器速度相匹配。代码如下:https://github.com/facebookresearch/Detectron。

Conclusion  

      In this work, we identify class imbalance as the primary  obstacle preventing one-stage object detectors from  surpassing top-performing, two-stage methods. To address  this, we propose the focal loss which applies a modulating  term to the cross entropy loss in order to focus learning  on hard negative examples. Our approach is simple and  highly effective. We demonstrate its efficacy by designing  a fully convolutional one-stage detector and report extensive  experimental analysis showing that it achieves stateof-the-art  accuracy and speed. Source code is available at https://github.com/facebookresearch/Detectron [12].

      在这项工作中,我们确定类不平衡是阻止单级对象检测器超越性能最好的两级方法的主要障碍。为了解决这个问题,我们提出了焦损失,它应用一个调制项的交叉熵损失,以便集中学习硬的负面例子。我们的方法简单而高效。我们设计了一种全卷积单级检测器来验证其有效性,并报告了大量的实验分析,结果表明它达到了最先进的精度和速度。源代码可从https://github.com/facebookresearch/Detectron[12]获得。


论文

Tsung-Yi Lin, Priya Goyal, Ross Girshick, KaimingHe, Piotr Dollár.

Focal Loss for Dense Object Detection. ICCV 2017.

https://arxiv.org/abs/1708.02002



0、实验结果


1、RetinaNet-50 VS RetinaNet-101


       在COCO数据集上,作者提出的RetinaNet-101-800模型,可以达到37.8mAP可超过其他以前提出的单阶段检测方法,并且检测速度是198ms。


image.png


2、在COCO test-dev上——分别与单阶段、两阶段模型比较


    目标检测单模型结果(边界框AP),与COCO test-dev的最新技术相比。RetinaNet可以达到40.8mAP,甚至可以超过两阶段方法。

注:该表展示了RetinaNet-101-800模型的结果,该模型经过尺度抖动训练。模型取得了最佳成绩,超越了其它单阶段和两阶段模型。

image.png




1、RetinaNet算法的特点及其贡献


找到妨碍单阶段目标检测器实现高准确度的主要原因:

-训练期间的前景-背景之间的类别不平衡

设计焦点损失(Focal Loss) 来解决这种类别不平衡问题,降低分配给分类良好例子的损失。

提出了单阶段RetinaNet网络架构,使用了焦点损失和多尺度特征金字塔。



RetinaNet算法的架构详解


DL之RetinaNet:RetinaNet算法的架构详解https://yunyaniu.blog.csdn.net/article/details/100010853






RetinaNet算法的案例应用


DL之RetinaNet:基于RetinaNet算法(keras框架)利用resnet50_coco数据集(.h5文件)实现目标检测


https://blog.csdn.net/qq_41185868/article/details/100109252

 


目录
打赏
0
0
0
0
1043
分享
相关文章
MapReduce在实现PageRank算法中的应用
总结来说,在实现PageRank算法时使用MapReduce能够有效地进行大规模并行计算,并且具有良好的容错性和可扩展性。
126 76
|
14天前
|
基于 PHP 语言的滑动窗口频率统计算法在公司局域网监控电脑日志分析中的应用研究
在当代企业网络架构中,公司局域网监控电脑系统需实时处理海量终端设备产生的连接日志。每台设备平均每分钟生成 3 至 5 条网络请求记录,这对监控系统的数据处理能力提出了极高要求。传统关系型数据库在应对这种高频写入场景时,性能往往难以令人满意。故而,引入特定的内存数据结构与优化算法成为必然选择。
21 3
从第十批算法备案通过名单中分析算法的属地占比、行业及应用情况
2025年3月12日,国家网信办公布第十批深度合成算法通过名单,共395款。主要分布在广东、北京、上海、浙江等地,占比超80%,涵盖智能对话、图像生成、文本生成等多行业。典型应用包括医疗、教育、金融等领域,如觅健医疗内容生成算法、匠邦AI智能生成合成算法等。服务角色以面向用户为主,技术趋势为多模态融合与垂直领域专业化。
JavaScript 中通过Array.sort() 实现多字段排序、排序稳定性、随机排序洗牌算法、优化排序性能,JS中排序算法的使用详解(附实际应用代码)
Array.sort() 是一个功能强大的方法,通过自定义的比较函数,可以处理各种复杂的排序逻辑。无论是简单的数字排序,还是多字段、嵌套对象、分组排序等高级应用,Array.sort() 都能胜任。同时,通过性能优化技巧(如映射排序)和结合其他数组方法(如 reduce),Array.sort() 可以用来实现高效的数据处理逻辑。 只有锻炼思维才能可持续地解决问题,只有思维才是真正值得学习和分享的核心要素。如果这篇博客能给您带来一点帮助,麻烦您点个赞支持一下,还可以收藏起来以备不时之需,有疑问和错误欢迎在评论区指出~
从第九批深度合成备案通过公示名单分析算法备案属地、行业及应用领域占比
2024年12月20日,中央网信办公布第九批深度合成算法名单。分析显示,教育、智能对话、医疗健康和图像生成为核心应用领域。文本生成占比最高(57.56%),涵盖智能客服、法律咨询等;图像/视频生成次之(27.32%),应用于广告设计、影视制作等。北京、广东、浙江等地技术集中度高,多模态融合成未来重点。垂直行业如医疗、教育、金融加速引入AI,提升效率与用户体验。
云原生时代的应用架构演进:从微服务到 Serverless 的阿里云实践
云原生技术正重塑企业数字化转型路径。阿里云作为亚太领先云服务商,提供完整云原生产品矩阵:容器服务ACK优化启动速度与镜像分发效率;MSE微服务引擎保障高可用性;ASM服务网格降低资源消耗;函数计算FC突破冷启动瓶颈;SAE重新定义PaaS边界;PolarDB数据库实现存储计算分离;DataWorks简化数据湖构建;Flink实时计算助力风控系统。这些技术已在多行业落地,推动效率提升与商业模式创新,助力企业在数字化浪潮中占据先机。
44 12
后端服务架构的微服务化转型
本文旨在探讨后端服务从单体架构向微服务架构转型的过程,分析微服务架构的优势和面临的挑战。文章首先介绍单体架构的局限性,然后详细阐述微服务架构的核心概念及其在现代软件开发中的应用。通过对比两种架构,指出微服务化转型的必要性和实施策略。最后,讨论了微服务架构实施过程中可能遇到的问题及解决方案。
云计算的未来:云原生架构与微服务的革命####
【10月更文挑战第21天】 随着企业数字化转型的加速,云原生技术正迅速成为IT行业的新宠。本文深入探讨了云原生架构的核心理念、关键技术如容器化和微服务的优势,以及如何通过这些技术实现高效、灵活且可扩展的现代应用开发。我们将揭示云原生如何重塑软件开发流程,提升业务敏捷性,并探索其对企业IT架构的深远影响。 ####
109 3
云原生架构下的微服务治理与挑战####
随着云计算技术的飞速发展,云原生架构以其高效、灵活、可扩展的特性成为现代企业IT架构的首选。本文聚焦于云原生环境下的微服务治理问题,探讨其在促进业务敏捷性的同时所面临的挑战及应对策略。通过分析微服务拆分、服务间通信、故障隔离与恢复等关键环节,本文旨在为读者提供一个关于如何在云原生环境中有效实施微服务治理的全面视角,助力企业在数字化转型的道路上稳健前行。 ####
从单体到微服务:如何借助 Spring Cloud 实现架构转型
**Spring Cloud** 是一套基于 Spring 框架的**微服务架构解决方案**,它提供了一系列的工具和组件,帮助开发者快速构建分布式系统,尤其是微服务架构。
402 69
从单体到微服务:如何借助 Spring Cloud 实现架构转型

热门文章

最新文章