GitHub趋势榜第一:超强PyTorch目标检测库Detectron2,训练更快,支持更多任务

简介: Detectron2是在PyTorch里从零开始写成的,团队希望这种做法,能让用户享受PyTorch做深度学习的思路。社区更活跃的话,PyTorch也会变得更好。

PyTorch目标检测库Detectron2诞生了,Facebook出品。


站在初代的肩膀上,它训练比从前更快,功能比从前更全,支持的模型也比从前更丰盛。


开源5天,已在GitHub收获3100星,还成了趋势榜第一:

640.jpg


除此之外,团队把大规模姿态估计算法DensePose,做出了基于Detectron2的新版本。


Facebook说,像DensePose一样,今后会有更多研究项目,在Detectron2上搭建起来。


这样,就可以把它当成一个广泛支持各种研究工作的库了。


那么,现在就来仔细观察一下,Detectron2都发生了哪些进化:


全方位升级


首先,Detectron2比起初代,最明显的变化是:


基于PyTorch了,初代还是在Caffe2里实现的。


团队说,PyTorch有直观的指令式编程,这样就能更快地迭代模型设计和实验。


Detectron2是在PyTorch里从零开始写成的,团队希望这种做法,能让用户享受PyTorch做深度学习的思路。社区更活跃的话,PyTorch也会变得更好。


640.jpg


第二个变化,是模块化了。


所谓模块化,就是用户可以把自己定制的模块实现,加到一个目标检测系统的任何部分里去。


这意味着许多的新研究,都能用几百行代码写成,并且可以把新实现的部分,跟核心Detectron2库完全分开。


除此之外,还有许多新支持的模型、功能和任务:


新模型&新功能


首先,Detectron2包含了一代可用的所有模型:


比如Faster R-CNN,Mask R-CNN,RetinaNet,DensePose等等。


然后,加入了一些新模型:


比如Cascade R-NN,Panoptic FPN,以及TensorMask。


今后,陆续会有新的算法支持。


功能方面,二代新支持了同步批量归一化 (synchronous Batch Norm) ,也支持了LVIS等等许多新的数据集。


新任务


和目标检测有关的任务,初代已经支持了一部分,二代也都支持:


有边界框的目标检测,实例分割mask,以及人类姿态预测。


在这基础之上,二代又增加了新任务:


语义分割和全景分割 (Panoptic Segmentation) ,这是一个把语义分割和实例分割结合到一起的任务。速度快


博客提到,由于把整个训练pipeline移到了GPU上,二代比初代更快了,在许多模型上都是如此。分布式训练,让几台GPU一起跑的话,还可以把训练规模扩张到更大的数据集上。


速度的对比,是用第100-500次迭代之间的平均吞吐量 (Average Throughput) 作为指标。这样就跳过了GPU预热时间。结果如下:


640.png


肉眼可见的加速。


注意,对于R-CNN这类模型,一个模型的吞吐量会随着训练的进行而变化,这取决于模型的预测。


因此,这个指标也不能和model zoo里的“训练速度”相提并论。model zoo用的是整个训练过程运行的平均速度。


部署一下


最后,Facebook的计算机视觉攻城狮们,实现了一个额外的软件层,叫Detectron2go。


有了它,就可以更快地把新实现的模型,部署到生产环节。


这一层的功能包括了标准训练工作流,带有内部数据集,网络量化,以及模型转化 (为了给云端和移动端部署,选择各自最优的格式) 。


传送门


总之,训练起来更顺滑了,支持的任务也广泛了,快点用起来吧:



640.jpg

640.jpg

相关文章
|
6月前
|
机器学习/深度学习 PyTorch 测试技术
从训练到推理:Intel Extension for PyTorch混合精度优化完整指南
PyTorch作为主流深度学习框架,凭借动态计算图和异构计算支持,广泛应用于视觉与自然语言处理。Intel Extension for PyTorch针对Intel硬件深度优化,尤其在GPU上通过自动混合精度(AMP)提升训练与推理性能。本文以ResNet-50在CIFAR-10上的实验为例,详解如何利用该扩展实现高效深度学习优化。
386 0
|
6月前
基于Reactor模式的高性能网络库github地址
https://github.com/zyi30/reactor-net.git
170 0
|
11月前
|
监控 API 计算机视觉
CompreFace:Star6.1k,Github上火爆的轻量化且强大的人脸识别库,api,sdk都支持
CompreFace 是一个在 GitHub 上拥有 6.1k Star 的轻量级人脸识别库,支持 API 和 SDK。它由 Exadel 公司开发,基于深度学习技术,提供高效、灵活的人脸识别解决方案。CompreFace 支持多种模型(如 VGG-Face、OpenFace 和 Facenet),具备多硬件支持、丰富的功能服务(如人脸检测、年龄性别识别等)和便捷的部署方式。适用于安防监控、商业领域和医疗美容等多个场景。
1353 4
|
8月前
|
PyTorch 调度 算法框架/工具
阿里云PAI-DLC任务Pytorch launch_agent Socket Timeout问题源码分析
DLC任务Pytorch launch_agent Socket Timeout问题源码分析与解决方案
443 18
阿里云PAI-DLC任务Pytorch launch_agent Socket Timeout问题源码分析
|
10月前
|
人工智能 网络安全 开发工具
vscode代码推送到github库菜鸡专用教程
vscode代码推送到github库菜鸡专用教程
|
机器学习/深度学习 人工智能 PyTorch
使用PyTorch实现GPT-2直接偏好优化训练:DPO方法改进及其与监督微调的效果对比
本文将系统阐述DPO的工作原理、实现机制,以及其与传统RLHF和SFT方法的本质区别。
1119 22
使用PyTorch实现GPT-2直接偏好优化训练:DPO方法改进及其与监督微调的效果对比
|
并行计算 PyTorch 算法框架/工具
基于CUDA12.1+CUDNN8.9+PYTORCH2.3.1,实现自定义数据集训练
文章介绍了如何在CUDA 12.1、CUDNN 8.9和PyTorch 2.3.1环境下实现自定义数据集的训练,包括环境配置、预览结果和核心步骤,以及遇到问题的解决方法和参考链接。
946 4
基于CUDA12.1+CUDNN8.9+PYTORCH2.3.1,实现自定义数据集训练
|
存储 前端开发 JavaScript
🚀 10 个 GitHub 存储库,助你成为前端巨匠✨
本文介绍了10个极具价值的GitHub存储库,旨在帮助各级JavaScript开发人员提升技能。这些资源涵盖了从基本概念到高级算法、编码风格指南、面试准备等各个方面,包括经典书籍、实用工具和面试手册。无论您是刚入门的新手还是有经验的开发者,这些存储库都能为您提供丰富的学习资源,助您在JavaScript领域更进一步。探索这些资源,开启您的学习之旅吧!
275 0
🚀 10 个 GitHub 存储库,助你成为前端巨匠✨
|
机器学习/深度学习 并行计算 PyTorch
GPU 加速与 PyTorch:最大化硬件性能提升训练速度
【8月更文第29天】GPU(图形处理单元)因其并行计算能力而成为深度学习领域的重要组成部分。本文将介绍如何利用PyTorch来高效地利用GPU进行深度学习模型的训练,从而最大化训练速度。我们将讨论如何配置环境、选择合适的硬件、编写高效的代码以及利用高级特性来提高性能。
2472 1

热门文章

最新文章

推荐镜像

更多