Facebook:计算机视觉新升级,1秒钟可训练40000张图片

简介:

Facebook:计算机视觉新升级,1秒钟可训练40000张图片图片来源:Trusted Reviews

雷锋网(公众号:雷锋网)6月9日消息  Facebook今日在西雅图 Data@Scale 大会上公布的一篇研究论文中表示,已成功开发一套新的计算机视觉系统,该系统在每秒钟可完成4万张图片的训练。这样一来在60分钟内就可以完成ImageNet -1K的数据集(共计120万张图片)的训练就成了可能,而且不会降低质量。而在现阶段,完成数据集的训练至少需要几天时间。

目前,Facebook的月活用户已达19.6亿。如果要从海量的图片中筛选出有意义的和值得纪念图片的话,会给AI、机器学习的训练带来很大的压力,而且较大的网络和数据集会导致更长的训练时间,阻碍其研发进度。所以,Facebook一直在研究更好的方法来解决这一问题。

该研究论文表示,Facebook的AI、机器学习团队在试验中采用了新的系统——用基于Caffe2的系统,以高达8192张图的minibatch大小,在256个GPU上用包含120万张图片的ImageNet -1k来训练ResNet-50,只花了1个小时,同时确保了准确性。

从硬件角度来看,Facebook此前的系统只有8个GPU,增至256 个GPU后,规模效益可提升90%。

同时,Facebook还表示,愿意向外公开自己的研发成果和硬件堆栈。

以下即Facebook本次研究论文的下载链接,有需要的小伙伴请猛戳↓

https://research.fb.com/wp-content/uploads/2017/06/imagenet1kin1h3.pdf

本文作者:李秀琴

本文转自雷锋网禁止二次转载,原文链接


相关文章
|
9月前
|
机器学习/深度学习 PyTorch 算法框架/工具
【python-Unet】计算机视觉~舌象舌头图片分割~机器学习(三)
【python-Unet】计算机视觉~舌象舌头图片分割~机器学习(三)
309 0
|
9月前
|
机器学习/深度学习 算法 计算机视觉
【python】计算机视觉~舌象图片中舌体倾斜判别(四)
【python】计算机视觉~舌象图片中舌体倾斜判别(四)
132 0
|
4天前
|
机器学习/深度学习 人工智能 计算机视觉
【计算机视觉】不来试试图片轮廓提取?
🚩 前言 最近学到了深度学习的卷积操作,在卷积神经网络出现之前,就已经有使用卷积核 (也叫滤波器),但那时的卷积核依靠人工的经验和知识来进行设计,而不能像卷积神经网络中那样让机器自己学习出合适的卷积核参数。 下面就介绍通过卷积来获取图像轮廓图的操作。
52 1
|
9月前
|
机器学习/深度学习 计算机视觉 Python
【Python】计算机视觉 手掌图片穴位识别(二)
【Python】计算机视觉 手掌图片穴位识别(二)
109 0
|
10月前
|
机器学习/深度学习 编解码 人工智能
【计算机视觉】MaskFormer:将语义分割和实例分割作为同一任务进行训练
目标检测和实例分割是计算机视觉的基本任务,在从自动驾驶到医学成像的无数应用中发挥着关键作用。目标检测的传统方法中通常利用边界框技术进行对象定位,然后利用逐像素分类为这些本地化实例分配类。但是当处理同一类的重叠对象时,或者在每个图像的对象数量不同的情况下,这些方法通常会出现问题。
【计算机视觉】MaskFormer:将语义分割和实例分割作为同一任务进行训练
|
11月前
|
数据采集 XML 数据挖掘
计算机视觉PyTorch - 数据处理(库数据和训练自己的数据)
计算机视觉PyTorch - 数据处理(库数据和训练自己的数据)
|
11月前
|
机器学习/深度学习 编解码 人工智能
深度学习应用篇-计算机视觉-语义分割综述[6]:DeepLab系列简介、DeepLabV3深入解读创新点、训练策略、主要贡献
深度学习应用篇-计算机视觉-语义分割综述[6]:DeepLab系列简介、DeepLabV3深入解读创新点、训练策略、主要贡献
深度学习应用篇-计算机视觉-语义分割综述[6]:DeepLab系列简介、DeepLabV3深入解读创新点、训练策略、主要贡献
|
12月前
|
机器学习/深度学习 数据挖掘 计算机视觉
全面超越Swin Transformer | Facebook用ResNet思想升级MViT(二)
全面超越Swin Transformer | Facebook用ResNet思想升级MViT(二)
122 0
|
12月前
|
机器学习/深度学习 编解码 数据可视化
全面超越Swin Transformer | Facebook用ResNet思想升级MViT(一)
全面超越Swin Transformer | Facebook用ResNet思想升级MViT(一)
202 0
|
机器学习/深度学习 算法 数据可视化
计算机视觉论文速递(四)Dynamic Sparse R-CNN:Sparse R-CNN升级版,使用ResNet50也能达到47.2AP
 首先,Sparse R-CNN采用一对一标签分配方案,其中匈牙利算法对每个Ground truth只匹配一个正样本。这种一对一标签分配对于学习到的proposal boxes和Ground truth之间的匹配可能不是最佳的。为了解决这一问题,作者提出了基于最优传输算法的动态标签分配(DLA),在Sparse R-CNN的迭代训练阶段分配递增的正样本。随着后续阶段产生精度更高的精细化proposal boxes,在后续阶段对匹配进行约束,使其逐渐松散。
121 0