Facebook 推机器视觉方案,能轻易读懂图片信息

简介:

完善对象分割方法(Learning to Refine Object Segments)

Facebook 推机器视觉方案,能轻易读懂图片信息

论文摘要

要实现对象分割,需要获得两方面的信息,一是目标层级的信息,二是更低级别即像素级别的信息。这就为前馈网络提出了挑战:卷积网络中的底层获取了大量的空间信息,而更高层则需要目标层级的信息,无法随着对象的造型及外观变化进行调整,效果不佳。本次研究中,我们为目标分隔的前馈网络提出了一种新的自上而下的改善方法。这种由顶层到底层的结构能够有效地做出高保真目标图像。该方法与跳接相比,相同点是都在网络各层级中放大了图像特征,不同点在于,我们的方法不在每层中输出独立的预测,而是先在前馈过程中输出一个粗略的图像编码,然后再在由上至下的过程中,用底层的图像特征依次向上完善该编码。这种方法更加简单、快捷和有效。在最近流行的 DeepMask 网络中做出图像指令,我们的方法将图像精确度平均提升了 10-20%。另外,在总体网络结构的最优化问题中,我们采用了 SharpMask,与原有的 DeepMask 网络相比,速度提升了50%(8 秒/图)。

作者简介

Pedro O. Pinheiro,供职于 Idiap Research Institute 和 Ecole Polytechnique Federale de Lausanne(EPFL)。

Tsung-Yi Lin 来自康奈尔大学康奈尔技术研究院。

结论和场景应用

本文针对快速对象分割任务发展了一种新的网络结构,对前馈网络进行自上而下通路的完善。文中的模型使目标图像无论是在处理速度还是在质量方面都有了大的提升。该方法可以广泛应用在各种像素标注的任务中。

via Research at Facebook

PS:本文由雷锋网(搜索“雷锋网(公众号:雷锋网)”公众号关注)独家编译,未经许可不得转载!

可在此处进行原论文下载

推荐阅读:

论文精选 | 实现城市设备智能规划?——具有可选偏好的设施选址游戏

深度 | 计算机如何从乐盲到作曲家?建 28 层神经网络,听 8000 个 MIDI 乐章


本文作者:何忞


本文转自雷锋网禁止二次转载,原文链接

相关文章
|
人工智能 自然语言处理 算法
Facebook&哥大等推出实验性AI框架,音视频信息可自由转换文本!
近日,来自Facebook、哥伦比亚大学等高校的研究人员开发了一种可以从视频、对话历史、音频以及语音文本中生成高层次语义信息的框架——Vx2Text,该模型可以用来概括信息内容,并准确地回答相关问题。
172 0
Facebook&哥大等推出实验性AI框架,音视频信息可自由转换文本!
|
机器学习/深度学习 安全 网络安全
|
安全 数据安全/隐私保护
政府安全资讯精选 2017年第十三期 网信办发布《互联网新闻信息服务新技术新应用安全评估管理规定》;Facebook颁布新广告政策,加强内容安全
网信办发布《互联网新闻信息服务新技术新应用安全评估管理规定》;Facebook颁布新广告政策,加强内容安全;英国新《数据保护法案》允许遭黑客攻击者索要“精神赔偿”;存有英国女王行程相关信息的U 盘遗失,数据未做任何加密
1815 0
|
安全 测试技术
因图片处理软件一个漏洞,Facebook给出历史最高漏洞赏金
本文讲的是因图片处理软件一个漏洞,Facebook给出历史最高漏洞赏金,ImageMagick是一个免费开源的图像处理软件,用于创建、编辑、合成图片,可运行于大多数的操作系统,支持PHP、Ruby、NodeJS和Python等多种语言,使用非常广泛。
1410 0