一周AI最火论文 | 世界就是你的绿屏 ,任何背景一键抠像!

简介: 一周AI最火论文 | 世界就是你的绿屏 ,任何背景一键抠像!

本周关键词:对象检测Deepfake

本周最火学术研究

机器人真的可以学会像动物一样移动吗?

众所周知,动物非常敏捷。机器人可以达到它的水平们吗?开发具有复制这种敏捷度的机器人,有利于创造在现实世界中能处理各种复杂任务的机器人。

最新研究:Google AI研究人员讨论了两个最新项目,旨在应对当前机器人敏捷性方面的挑战。首先,研究人员描述了机器人如何通过模仿真实动物的动作来学习敏捷行为,从而产生快速流畅的动作,例如小跑和跳跃。然后,他们讨论了一种用于在现实世界中,自动进行运动技能训练的系统。这个系统可使机器人在最少的人工帮助下,学习自我行走。

研究结果:使用上述提出的方法,机器人学习并模仿了狗的各种运动技巧,包括不同的步行步态(例如踱步和小跑)以及敏捷的旋转动作。

扩展阅读:

https://ai.googleblog.com/2020/04/exploring-nature-inspired-robot-agility.html

世界即是你的绿屏 – 一项背景遮罩生成(抠像)技术

你能想象,仅仅通过使用智能手机在日常环境中拍摄照片或视频,就能轻松地为每个人的每个像素的颜色和不透明度创建遮罩吗?

这篇论文提出了一种背景遮罩生成方法,该方法可以在自然环境中随意获得高质量的前景+ alpha遮罩。这种方法避免了使用绿屏,也避免了为获得高遮罩质量通常需要精心构造的详细的trimap 图。由于一个关键的难点是,缺少背景遮罩生成问题的真实数据,因此研究人员开发了一种在合成复合数据上训练的深度学习框架,然后使用对抗网络将其应用于真实数据。

研究结果:在多种照片和视频上比现有技术有了显著改善。

扩展阅读:

https://arxiv.org/abs/2004.00626v1

基于EfficientDet进行可扩展的高效对象检测

近年来,各国研究员们在更精确的物体检测方面取得了巨大的进步。同时,最新的物体检测器,却也变得越来越昂贵。

在本文中,Google Research Brain 组的研究人员,系统地研究了用于有效对象检测的网络体系结构设计选择,并提出了加权双向特征网络和定制的复合缩放方法,从而提高了准确性和效率。

基于这些优化,他们开发了一个名为EfficientDet的新检测器系列,在各种资源限制条件下,该检测器比现有技术具有更高的准确性和效率

研究结果:EfficientDet在COCO测试设备上以52M参数和325B FLOP,实现了最新的52.2 AP。这比现有检测器小4到9倍,使用的FLOP减少了13到42倍。


源代码已在Github开源:https://github.com/google/automl/tree/master/efficientdet

扩展阅读:

https://arxiv.org/abs/1911.09070v3

改进科学出版物的建议

如“决策树森林”中的一个决策树对它作出的判断进行了一些细微的修改,但没人在科学界发布它,那这真的是“最新技术”吗?—乔治·伯克利

近日,一项研究表明,您可能不再需要遵循传统的同行评议形式进行科学手稿评估。这群研究人员提出了一种高度可扩展、全自动的方法对论文进行审查,并从主要的计算机视觉和机器学习会议的最佳实践中汲取了灵感。

这些研究人员希望通过清晰易懂的审阅指标,来推动科学研究进入又一个黄金时代,因为科学家们都希望自己能够做出既新颖又十分先进的研究成果。

扩展阅读:

https://arxiv.org/abs/2003.14415v1

如何用“白盒”和“黑盒攻击”来回避Deepfake图像检测器

合成高度逼真的“假人”图像如今已经越来越容易,并且被很多人用于创建虚假的社交媒体信息来进行欺诈。

研究人员正在努力开发和部署检测这一类合成内容的算法。

虽然最流行的取证方法之一是训练神经网络以区分真实内容与合成内容,但Google Brain和加州大学伯克利分校的研究人员现在表明,取证分类器易受一系列攻击的攻击,这些攻击将分类器的准确性降低至接近0%。

攻击者们开发出一种黑盒攻击,不用接触目标分类器,就能将ROC曲线(AUC)下的面积从0.95降低到0.22。



相关文章
|
3月前
|
机器学习/深度学习 人工智能 安全
【论文速递】CSET - 小数据的大AI潜力
【论文速递】CSET - 小数据的大AI潜力
34 0
|
3月前
|
机器学习/深度学习 人工智能 数据挖掘
ICLR 49.9%论文疑有AI审稿
【5月更文挑战第20天】ICLR会议上一篇研究引发关注,推测近50%的论文可能由AI进行审稿,挑战传统审稿流程。研究者运用机器学习分析历史审稿数据,发现可能的AI审稿模式。该研究提出AI审稿可减轻审稿人负担,提高效率,但也面临证据不足、理解复杂学术概念限制及审稿行为多样性等问题。学术界需谨慎评估AI在审稿中的角色,以确保质量和公正性。[论文链接](https://arxiv.org/abs/2405.02150)
55 1
|
3月前
|
人工智能
AI大咖说-如何评价论文的创新性
《AI大咖说》探讨论文创新性,强调新意、有效性和领域研究问题的重要性。创新点在于用新颖方法有效解决研究问题。评价公式:价值=问题大小*有效性*新意度。该观点源于《跟李沐学AI》视频,提供1-100分评分标准,助力评估论文价值。5月更文挑战第14天
49 3
|
3月前
|
机器学习/深度学习 人工智能
论文介绍:AI击败最先进全球洪水预警系统,提前7天预测河流洪水
【5月更文挑战第4天】研究人员开发的AI模型(基于LSTM网络)成功击败全球最先进的洪水预警系统,能在未设测站流域提前7天预测洪水,显著提升预警时间,降低灾害影响。该模型使用公开数据集,减少了对长期观测数据的依赖,降低了预警系统的成本,有望帮助资源有限的地区。然而,模型的性能可能受特定流域条件影响,泛化能力和预测解释性仍有待改进。[论文链接](https://www.nature.com/articles/s41586-024-07145-1)
97 11
|
3月前
|
数据采集 人工智能 数据挖掘
【AI大模型应用开发】【附】常用Prompt记录 - 论文全文写作
【AI大模型应用开发】【附】常用Prompt记录 - 论文全文写作
97 0
【AI大模型应用开发】【附】常用Prompt记录 - 论文全文写作
|
3月前
|
机器学习/深度学习 人工智能 算法
AI大咖说-如何有效的读论文
# AI大咖李沐教你高效读论文 李沐,亚马逊资深首席科学家,MXNet框架作者,推荐其在B站的“跟李沐学AI”。他建议读论文分三步:粗读(标题、摘要、结论)、快速浏览(整体理解)和精读(深入细节)。通过这三遍阅读,判断论文是否相关,理解解决问题的方法和实验。5月更文挑战第13天
48 0
|
3月前
|
机器学习/深度学习 人工智能
ChatGPT检测器——以前所未有的准确性捕捉AI生成的论文
【2月更文挑战第25天】ChatGPT检测器——以前所未有的准确性捕捉AI生成的论文
75 7
ChatGPT检测器——以前所未有的准确性捕捉AI生成的论文
|
3月前
|
人工智能
【SCI论文】“学术丑闻揭露:当AI写作遭遇学术审稿,ChatGPT意外成为论文共作者!“
最近,一篇发表在《Surfaces and Interfaces》的论文引起了广泛关注,因为其中意外包含了ChatGPT的提示语,暴露出学术审稿过程中的疏忽。这篇论文讨论了铜基金属-有机框架-芳香族纤维素分隔器对锂金属阳极电池的影响,但却出现了不该出现的ChatGPT对话内容。这一事件不仅令人哭笑不得,还引发了对学术审核严谨性的质疑。它反映了当前学术界可能过度依赖AI写作工具,忽略了基本的检查和编辑步骤。这一事件提醒学术界必须加强审查机制和自律,确保论文质量,防止类似尴尬情况的再次发生。
167 4
【SCI论文】“学术丑闻揭露:当AI写作遭遇学术审稿,ChatGPT意外成为论文共作者!“
|
3月前
|
机器学习/深度学习 人工智能 知识图谱
LeCun视觉世界模型论文,揭示AI学习物理世界的关键
【2月更文挑战第16天】LeCun视觉世界模型论文,揭示AI学习物理世界的关键
45 2
LeCun视觉世界模型论文,揭示AI学习物理世界的关键
|
3月前
|
机器学习/深度学习 人工智能 自然语言处理
蚂蚁集团持续探索生成式AI,20篇论文入选AI顶会NeurlPS
NeurlPS官方数据显示,本届会议共有12343篇有效论文投稿,接收率为26.1%。蚂蚁集团20篇论文被收录。 据了解,蚂蚁此次入选的论文,覆盖计算机视觉、自然语言处理、图神经网络、图像处理等多个人工智能和机器学习领域的前沿主题。其中七成以上论文聚焦生成式AI在高速发展中遇到的一些挑战和难题。
蚂蚁集团持续探索生成式AI,20篇论文入选AI顶会NeurlPS