AI学会理解物理力学,机器像人更进一步 | 清华学神在MIT新研究

简介:
本文来自AI新媒体量子位(QbitAI)

5074e1e55e5f2b6ac21d316e1afd92c329637edc

机器能自行理解我们这个物理世界的基本规则么?答案是能。

多年以来,麻省理工学院(MIT)的研究人员一直在寻求解释和复制人类智能,而他们最近的研究成果,是如何让AI智能体拥有认知世界的基本能力。

即:学会分辨不同的对象,以及推断它们如何受到物理作用力的影响。

这包括几个方面。首先是看到图片后,能脑补其中物体的三维形状;其次是判断物体的物理特性,例如质量和摩擦力等;然后是推断随着时间推移,这些它们会如何被物理作用力改变,比方会发生何种位移。

在这个方向上,MIT博士生吴佳俊和团队一起发表了四篇研究论文,这四篇论文入选了刚刚结束的NIPS,而且有两篇被选为spotlight。

其中三篇论文谈及如何从视觉和听觉数据中,推断出物体的物理结构。另外一篇,则是预测这些物体会会如何发生变化。

“总而言之,我们已经能够让机器像人类一样,掌握越来越多对物理世界的基本理解”,吴佳俊的导师Josh Tenenbaum教授表示。

脑补

首先要解决的问题是,如何正确认知这个世界。

挑战在于,如何构建一个神经网络模型,能够基于给定的二维图片,脑补出隐藏在视线之外的物体形状,最终还原构建出一个三维图像。

这需要模型能看透物体间的相互遮挡,滤除混杂期间的视觉纹理、反射和阴影,推断看不见的地方究竟是什么形状等等。

显然这是一个复杂的问题。参与这项研究的不止MIT学者,还有来自DeepMind、上海科技大学、上海交通大学的各路高手。

8aec8f12154df0b9ce3e198b14ad7be8e39094bd

这些研究基于MIT神经科学家大卫·马尔(David Marr)的理论。这位英年早逝的科学家认为,在解释一个视觉场景时,大脑首先从观察角度建立对象的2.5D草图,然在在此基础上,大脑继续推断出物体完整的三维形状。

这不是一件易事。

吴佳俊和同事们为了训练神经网络,会首先建立一个三维场景模型,然后再生成一张二维图片。整个过程就像拍摄动画电影似的。一旦有了数据,就能让AI开始自学如何基于二维图片,脑补出三维场景。

还有更有意思的挑战。

比方,听声脑补。在另一篇论文中,他们训练了一个系统,通过物体被丢弃时发出的声音,推断物体的形状、材质以及跌落的高度。

dd1df426418946772a8b726774c28ded8f0da25b

物理

神经网络已经学会如何脑补一个三维世界,现在,是时候让AI学习如何像人类一样,掌握对真实世界物理作用力的直观理解了。

研究人员一共交待了两项任务。

其一,是估计台球的运行速度,并据此预测台球(们)发生撞击后,后续的运动情况。其二,是分析堆叠的方块静态图,并据此判断这堆方块是否会掉落,以及会落在何处?

8474ef84aeb8de35328fa7f75e91804940547dfb

吴佳俊为此开发了一种称为场景XML的表示语言,可以定量描述视觉场景中物体的相对位置。神经网络首先学习使用这个语言输入数据,然后把这个描述提供给一个物理引擎,这个引擎负责基于物理作用力进行建模。

物理引擎最终完成台球和方块运动的预测之后,信息被发送给图形引擎,最终形成一张预测图片。这张图片会与真实场景的物理作用结果进行比较。

在测试中,MIT的研究超过了前人的成果。

d5f65f2142e9a3beee5995641c6c383cf782c12d

“他们使用了物理工具来训练生成模型”,南加州大学计算机科学助理教授Joseph Lim表示:“这个简单而优雅的想法与最先进的深度学习技术结合,在与解释物理世界相关的多项任务中展现了非常棒的结果”。

上述内容主要源自MIT News,原文地址:

http://news.mit.edu/2017/computer-systems-predict-objects-responses-physical-forces-1214

吴佳俊

上面提及的四篇论文中,吴佳俊都有参与,其中两篇是作为第一作者。

前面已经提到,吴佳俊现在是MIT的博士生。他的导师是Bill Freeman教授Josh Tenenbaum教授。吴佳俊的研究方向主要为计算机视觉、机器学习和计算认知科学。

吴佳俊本科毕业于清华大学交叉信息研究院,导师为屠卓文教授。

7efd9db08f56b6ddfd341dae2211331dcdcb82ff

2010年9月,18岁的吴佳俊通过全国信息学奥林匹克竞赛从上海华东师范大学第二附属中学保送至清华大学。

就读清华期间,吴佳俊一度成为话题人物。当时吴佳俊正参选2013年清华大学本科生特等奖学金,他的一份个人履历引起了广泛的关注。其中最受关注的一项成就是:顶级会议CVPR 2014审稿人。

此后,吴佳俊时常被被外界冠以超强履历、新一代学神等形容词。

相关论文

最后,如果你对上述提及的四篇论文感兴趣,可以前方吴佳俊的个人主页查看,地址:jiajunwu.com。

另外,在量子位微信公众号(ID:QbitAI)后台回复:“吴佳俊”三个字,也能获得这四篇论文的下载地址。

本文作者:问耕
原文发布时间: 2017-12-19
相关文章
|
3天前
|
机器学习/深度学习 人工智能 算法
UCLA、MIT数学家推翻39年经典数学猜想!AI证明卡在99.99%,人类最终证伪
近日,加州大学洛杉矶分校和麻省理工学院的数学家团队成功推翻了存在39年的“上下铺猜想”(Bunkbed Conjecture),该猜想由1985年提出,涉及图论中顶点路径问题。尽管AI在研究中发挥了重要作用,但最终未能完成证明。人类数学家通过深入分析与创新思维,找到了推翻猜想的关键证据,展示了人类智慧在数学证明中的不可替代性。成果发表于arXiv,引发了关于AI在数学领域作用的广泛讨论。
113 89
|
3月前
|
机器学习/深度学习 人工智能
打开AI黑匣子,三段式AI用于化学研究,优化分子同时产生新化学知识,登Nature
【10月更文挑战第11天】《自然》杂志发表了一项突破性的化学研究,介绍了一种名为“Closed-loop transfer”的AI技术。该技术通过数据生成、模型训练和实验验证三个阶段,不仅优化了分子结构,提高了光稳定性等性质,还发现了新的化学现象,为化学研究提供了新思路。此技术的应用加速了新材料的开发,展示了AI在解决复杂科学问题上的巨大潜力。
44 1
|
17天前
|
机器学习/深度学习 人工智能 自然语言处理
AI自己长出了类似大脑的脑叶?新研究揭示LLM特征的惊人几何结构
近年来,大型语言模型(LLM)的内部运作机制备受关注。麻省理工学院的研究人员在论文《The Geometry of Concepts: Sparse Autoencoder Feature Structure》中,利用稀疏自编码器(SAE)分析LLM的激活空间,揭示了其丰富的几何结构。研究发现,特征在原子、大脑和星系三个尺度上展现出不同的结构,包括晶体结构、中尺度模块化结构和大尺度点云结构。这些发现不仅有助于理解LLM的工作原理,还可能对模型优化和其他领域产生重要影响。
58 25
|
22天前
|
人工智能 数据挖掘
AI长脑子了?LLM惊现人类脑叶结构并有数学代码分区,MIT大牛新作震惊学界!
麻省理工学院的一项新研究揭示了大型语言模型(LLM)内部概念空间的几何结构,与人脑类似。研究通过分析稀疏自编码器生成的高维向量,发现了概念空间在原子、大脑和星系三个层次上的独特结构,为理解LLM的内部机制提供了新视角。论文地址:https://arxiv.org/abs/2410.19750
66 12
|
2月前
|
机器学习/深度学习 人工智能 Python
MuCodec:清华、腾讯AI、港中文共同推出的超低比特率音乐编解码器
MuCodec是由清华大学深圳国际研究生院、腾讯AI实验室和香港中文大学联合开发的超低比特率音乐编解码器。它能够在0.35kbps至1.35kbps的比特率下实现高效的音乐压缩和高保真重建,适用于在线音乐流媒体服务、音乐下载、语言模型建设等多个应用场景。
41 1
MuCodec:清华、腾讯AI、港中文共同推出的超低比特率音乐编解码器
|
2月前
|
人工智能 开发者
人类自身都对不齐,怎么对齐AI?新研究全面审视偏好在AI对齐中的作用
论文《AI对齐中的超越偏好》挑战了偏好主义AI对齐方法,指出偏好无法全面代表人类价值观,存在冲突和变化,并受社会影响。文章提出基于角色的对齐方案,强调AI应与其社会角色相关的规范标准一致,而非仅关注个人偏好,旨在实现更稳定、适用性更广且更符合社会利益的AI对齐。论文链接:https://arxiv.org/pdf/2408.16984
37 2
|
2月前
|
人工智能 知识图谱
成熟的AI要学会自己搞研究!MIT推出科研特工
MIT推出科研特工SciAgents,结合生成式AI、本体表示和多代理建模,实现科学发现的自动化。通过大规模知识图谱和多代理系统,SciAgents能探索新领域、识别复杂模式,加速新材料发现,展现跨学科创新潜力。
47 12
|
2月前
|
人工智能 算法 搜索推荐
清华校友用AI破解162个高数定理,智能体LeanAgent攻克困扰陶哲轩难题!
清华校友开发的LeanAgent智能体在数学推理领域取得重大突破,成功证明了162个未被人类证明的高等数学定理,涵盖抽象代数、代数拓扑等领域。LeanAgent采用“持续学习”框架,通过课程学习、动态数据库和渐进式训练,显著提升了数学定理证明的能力,为数学研究和教育提供了新的思路和方法。
69 3
|
2月前
|
机器学习/深度学习 人工智能 算法
基于AI的性能优化技术研究
基于AI的性能优化技术研究
|
2月前
|
机器学习/深度学习 人工智能 自然语言处理
AI与艺术创作:机器的艺术天赋
【10月更文挑战第31天】本文探讨了AI在艺术创作中的应用及其独特“艺术天赋”。从绘画、音乐、文学到设计,AI通过计算机视觉、自然语言处理和生成对抗网络等技术,逐渐展现出强大的创作能力。尽管面临原创性、审美标准和法律伦理等挑战,AI艺术创作仍为艺术界带来了新的视角和灵感,未来有望与人类艺术家共同推动艺术的创新与发展。