用图像来重建3D数字几何结构是计算机视觉领域一个非常核心的问题。这种技术在许多领域都有广泛的应用,例如电影制作、视频游戏的内容生成、虚拟现实和增强现实、3D打印等等。
伯克利人工智能研究中心的Christian Häne等人发表一篇论文 Hierarchical Surface Prediction for 3D Object Reconstruction,论文中他们讨论如何从单张色彩图像重建出高质量的3D几何结构,就像下面这幅图所显示的。
人类可以轻易地基于2D彩色图片,建立3D几何模型。在电子游戏和动画电影中,这样的例子不胜枚举。如果我们想要在游戏中新增一种武器,通常美术师可以根据简单的一副照片,就可以绘制出一个相似的3D几何模型。
如果人类可以办到,机器人未尝不能小试牛刀。在类似上文描述的建模过程中,有个问题由此引出——人类的双目视觉,针对3D几何建模,是否完全必要?
数学家通常会说,这种算法具有三次复杂度或者三位缩放。这就意味着,如果我们想提高哪怕一点点3D模型的分辨率,也都需要再花费很长很长时间。三维部件的难度非常大,即便是采用这种的方法,使用适高分辨率,也是不能忍受的。
本期论文提供了一个打破这种限制的方法,这种新的方法依然采用学习算法来预测几何体,但是它是分步骤建立3D模型:这意味着刚开始,它只是估计粗略的几何形体,然后重复上述过程,增加越来越多的细节,几步过后,几何体变得越来越精细。
现在,只有我们很仔细地设计精细算法才会起作用。如何实现精细化呢?论文讨论了利用创建模型的每一步蕴含的额外信息,也就是说,我们把预测的3D模型想象成一些小块的集合,每一个快被分类成空闲空间,被占用的空间或表面。通过这项分类, 我们才有可能集中精力去精细化模型的表面,这显著改善了算法运行的时间。结果,相比于之前的方法,我们得到了更高分辨率的3D模型。虽然输出结果仍然不是超高分辨率,但是结果捕获了相当数量的表面细节信息。
这篇论文在将来可以节省很多业内3D建模美术家的时间。科学研究是人类进步的基石,期待以后会有更多相关课题的研究可以改变世界,让我们的生活变得更加美好。
▷ 观看论文解读大概需要 3 分钟
学霸们还请自行阅读论文以获得更多细节
论文传送:https://arxiv.org/abs/1705.08168
雷锋网(公众号:雷锋网)AI研习社出品系列短视频《 2 分钟论文 》,带大家用碎片时间阅览前沿技术,了解 AI 领域的最新研究成果。欢迎关注雷锋网雷锋字幕组专栏,获得更多AI知识~感谢志愿者对本期内容作出贡献。