我的报告是介绍我们团队最近在三维视觉方面的进展。首先介绍基本概念;然后是三维视觉的应用场合;之后是我们团队在图像匹配、视觉定位和三维重建最近几年的工作;最后是展望与趋势分析。
1.1 三维计算机视觉的概念
三维计算机视觉是要让计算机感知周围的三维环境结构、物体的形状,以及物体和物体之间的相对位置等。在三维计算机视觉里有三个关键的任务,即图像匹配、相机定位和三维重建。首先介绍基本概念。先看图像匹配,在某一幅图像上提取一些几何特征,比如点,在另外一幅图像中找到一个点,它们要满足一个条件,满足它们都来自空间中同一个物体点的像,它们就成为对应点。寻找对应点的过程,就是图像匹配。相机定位,就是我们输入一系列二维的图像和视频,根据这个视频和图像计算出相机的位置,就是给出在一个坐标系下相机的坐标xyz;还有朝向,计算机朝什么方向拍摄,这就是姿态,这是相机定位所要计算的目的。什么是基于图像的三维重建?是指输入一系列的二维图像或者视频,根据这些二维的信息计算出视频和图像包含的场景的三维结构,或者某个物体具体的三维形状,这是三维重建的目的。