11.22 人类视觉机制启发下的物体分割研究
视觉分割是指将视觉信号划分为互不重叠的区域,得到关于该信号的一个紧致表达,它是计算机视觉的核心问题之一。按照在视觉系统中的层次划分,视觉分割可以分为底层的超像素分割和中高层的物体分割,图 1 所示的是这两类分割的典型例子。
超像素分割属于底层视觉处理的范畴,其利用底层的颜色、纹理等特征将视觉信号分割成具有不同特性的区域,构成关于视觉信号的一种简化表达,即超像素[1] 。物体分割则属于中高层视觉处理的范畴,其主要指从视觉信号中提取感兴趣的物体区域(例如图 1 中的小汽车和公共汽车)。这种类型的分割在视觉系统中主要起到两个方面的作用:一是为后续视觉理解提供精确的分析区域(中层视觉)。相比于原始图像和简化的目标表达(例如矩形框),物体分割由于提供了相对精确的边缘,从而能在其上提取更丰富、更精确的特征,更利于准确地视觉理解。二是在很多应用中物体分割本身就是视觉理解的目的之一(高层视觉),即关于物体位置和边界的知识。