步入新世纪,互联网每天都会生产出海量的数字内容。对于普通消费者,在短视频的制作以及照片的修图美颜方面上,都对算法提出了更高的自动化、简易化、精细化需求。这就使得更多的企业和研究者们投身于图像、视频等传统的计算机视觉领域中。抠图方法一般多应用于电影工业,需要专业的从业者投入大量的时间和精力对图像或视频进行编辑,自动化的高精度图像抠图可以极大地帮助从业者从繁重的手动抠图工作中解放出来,着重于内容的创作。同时在消费领域也对图像和视频的编辑提出了更高精度的要求。
图像抠图方法本质上属于图像分割的范畴,图像分割就是按照一定准则,将图像划分成不同区域,这些区域内部具有相近的特征,而邻域间由于特征不同而被边界分离。类似地,图像抠图就是根据作者的意愿,提取出图像或视频中感兴趣的部分,如人物、动物、具有鲜明特征的物体等作为前景,与组成背景的部分进行分离。实现逐像素级别的分割,是一种软分割。
图像硬分割是将不同部分进行分类,来提取有价值的信息。但不同于软分割,其无法应对在高分辨率图像中提取目标区域内有效信息的精度要求。源于软分割的图像抠图方法则可以更精确地在前景与背景的复杂边界处,如人或动物的毛发区域或背景颜色相近部分获得精准的分割结果。目前抠图方法广泛使用三分图或涂鸦的方式作为计算机和用户间的交互,使得用户可以预先标记图像中的目标区域范围,以半监督的形式,辅助算法计算出准确的抠图前景。这样的预标记方式,在传统的图像抠图算法和现在流行的基于深度学习的图像抠图算法中都得到广泛应用,这对提高算法的精确度有很大帮助。