图像处理大作业:基于Seam Carving实现图像的重定位

简介: 图像处理大作业:基于Seam Carving实现图像的重定位

相比于算法目标的复杂,算法步骤却异常的简单,下面具体介绍利用 SeamCarving 算法进行图像剪裁的步骤:


1.计算图像中每个像素的“重要程度”(能量),生成能量图。在绝大多数情况下,我们可以做出如下假设:像素值变化越剧烈的区域(如边界,角点),是人眼最容易捕捉到的区域,也是图像相对重要的区域。与此相反,像素变化较为平缓的区域,很多情况下使图像中的“背景区域”,是人们很少关注的区域。所以,算法给出一个简易假设:如果一个像素梯度绝对值较大,则该像素重要,算法倾向于保留。而某像素位置的梯度绝对值接近 0,则该像素不重要,算法倾向于删除。因此,某像素的“重要度”(能量)可由以下公式计算得出:


867c1cd09926da3f2a99325ff4d471fc.png


每个像素按照上述公式算出能量值后,构成能量图 E。

  1. 从能量图中找到一条能量累积最小的纵向八连通路径,称之为 Seam。

通常在这个步骤中使用动态规划算法,能够使得算法的时间复杂度从 n3^n

(暴力搜索)降低至 n^22。其核心步骤是构建能量累计图 M,其计算方式如下:

e0eaabbf9a11ed8557e8c579310bace6.png


在此同时,记录每一个像素最小能量路径的前置像素。之后,从 M 最后一行找到能量累积最小的像素,从此像素开始,根据前置像素信息回溯到第一行,最终找到一条能量累积最小的纵向连通路径。


3.删除上一步骤中得到的连通路径。


4.重复 1 至 3 步骤,直到删除的列数符合剪裁要求。


5.将图像旋转 90°,重复 1-4 步骤,直到删除的行数符合剪裁要求。


6.将图像旋转回原图方向。对于图像重定向的任务,其核心思路是:首先通过其他方法对原有图像进行等比例放缩(例如双线性插值放大图像),之后在该图像上利用 SeamCarving 进行图像剪裁,即可起到图像重定向的效果。


而对于区域删除的任务,只需要将待删除像素的重要性(能量)特殊标注为 ∞,就能使生成的 Seam 通过待删除区域,不断删除 Seam 直到将目标区域完全删除。同理,对于不想误删的区域,可手动将其重要性(能量)标注为 +∞。


三、算法实现


1. 计算能量图

本次实现选取 Sobel 算子计算像素点的梯度,Sobel 算子形式如下:

d8cbb2bf4e7bb8186129c2d45318ef19.png



该算子与原图像做卷积,可以得出图像每个像素点的梯度,这就构成了算法描述中提到的能量图,其代码实现如下图:


2966707bb93baad47dba4f719f569229.jpg


2.计算能量累积图

生成能量累积图过程中值得注意的问题是,计算时需要时刻记录每个像素在其最小能量连通路径中的前置节点,这样方便在找到最小累积值对应的像素之后,回溯找到整条最小能量连通路径。其实现代码如下所示:


a8bc1f6bb520018e2795e109543dfcdb.png


3.找出最小能量连通路径并删除这部分

通过上一步骤中生成的前置节点信息 track,回溯找到最小能量的联通路径,最终对其进行删除,其实现代码如下所示:

492b84eed3af94f1f7b502a4f2bbc670.jpg



4.根据目标图片尺寸对原图进行剪裁。

其实现代码如下:


c577d278c23522a48f42cc30d43c6fb0.jpg



5.图像重定向

实现代码图像的重定向主要针对目标尺寸比原图像尺寸大的情况(若重定向尺寸较原图小,可直接进行图像剪裁)。针对这种情况,首先根据目标尺寸的长宽,适当等比例放大原图像,针对放大后的图像再进行上述的图像剪裁操作,最终完成图像重定向的目标。

5138a9adf7e27dcf42c7b0137e1e5307.jpg

6. 区域删除的实现

1)设定某矩形区域能量值为 ∞,并删除一条最小能量连通路径

36196fb97803d190bcae82cffca83511.jpg

2)多次删除连通路径,直到指定区域完全被删除

90ee6c7d51654bfd740d4f16d2075ed3.jpg

554f2c912a3c23fc74b1a2612983f47c.jpg

其中值得注意的是,第一个函数是将标定的矩形区域以纵向删除的方式进行去除(一次删除矩形中的一列),而后者则是以横向的方式对选定矩形区域删除(一次删除矩形中的一行)。根据选定目标的不同,两种删除方式得到的结果也有所不同。

四、实验结果与分析


1. 中间结果的可视化

1)原图像读取


c5dfe983dce3531f140faf64555e4a35.png


2)能量图


f693ac6503bc8e8d8b5674bc5a91b693.png

3)能量累积图

aeb4a5c5aaba0f9ca1e92c1574d5ad86.png



4)找到最小能量连通路径左边图像中使用红色细线标注(中部偏右),右边图像使用绿色细线标注(靠左部分)。


73e5dd6793455b5d1b27cfab3f0500ad.png


2.图像剪裁


f18cc82a14286241321d61858c80dbb5.png

29b1b2b0cff330c8ec7f3af62ee773d6.png



如上图所示,第一幅图像由 333500 像素剪裁为 333300 像素,第二幅图像由 500*500 像素剪裁为 400450 像素。左半部分均为原图像,右半部分图像则是剪裁后的结果。可以看出在上述两种情况下,剪裁前后图像几乎没有发生扭曲和变形。最重要的是,图像中重要的物体和区域(船、人物等)没有因为长宽比例的变化而发生挤压和拉伸。

15705e5c7f0d7b937f4250c6e9e4f2c1.png



对于上述情况,将图像由 500500 像素剪裁至 500350 像素。图像变窄的同时人物面部也发生了可见的扭曲和变形,这是由于人物皮肤区域较为平滑,但其位于图像的前景区域,这种情况下不能仅根据像素梯度判断该像素是是否重要。对于前景比例较大或前景区域较为平滑的图像,SeamCarving 通常会得到不理想的结果,这是算法的重要缺陷之一.


3.图像放缩

这部分内容与上一部分相似,仅放出实验结果:


fb53ede8015db3a4c93f862d8a36b581.png4b1d545483fe9b9c572e5a9754aea634.png54d9a9de62e0f9fa90d4661080dc24fa.png


3528a973e40c5a84c34f3dc35401e933.png



第一幅图由 333500 像素重定向至 320400 像素,第二幅图由 500500 像素重定向至 550600 像素

4.区域删除

本次实验选取某一矩形区域,对其进行删除。左侧图像中待删除的矩形区域标记有蓝紫色蒙版(远方的小船),右侧图像为删除矩形后的图像:


70adbbb8fb52881f57b9347fa15ec6db.png


c80ef3fb23ec66e87c3c0ef7fdff60f1.png


上述两组删除实例中,前者是纵向删除矩形中的像素(一次删除矩形的一列),后者则是横向删除矩形中的像素。所以删除前后,前一副图像的宽度变窄,而后一幅图像的高度降低。但无论是横向删除还是纵向删除,删除后的图像依然没有发生明显的形变与扭曲,保持着良好的稳定性与可视性。

9b0b7c0e870e7f5077a11b8bb354000a.png

c7112568c7986789e0dcbb1eab628f1d.png


而在以上两组删除实例中,对于图中人脸嘴唇区域的删除,前者采取了纵向删除的方式,而后者采用了横向删除的方式。可以明显地看出,纵向删除的方式极大地扭曲了人脸图像,而横向删除后的图像看上去则比较自然,甚至产生了人物“抿嘴”的效果。所以,针对不同的图像、不同的待删除区域,应该慎重选择删除的策略。


五、尝试与发现

1.改变像素重要性评价指标


上文图像剪裁第三组实验中,Lena 图像人脸在经过 SeamCarving 剪裁之后,人脸区域发生扭曲,影响了图像的整体观感。这是由于人的皮肤虽然是图像的前景,但其梯度较为平滑,导致了算法的误删。为了解决这个问题,需要让算法更加“智能”地判断像素的“重要性”,所以,本文尝试增加像素的重要性评价指标,结合前景分离的技术(GrabCut),提升前景像素的重要性,最终使得图像剪裁更加“智能”。


GrabCut 是迭代的 GraphCut 算法。该算法利用了图像中的纹理(颜色)信息和边界(反差)信息,能够较为迅速地将图像中的前景和背景分离,该算法为每个像素估计其为前景的概率,根据阈值完成图像的像素级分割。

8e736f4e6032d0d6e07f0c1b1ce3268a.png

上图是 GrabCut 对 Lena 图像进行前景分离的结果,可以看到算法把前景中的人像较为完整地保留了下来,背景则以黑色像素替代。但是受限于算法的能力,可以看到分离后的图像仍然带有一些背景信息。


b74cc410ea42e48540e0d3246642bd53.png



如上图所示,左图为直接利用 SeamCarving 对图像进行剪裁的结果,而右图则是经过 GrabCut 提升前景像素重要性(能量值)后图像剪裁的结果。第一幅图的人像发生了扭曲变形,双眼间距明显变小。而后者能够较为完整地保留图像中的人像,即“重要区域”,删除较多的部分则是图像左半部分的背景。


2. 加速剪裁过程

经过实验,SeamCarving 把一帧 500500 的图像剪裁到 500425 大小需要超过 2 分钟的时间,这样的时间性能还有很大的提升余地。在实验过程中发现,计算能量累积图 M 是占用时间较多的步骤之一,所以为了避免重复计算 M,本文试图根据单次 M 的计算结果删除多条连通路径。这个过程有两种简易的方式实现,下文是对两种方式的实现与探讨:


1.删除一条连通路径周围的像素在绝大多数情况下,连通路径周围的像素与路径上的像素较为相似,通常的能量值也较小。所以第一个思路即对连通路径进行“加粗”,从而一次删除多条路径,如下图所示:



7679e14d02548da19e356c5270844a0b.png

这种方式的弊端显而易见:如果仅删除一条较“窄”的路径,周围像素的色差不会很明显,而删除了较“粗”的路径,图像中容易出现可见色差。


2.利用 M 计算出多条路径其思路如下:根据 M 的计算结果,算法按照能量累积从小到大的顺序,贪心地寻找没有“交叉”的多条路径,结果如下图三条绿色路径所示:



7d7b07aecb50dc8c2d878bd87d48429f.png

当然,这种方式的弊端也较为明显:为了使路径没有交叉的像素,靠后选择的路径能量累积值可能较大,那条路径很有可能是需要保留的路径。


27673e4f4047f33a15f6d3d6475a7b56.png


上图中分别使用三种方式将 500500 的图像剪裁至 500425 像素,三种剪裁方式分别是一次删除单一路径、上述方法一(“粗”路径)以及上述方法二(多条非交叉路径),其中方法一和方法二均一次删除三条路径用以加速算法。总体来说,三种方法的到的结果较为近似,但上述方法一由于删除的路径较“粗”,可以在人脸上看到明显的色差,效果不如其他两种方式。三种方式剪裁的时间分别为:

6fbb35df07454d930571f44cdac47b2a.jpg


可以看出,两种改进方式较之原方法,时间性能均提升了 3 倍左右。然而综合来看,两种加速算法都有较大的弊端,而且尽管时间性能成倍提升,也远远不能达到实时运行,这很大程度上受限于动态规划时间复杂度限制,如果要彻底改进 SeamCarving 的时间性能,可能需要改变动态规划这一关键步骤。


完整代码:https://download.csdn.net/download/qq_38735017/87409869

相关文章
|
8月前
|
算法 计算机视觉
图像去雨-雨线清除-图像处理-(计算机作业附代码)
图像去雨-雨线清除-图像处理-(计算机作业附代码)
|
数据挖掘 计算机视觉 Python
Python数据分析中图像处理的实用技术点:图像加载与保存、图像转换与增强、特征提取与描述
Python数据分析中图像处理的实用技术点:图像加载与保存、图像转换与增强、特征提取与描述
99 1
Python数据分析中图像处理的实用技术点:图像加载与保存、图像转换与增强、特征提取与描述
|
8月前
|
存储 搜索推荐 算法
【源码】医学影像PACS实现三维影像后处理等功能
【源码】医学影像PACS实现三维影像后处理等功能
104 0
【源码】医学影像PACS实现三维影像后处理等功能
|
8月前
|
人工智能 Linux API
OpenCV这么简单为啥不学——1.1、图像处理(灰度图、模糊图片、GaussianBlur函数、提取边缘、边缘膨胀、边缘细化)
OpenCV这么简单为啥不学——1.1、图像处理(灰度图、模糊图片、GaussianBlur函数、提取边缘、边缘膨胀、边缘细化)
115 0
|
机器学习/深度学习 传感器 算法
【交互式阈值二进制图像】采用彩色或单色图像通过交互/手动方式阈值单色图像或彩色图像的单个色带研究(Matlab代码实现)
【交互式阈值二进制图像】采用彩色或单色图像通过交互/手动方式阈值单色图像或彩色图像的单个色带研究(Matlab代码实现)
|
存储 前端开发 数据可视化
3D激光SLAM:LeGO-LOAM---两步优化的帧间里程计及代码分析
**LeGO-LOAM**的全称是 Lightweight and Ground-Optimized Lidar Odometry and Mapping on Variable Terrain 其中LeGO就是轻量级和利用地面优化,轻量级的实现就是通过两步的优化方式,利用地面优化的部分也在两步优化的第一步中。 和原始LOAM一样,通过前后两帧点云来估计两帧之间的运动,从而累加得到前端里程计的输出,和上述方法使用线面约束同时优化六自由度帧间位姿不同,LeGO-LOAM的前端分成两个步骤,每个步骤估计三自由度的变量。 通过这种方式进行帧间里程计的运算,可以提供运算效率,使得可以在嵌入式平台
3D激光SLAM:LeGO-LOAM---两步优化的帧间里程计及代码分析
|
算法 数据可视化
Halcon边缘检测和线条检测(3),文章含BLOB检测常用方法和shape_trans内接和外接算子的说明
Halcon边缘检测和线条检测(3),文章含BLOB检测常用方法和shape_trans内接和外接算子的说明
2259 0
Halcon边缘检测和线条检测(3),文章含BLOB检测常用方法和shape_trans内接和外接算子的说明
|
8月前
|
存储 计算机视觉 流计算
【OpenCV】计算视频的光流并跟踪物体calcOpticalFlowPyrLK
【OpenCV】计算视频的光流并跟踪物体calcOpticalFlowPyrLK
353 0
|
8月前
|
存储 算法 算法框架/工具
基于HSV色度空间的图像深度信息提取算法FPGA实现,包含testbench和MATLAB辅助验证程序
该文档介绍了在一个FPGA项目中使用HSV色彩模型提取图像深度信息的过程。通过将RGB图像转换为HSV,然后利用明度与深度的非线性映射估计深度。软件版本为Vivado 2019.2和MATLAB 2022a。算法在MATLAB中进行了对比测试,并在FPGA上实现了优化,包括流水线并行处理和查找表技术。提供的Verilog代码段展示了RGB到灰度的转换。实验结果和核心程序的图片未显示。
|
8月前
|
存储 传感器 算法
相机标定系列---opencv相关标定算子
相机标定系列---opencv相关标定算子
181 0