极智AI | 图像处理中对掩膜mask和ROI的理解-阿里云开发者社区

极智AI | 图像处理中对掩膜mask和ROI的理解

2023-12-19 83

版权

本文内容由阿里云实名注册用户自发贡献，版权归原作者所有，阿里云开发者社区不拥有其著作权，亦不承担相应法律责任。具体规则请查看《阿里云开发者社区用户服务协议》和《阿里云开发者社区知识产权保护指引》。如果您发现本社区中有涉嫌抄袭的内容，填写侵权投诉表单进行举报，一经查实，本社区将立刻删除涉嫌侵权内容。

简介： 大家好，我是极智视界，本文介绍一下图像处理中对掩膜 mask 和 ROI 的理解。

大家好，我是极智视界，本文介绍一下图像处理中对掩膜 mask 和 ROI 的理解。

掩膜的概念之前在传统图像处理中用的比较多，而进来深度学习中比较火热的如：(1) 自监督中用 mask 做一些类似 "完形填空" 的数据增强；(2) swin transformer 等新模型中对于 mask 的一些应用等。以上可以看出 mask 在深度学习领域也能发展重要作用。为了更好的表达，这里我们用传统图像处理的方式来介绍 mask 和 ROI，和深度学习中使用的 mask 原理上是一样的。

1. 对 ROI 的理解

对 ROI 的理解较简单，ROI 即感兴趣区域，即要操作的区域。

2. 对掩模的理解

掩模是 8 位单通道图像 (灰度图 / 二值图)；
掩模某个位置如果为 0，则在此位置上的操作不起作用；
掩模某个位置如果不为 0，则在此位置上的操作会起作用，即 ROI 区域；
可以用来提取不规则 ROI；

示意：

source      mask       dst
125 100 85   0  0  0   0  0  0
66  25  35   0 255 0   0  25 0
120 125 100  0  0  0   0  0  0

3. 为什么要用图像掩模

对于规则的 ROI，比如最常用的正矩形（Rect）来说可以很容易获取到感兴趣区域的图像数据，如下：

for(int y = rect.tl().y; y < rect.br().y; ++y)
{
  uchar* imgRow = img.data + y * img.step;
  for(int x = rect.tl().x; x < rect.br().x; ++x)
  {
    imgRow[x]...;
  }
}

但是对于不规则的 ROI，则很难直接提取到感兴趣区域内的图像数据，这个时候掩模的作用就体现出来了。假设掩模图像尺寸和源图像的大小一致，则：

cv::Mat dst = cv::Mat::zeros(Size(img.cols, img.rows), CV_8UC1);
for(int y = 0; y < img.rows; ++y)
{
  uchar* imgRow = img.data + y * img.step;
  uchar* maskRow = mask.data + y * img.step;
  uchar* dstRow = dst.data +y * img.step;
  for(int x = 0; x < img.cols; ++x)
  {
    if(maskRow[x] > 0)
    {
      dstRow[x] = imgRow[x]...;
    }
  }
}

4. 使用掩膜进行图像融合

使用掩模实现图像融合示例：

以上将右侧 opencv 的 Logo 融合到左侧车辆图像中，可以发现一个特点是：opencv Logo 是不规则的，这个时候用一个和右侧原图一样大小的 mask 来做掩膜是很合适的。图像融合后的效果如下：

好了，以上分享了图像处理中对掩膜 mask 和 ROI 的理解，希望我的分享能对你的学习有一点帮助。

极智AI | 图像处理中对掩膜mask和ROI的理解

1. 对 ROI 的理解

2. 对掩模的理解

3. 为什么要用图像掩模

4. 使用掩膜进行图像融合

视觉智能

热门文章

最新文章

相关课程

相关电子书

相关实验场景