openCV 3计算机视觉 Python语言实现笔记第4章深度估计与分割-阿里云开发者社区

openCV 3计算机视觉 Python语言实现笔记第4章深度估计与分割

2024-06-14 53

版权

本文内容由阿里云实名注册用户自发贡献，版权归原作者所有，阿里云开发者社区不拥有其著作权，亦不承担相应法律责任。具体规则请查看《阿里云开发者社区用户服务协议》和《阿里云开发者社区知识产权保护指引》。如果您发现本社区中有涉嫌抄袭的内容，填写侵权投诉表单进行举报，一经查实，本社区将立刻删除涉嫌侵权内容。

简介： openCV 3计算机视觉 Python语言实现笔记第4章深度估计与分割

第4章深度估计与分割

使用深度摄像头的数据来识别前景区域和背景区域。

4.1 创建模块

cameo中的捕获和处理摄像头的代码可以重用，所以讲这部分代码分离放在depth.py中。4.2 捕获深度摄像头的帧

深度相关通道的概念

深度图：灰度图像；每个像素值都是摄像头到物体表面之间距离的估计值。

点云图：彩色图像；每种颜色对应一个（x、y、z）维度空间。

视差图：灰度图像；每个像素值代表物体表面的立体视差。（立体视差：同一场景在不同视角下感觉不同。针对两个物体之间任一相互对应的两个像素点，可以度量这些像素点之间的距离，这个度量度量就是立体视差。离摄像头近的立体视差小，远的大。因此近距离的物体在视差图中会更明亮）。

有效深度掩模：表明一个给定的像素的深度信息是否有效（有效非0，无效为0）。比如，如果深度摄像头依赖红外闪光灯，那么灯光被遮挡处就无效。

4.3 从视差图得到掩模

4.4 对复制操作执行掩模

4.5 用普通摄像头进行深度估计

4.6 使用分水岭和GrabCut算法进行物体分割

GrabCut算法实现步骤：

1.定义矩形：在图片中定义含有物体的矩形。

2.定义背景：矩形外的被自动认为是背景。

3.区别前景和背景

4.建模，标记未定义像素：用高斯混合模型对背景和前景建模，并将未定义的像素标记为可能的前景或背景。

5.相邻边：每一个像素都被看作通过虚拟边和周围像素相连接，每条边都有一个属于前景或背景的概率，概率基于它与周围像素颜色上的相似性。

6.连接像素：每一个像素会与一个前景或背景节点相连接。

7.节点连接后，若节点之间的边属于不同终端，则会切断他们之间的边，这就能将图像各部分分割出来。

实例：

import numpy as np

import cv2

from matplotlib import pyplot as plt

#加载图像

img = cv2.imread('statue_small.jpg')

#创建同形状的掩模

mask = np.zeros(img.shape[:2],np.uint8)

#创建以0填充的前景和背景模型

bgdModel = np.zeros((1,65),np.float64)

fgdModel = np.zeros((1,65),np.float64)

rect = (100,50,421,378)

cv2.grabCut(img,mask,rect,bgdModel,fgdModel,5,

cv2.GC_INIT_WITH_RECT)

#将掩模值为0和2的转换成0，过滤掉0值像素

mask2 = np.where((mask==2)|(mask==0),0,1).astype('uint8')

img = img*mask2[:,:,np.newaxis]

#显示图片

plt.subplot(121), plt.imshow(img)

plt.title('grabcut'), plt.xticks([]),plt.yticks([])

plt.subplot(122),plt.imshow(cv2.cvtColor(cv2.imread('statue_small.jpg'),

cv2.COLOR_BGR2RGB))

plt.title('original'), plt.xticks([]),plt.yticks([])

plt.show()

4.6.2 使用分水岭算法进行图像分割

分水岭算法：

把图像中低密度（变化少）的区域想象成山谷，高密度的区域想象成山峰。

开始向山谷中注入水，直到不同山谷中的水开始汇聚。

为了阻止不同山谷的水汇聚，可以设置一些栅栏，最后得到的栅栏就是图像分割。

import numpy as np

import cv2

from matplotlib import pyplot as plt

#加载图片，转换为灰度图片

img = cv2.imread("lion.jpg")

gray = cv2.cvtColor(img,cv2.COLOR_BGR2GRAY)

#为图像设置一个阈值，这个操作将图像分为两部分：黑色部分和白色部分

ret, thresh = cv2.threshold(

gray,0,255,cv2.THRESH_BINARY_INV+cv2.THRESH_OTSU)

#通过morphologyEx变换来去除噪声数据。这是一种对图像进行膨胀之后再进行腐蚀的操作，它可以提取图像特征

kernel = np.ones((3,3),np.uint8)

opening = cv2.morphologyEx(thresh,cv2.MORPH_OPEN,kernel,iterations=2)

#通过morphologyEx变换之后的图像进行膨胀，得到背景区域

sure_bg = cv2.dilate(opening,kernel,iterations=3)

#通过distanceTransform获取前景区域

dist_transfrom = cv2.distanceTransform(opening,cv2.DIST_L2,5)

ret,sure_fg = cv2.threshold(dist_transfrom,0.7*dist_transfrom.max(),255,0)

#找到前景和背景重合部分

sure_fg = np.uint8(sure_fg)

unkown = cv2.subtract(sure_bg,sure_fg)

ret,markers = cv2.connectedComponents(sure_fg)

#在背景区域加1，将unkown区域设置为0

markers = markers+1

markers[unkown==255] = 0

#让水漫起来将栅栏绘成红色

markers = cv2.watershed(img,markers)

img[markers==-1] = [255,0,0]

plt.imshow(img)

plt.show()

openCV 3计算机视觉 Python语言实现笔记第4章深度估计与分割

热门文章

最新文章

相关课程

相关电子书

相关实验场景

推荐镜像

热门

活动广场

任务中心

开发者评测

高校计划

乘风者计划

训练营

阿里云MVP

话题

直播

下载

镜像站

技术资料

插件

openCV 3计算机视觉 Python语言实现 笔记 第4章 深度估计与分割

热门文章

最新文章

相关课程

相关电子书

相关实验场景

推荐镜像

openCV 3计算机视觉 Python语言实现笔记第4章深度估计与分割