opencv几何变换(python)-阿里云开发者社区

几何变换是指将一幅图像映射到另外一幅图像内的操作。

缩放

使用函数cv2.resize()实现对图像的缩放

dst = cv2.resize( src, dsize[, fx[, fy[, interpolation]]] )

dst代表输出的目标图像，该图像的类型与src相同，其大小为dsize（当该值非零时），或者可以通过src.size()、fx、fy计算得到。
src代表需要缩放的原始图像
dsize代表输出图像大小。
fx代表水平方向的缩放比例。
fy代表垂直方向的缩放比例。
在cv2.resize()函数中，目标图像的大小可以通过“参数dsize”或者“参数fx和fy”二者之一来指定，具体介绍如下。
情况1：通过参数dsize指定
如果指定参数dsize的值，则无论是否指定了参数fx和fy的值，都由参数dsize来决定目标图像的大小。
dsize内第1个参数对应缩放后图像的宽度（width，即列数cols，与参数fx相关），第2个参数对应缩放后图像的高度（height，即行数rows，与参数fy相关）
指定参数dsize的值时，x方向的缩放大小（参数fx）为：

(double)dsize.width/src.cols

同时，y方向的缩放大小（参数fy）为：

(double)dsize.height/src.rows

情况2：通过参数fx和fy指定
如果参数dsize的值是None，那么目标图像的大小通过参数fx和fy来决定。此时，目标图像的大小为：

dsize=Size(round(fx*src.cols), round(fy*src.rows))

目标图像dst的最终大小和类型是通过src、dsize、fx、fy指定的。

interpolation代表插值方式插值是指在对图像进行几何处理时，给无法直接通过映射得到值的像素点赋值。目标图像上的该像素点不能对应到原始图像的某个具体位置上，此时也要对这些像素点进行插值处理，以完成映射。

当缩小图像时，使用区域插值方式（INTER_AREA）能够得到最好的效果；
当放大图像时，使用三次样条插值（INTER_CUBIC）方式和双线性插值（INTER_LINEAR）方式都能够取得较好的效果。

三次样条插值方式速度较慢，双线性插值方式速度相对较快且效果并不逊色。

例子

使用函数cv2.resize()对一个数组进行简单缩放。

import cv2 
import numpy as np 
img=np.ones([2,4,3], dtype=np.uint8) 
size=img.shape[:2] 
rst=cv2.resize(img, size) 
print("img.shape=\n", img.shape) 
print("img=\n", img) 
print("rst.shape=\n", rst.shape) 
print("rst=\n", rst)

注意

目标图像的行数是原始图像的列数。
目标图像的列数是原始图像的行数。

函数cv2.resize()内dsize参数与图像shape属性在行、列的顺序上是不一致的

在shape属性中，第1个值对应的是行数，第2个值对应的是列数
在dsize参数中，第1个值对应的是列数，第2个值对应的是行数

在使用cv2.resize()函数时，要额外注意参数dsize的属性顺序问题。

例子

使用函数cv2.resize()完成一个简单的图像缩放。

import cv2 
img=cv2.imread("lena.jpg") 
rows, cols=img.shape[:2] 
size=(int(cols*0.9), int(rows*0.5)) 
rst=cv2.resize(img, size) 
print("img.shape=", img.shape) 
print("rst.shape=", rst.shape)

控制函数cv2.resize()的fx参数、fy参数，完成图像缩放

import cv2 
img=cv2.imread("lena.jpg") 
rst=cv2.resize(img, None, fx=2, fy=0.5) 
print("img.shape=", img.shape) 
print("rst.shape=", rst.shape)

fx进行的是水平方向的缩放
fy进行的是垂直方向的缩放

翻转

图像的翻转采用函数cv2.flip()实现

该函数能够实现图像在水平方向翻转、垂直方向翻转、两个方向同时翻转

dst = cv2.flip( src, flipCode )

dst代表和原始图像具有同样大小、类型的目标图像。
src代表要处理的原始图像
flipCode代表旋转类型。

该函数中，目标像素点与原始像素点的关系可表述为：

例子

使用函数cv2.flip()完成图像的翻转

import cv2 
img=cv2.imread("lena.jpg") 
x=cv2.flip(img,0) 
y=cv2.flip(img,1) 
xy=cv2.flip(img, -1) 
cv2.imshow("img", img) 
cv2.imshow("x", x) 
cv2.imshow("y", y) 
cv2.imshow("xy", xy) 
cv2.waitKey() 
cv2.destroyAllWindows()

仿射

仿射变换是指图像可以通过一系列的几何变换来实现平移、旋转等多种操作。

该变换能够保持图像的平直性和平行性。

平直性是指图像经过仿射变换后，直线仍然是直线；平行性是指图像在完成仿射变换后，平行线仍然是平行线。

OpenCV中的仿射函数为cv2.warpAffine()，其通过一个变换矩阵（映射矩阵）M实现变换，具体为：

dst(x, y)=src(M11x+M12y+M13, M21x+M22y+M23)

通过一个变换矩阵M，将原始图像O变换为仿射图像R。

采用仿射函数cv2.warpAffine()实现对图像的变换，该函数的语法格式如下：

dst = cv2.warpAffine( src, M, dsize[, flags[, borderMode[, borderValue]]] )

dst代表仿射后的输出图像，该图像的类型和原始图像的类型相同。dsize决定输出图像的实际大小。
src代表要仿射的原始图像。
M代表一个2×3的变换矩阵。使用不同的变换矩阵，就可以实现不同的仿射变换。
dsize代表输出图像的尺寸大小。
flags代表插值方法，默认为INTER_LINEAR。当该值为WARP_INVERSE_MAP时，意味着M是逆变换类型，实现从目标图像dst到原始图像src的逆变换。
borderMode代表边类型，默认为BORDER_CONSTANT。当该值为BORDER_TRANSPARENT时，意味着目标图像内的值不做改变，这些值对应原始图像内的异常值。
borderValue代表边界值，默认是0。

在OpenCV中使用函数cv2.warpAffine()实现仿射变换，忽略其可选参数后的语法格式为：

dst = cv2.warpAffine( src , M , dsize )

其通过转换矩阵M将原始图像src转换为目标图像dst：

dst(x, y)=src(M11x+M12y+M13, M21x+M22y+M23)

进行何种形式的仿射变换完全取决于转换矩阵M。

平移

将原始图像src向右侧移动100个像素、向下方移动200个像素，则其对应关系为：

dst (x, y)=src (x+ 100, y+ 200)

将上述表达式补充完整，即：

dst (x, y)=src (1·x+ 0·y+ 100, 0·x+ 1·y+ 200)

可以确定对应的转换矩阵M中各个元素的值为：

例子

图像平移

import cv2 
import numpy as np 
img=cv2.imread("lena.jpg") 
height, width=img.shape[:2] 
x=100 
y=200 
M = np.float32([[1, 0, x], [0, 1, y]]) 
move=cv2.warpAffine(img, M, (width, height)) 
cv2.imshow("original", img) 
cv2.imshow("move", move) 
cv2.waitKey() 
cv2.destroyAllWindows()

旋转

可以通过函数cv2.getRotationMatrix2D()获取转换矩阵。该函数的语法格式为：

retval=cv2.getRotationMatrix2D(center, angle, scale)

center为旋转的中心点。
angle为旋转角度，正数表示逆时针旋转，负数表示顺时针旋转。
scale为变换尺度（缩放大小）。

想要以图像中心为圆点，逆时针旋转45°，并将目标图像缩小为原始图像的0.6倍，则在调用函数cv2.getRotationMatrix2D()生成转换矩阵M时所使用的语句为：

M=cv2.getRotationMatrix2D((width/2,height/2),45,0.6)

例子

图像旋转

import cv2 
img=cv2.imread("lena.jpg") 
height, width=img.shape[:2] 
M=cv2.getRotationMatrix2D((width/2, height/2),45,0.6) 
rotate=cv2.warpAffine(img, M, (width, height)) 
cv2.imshow("original", img) 
cv2.imshow("rotation", rotate) 
cv2.waitKey() 
cv2.destroyAllWindows()

更复杂的仿射变换

对于更复杂仿射变换，OpenCV提供了函数cv2.getAffineTransform()来生成仿射函数cv2.warpAffine()所使用的转换矩阵M。

该函数的语法格式为：

retval=cv2.getAffineTransform(src, dst)

src代表输入图像的三个点坐标。
dst代表输出图像的三个点坐标。

参数值src和dst是包含三个二维数组(x, y)点的数组。

指代原始图像和目标图像内平行四边形的三个顶点（左上角、右上角、左下角）

上述参数通过函数cv2.getAffineTransform()定义了两个平行四边形。

src和dst中的三个点分别对应平行四边形的左上角、右上角、左下角三个点。

函数cv2.warpAffine()以函数cv2.getAffineTransform()获取的转换矩阵M为参数，将src中的点仿射到dst中。

函数cv2.getAffineTransform()对所指定的点完成映射后，将所有其他点的映射关系按照指定点的关系计算确定。

import cv2 
import numpy as np 
img=cv2.imread('lena.bmp') 
rows, cols, ch=img.shape 
p1=np.float32([[0,0], [cols-1,0], [0, rows-1]]) 
p2=np.float32([[0, rows*0.33], [cols*0.85, rows*0.25], [cols*0.15, rows*0.7]]) 
M=cv2.getAffineTransform(p1, p2) 
dst=cv2.warpAffine(img, M, (cols, rows)) 
cv2.imshow("origianl", img) 
cv2.imshow("result", dst) 
cv2.waitKey() 
cv2.destroyAllWindows()

透视

仿射变换可以将矩形映射为任意平行四边形
透视变换则可以将矩形映射为任意四边形

透视变换通过函数cv2.warpPerspective()实现

dst = cv2.warpPerspective( src, M, dsize[, flags[, borderMode[, borderValue]]] )

dst代表透视处理后的输出图像，该图像和原始图像具有相同的类型。dsize决定输出图像的实际大小。
src代表要透视的图像。
M代表一个3×3的变换矩阵。
dsize代表输出图像的尺寸大小。
flags代表插值方法，默认为INTER_LINEAR。当该值为WARP_INVERSE_MAP时，意味着M是逆变换类型，能实现从目标图像dst到原始图像src的逆变换。
borderMode代表边类型，默认为BORDER_CONSTANT。当该值为BORDER_TRANSPARENT时，意味着目标图像内的值不做改变，这些值对应原始图像内的异常值。
borderValue代表边界值，默认是0。

与仿射变换一样，同样可以使用一个函数来生成函数cv2.warpPerspective()所使用的转换矩阵。

该函数是cv2.getPerspectiveTransform()，其语法格式为：

retval = cv2.getPerspectiveTransform( src, dst )

src代表输入图像的四个顶点的坐标。
dst代表输出图像的四个顶点的坐标。

src参数和dst参数是包含四个点的数组，与仿射变换函数cv2.getAffineTransform()中的三个点是不同的。

图像透视

import cv2 
import numpy as np 
img=cv2.imread('demo.bmp') 
rows, cols=img.shape[:2] 
pts1 = np.float32([[150,50], [400,50], [60,450], [310,450]]) 
pts2 = np.float32([[50,50], [rows-50,50], [50, cols-50], [rows-50, cols-50]]) 
M=cv2.getPerspectiveTransform(pts1, pts2) 
dst=cv2.warpPerspective(img, M, (cols, rows)) 
cv2.imshow("img", img) 
cv2.imshow("dst", dst) 
cv2.waitKey() 
cv2.destroyAllWindows()

重映射

把一幅图像内的像素点放置到另外一幅图像内的指定位置，这个过程称为重映射。

OpenCV内的重映射函数cv2.remap()其语法格式如下：

dst = cv2.remap( src, map1, map2, interpolation[, borderMode[, borderValue]] )

dst代表目标图像，它和src具有相同的大小和类型。
src代表原始图像。
map1参数有两种可能的值：

表示(x, y)点的一个映射。
表示CV_16SC2 , CV_32FC1, CV_32FC2类型(x, y)点的x值。

map2参数同样有两种可能的值：

当map1表示(x, y)时，该值为空。
当map1表示(x, y)点的x值时，该值是CV_16UC1, CV_32FC1类型(x, y)点的y值。

map1,map2 可以代表的不仅仅是一个点，而是多个点

Interpolation代表插值方式，这里不支持INTER_AREA方法
borderMode代表边界模式。当该值为BORDER_TRANSPARENT时，表示目标图像内的对应源图像内奇异点（outliers）的像素不会被修改。
borderValue代表边界值，该值默认为0。

映射参数的理解

重映射通过修改像素点的位置得到一幅新图像。

在构建新图像时，需要确定新图像中每个像素点在原始图像中的位置。所以，映射函数的作用是查找新图像像素在原始图像内的位置，该过程是将新图像像素映射到原始图像的过程，因此被称为反向映射。

参数map1和参数map2用来说明反向映射，map1针对的是坐标x, map2针对的是坐标y。map1和map2的值都是浮点数。因此，目标图像可以映射回一个非整数的值，这意味着目标图像可以“反向映射”到原始图像中两个像素点之间的位置(该位置是不存在像素值的)。可以采用不同的方法实现插值，函数中的interpolation参数可以控制插值方式。

由于参数map1和参数map2的值是浮点数，所以通过函数cv2.remamp()所能实现的映射关系变得更加随意，可以通过自定义映射参数实现不同形式的映射。

函数cv2.remap()中参数map1指代的是像素点所在位置的列号，参数map2指代的是像素点所在位置的行号。

例如: 想将目标图像（映射结果图像）中某个点A映射为原始图像内处于第0行第3列上的像素点B，那么需要将A点所对应的参数map1对应位置上的值设为3，参数map2对应位置上的值设为0。所以，通常情况下，将map1写为mapx，并且将map2写成mapy。

如果想将目标图像（映射结果图像）中所有像素点都映射为原始图像内处于第0行第3列上的像素点B，那么需要将参数map1内的值均设为3，将参数map2内的值均设为0。

例子

将目标数组内的所有像素点都映射为原始图像内第0行第3列上的像素点，

可以确定：

用来指定列的参数map1（mapx）内的值均为3。
用来指定行的参数map2（mapy）内的值均为0。

import cv2 
import numpy as np 
img=np.random.randint(0,256, size=[4,5], dtype=np.uint8) 
rows, cols=img.shape 
mapx = np.ones(img.shape, np.float32)*3 
mapy = np.ones(img.shape, np.float32)*0 
rst=cv2.remap(img, mapx, mapy, cv2.INTER_LINEAR) 
print("img=\n", img) 
print("mapx=\n", mapx) 
print("mapy=\n", mapy) 
print("rst=\n", rst) 
# 目标图像（数组）dst内的所有值都来源于原始图像中第0行第3列上的像素值252。

复制

通过该函数实现图像的复制

在映射时，将参数进行如下处理：

将map1的值设定为对应位置上的x轴坐标值。
将map2的值设定为对应位置上的y轴坐标值。

import cv2 
import cv2 
import numpy as np 
img=cv2.imread("img\\lena.jpg") 
rows, cols=img.shape[:2] 
mapx = np.zeros(img.shape[:2], np.float32) 
mapy = np.zeros(img.shape[:2], np.float32) 
for i in range(rows): 
    for j in range(cols): 
        mapx.itemset((i, j), j) 
        mapy.itemset((i, j), i) 
rst=cv2.remap(img, mapx, mapy, cv2.INTER_LINEAR) 
cv2.imshow("original", img) 
cv2.imshow("result", rst) 
cv2.waitKey() 
cv2.destroyAllWindows()

绕x轴翻转

如果想让图像绕着x轴翻转，意味着在映射过程中：

x坐标轴的值保持不变。
y坐标轴的值以x轴为对称轴进行交换。

反映在map1和map2上：

map1的值保持不变。
map2的值调整为“总行数-1-当前行号”。

import cv2 
import numpy as np 
img=cv2.imread("img\\lena.jpg") 
rows, cols=img.shape[:2] 
mapx = np.zeros(img.shape[:2], np.float32) 
mapy = np.zeros(img.shape[:2], np.float32) 
for i in range(rows): 
  for j in range(cols): 
    mapx.itemset((i, j), j) 
    mapy.itemset((i, j), rows-1-i) 
rst=cv2.remap(img, mapx, mapy, cv2.INTER_LINEAR) 
cv2.imshow("original", img) 
cv2.imshow("result", rst) 
cv2.waitKey() 
cv2.destroyAllWindows()

绕y轴翻转

如果想让图像绕着y轴翻转，意味着在映射过程中：

y坐标轴的值保持不变。
x坐标轴的值以y轴为对称轴进行交换。

反映在map1和map2上：

map2的值保持不变。
map1的值调整为“总列数-1-当前列号”。

import cv2 
import numpy as np 
img=cv2.imread("img\\lena.jpg") 
rows, cols=img.shape[:2] 
mapx = np.zeros(img.shape[:2], np.float32) 
mapy = np.zeros(img.shape[:2], np.float32) 
for i in range(rows): 
  for j in range(cols): 
    mapx.itemset((i, j), cols-1-j) 
    mapy.itemset((i, j), i) 
rst=cv2.remap(img, mapx, mapy, cv2.INTER_LINEAR) 
cv2.imshow("original", img) 
cv2.imshow("result", rst) 
cv2.waitKey() 
cv2.destroyAllWindows()

绕x轴、y轴翻转

x坐标轴的值以y轴为对称轴进行交换。
y坐标轴的值以x轴为对称轴进行交换。

反映在map1和map2上：

map1的值调整为“总列数-1-当前列号”。
map2的值调整为“总行数-1-当前行号”。

import cv2 
import numpy as np 
img=cv2.imread("img\\lena.jpg") 
rows, cols=img.shape[:2] 
mapx = np.zeros(img.shape[:2], np.float32) 
mapy = np.zeros(img.shape[:2], np.float32) 
for i in range(rows): 
  for j in range(cols): 
    mapx.itemset((i, j), cols-1-j) 
    mapy.itemset((i, j), rows-1-i) 
rst=cv2.remap(img, mapx, mapy, cv2.INTER_LINEAR) 
cv2.imshow("original", img) 
cv2.imshow("result", rst) 
cv2.waitKey() 
cv2.destroyAllWindows()

x轴、y轴互换

如果想让图像的x轴、y轴互换，意味着在映射过程中，对于任意一点，都需要将其x轴、y轴坐标互换。

反映在mapx和mapy上：

mapx的值调整为所在行的行号。
mapy的值调整为所在列的列号。

如果行数和列数不一致，上述运算可能存在值无法映射的情况。默认情况下，无法完成映射的值会被处理为0。

import cv2 
import numpy as np 
img=cv2.imread("img\\lena.jpg") 
rows, cols=img.shape[:2] 
mapx = np.zeros(img.shape[:2], np.float32) 
mapy = np.zeros(img.shape[:2], np.float32) 
for i in range(rows): 
  for j in range(cols): 
    mapx.itemset((i, j), i) 
    mapy.itemset((i, j), j) 
rst=cv2.remap(img, mapx, mapy, cv2.INTER_LINEAR) 
cv2.imshow("original", img) 
cv2.imshow("result", rst) 
cv2.waitKey() 
cv2.destroyAllWindows()

图像缩放

使用函数cv2.remap()缩小图像。

缩小图像后，可以将图像固定在围绕其中心的某个区域。

在目标图像的x轴(0.25·x轴长度，0.75·x轴长度)区间内生成缩小图像；x轴其余区域的点取样自x轴上任意一点的值。
在目标图像的y轴(0.25·y轴长度，0.75·y轴长度)区间内生成缩小图像；y轴其余区域的点取样自y轴上任意一点的值。

为了处理方便，不在上述区域的点都取(0,0)坐标点的值。

import cv2 
import numpy as np 
img=cv2.imread("img\\lena.jpg") 
rows, cols=img.shape[:2] 
mapx = np.zeros(img.shape[:2], np.float32) 
mapy = np.zeros(img.shape[:2], np.float32) 
for i in range(rows): 
  for j in range(cols): 
    if 0.25*cols< i <0.75*cols and 0.25*rows< j <0.75*rows: 
      mapx.itemset((i, j),2*( j - cols*0.25 ) + 0.5)   # x1关于x的映射函数 (x:0,x1:0.25) (x:1,x1:0.75)
      mapy.itemset((i, j),2*( i - rows*0.25 ) + 0.5) 
    else: 
      mapx.itemset((i, j),0) 
      mapy.itemset((i, j),0) 
rst=cv2.remap(img, mapx, mapy, cv2.INTER_LINEAR) 
cv2.imshow("original", img) 
cv2.imshow("result", rst) 
cv2.waitKey() 
cv2.destroyAllWindows()

opencv几何变换(python)

缩放

翻转

仿射

平移

旋转

更复杂的仿射变换

透视

重映射

复制

绕x轴翻转

绕y轴翻转

绕x轴、y轴翻转

x轴、y轴互换

图像缩放

热门文章

最新文章

相关课程

相关电子书

相关实验场景

推荐镜像

热门

活动广场

任务中心

开发者评测

高校计划

乘风者计划

训练营

阿里云MVP

话题

直播

下载

镜像站

技术资料

插件

opencv几何变换(python)

缩放

翻转

仿射

平移

旋转

更复杂的仿射变换

透视

重映射

复制

绕x轴翻转

绕y轴翻转

绕x轴、y轴翻转

x轴、y轴互换

图像缩放

热门文章

最新文章

相关课程

相关电子书

相关实验场景

推荐镜像