网友提问(透视变化)

简介: 您好:    我在网上看到您的opencv透视变换的博客,https://www.cnblogs.com/jsxyhelu/p/4219564.html,    我是opencv小菜鸟一个,现在想要得到一个图片变形之后保存,整个图片信息不丢失,即四个角的信息不丢失应该怎么做?原图中某一点在新图中坐标应该怎么计算?万望不吝赐教,不胜感激,万分感谢。
您好:
    我在网上看到您的opencv透视变换的博客, https://www.cnblogs.com/jsxyhelu/p/4219564.html
    我是opencv小菜鸟一个,现在想要得到一个图片变形之后保存,整个图片信息不丢失,即四个角的信息不丢失应该怎么做?原图中某一点在新图中坐标应该怎么计算?万望不吝赐教,不胜感激,万分感谢。

你好:
  我按照您的代码和网上找到的python代码( https://blog.csdn.net/fengxueniu/article/details/77964375)修改并实现的基本的透视变换,但基本原理是将原图test0.png加边界,边界值与透视之后的背景一致,是图片看起来信息为丢失。但图像旋转之后的预期效果如test1.png所示,而实际生成的图片如test2.png所示,现在想要实现从test0.png到test1.png的变换并求test0.png图中某一点坐标值在test1.png中位置,应该怎么做?对于透视变换不是特别理解。万望不吝赐教,万分感谢。
  图片与代码附注如下。

img_4c9171929e5fd4a040cdfeb61025427a.png   =》  img_9585637dca8e7d78da6597c06d98d155.png
现有代码
  #-*- coding:utf-8 -*-
#-*- coding:utf-8 -*-
import cv2
import numpy as np
import random
def rad( x):
return x*np.pi/ 180
img = cv2.imread( "test0.png")
cv2.imshow( "original", img)
#扩展图像,保证内容不超出可视范围
img = cv2.copyMakeBorder(img, 100, 100, 100, 100,cv2.BORDER_CONSTANT,( 255, 255, 255))
w,h=img.shape[ 0: 2]
cv2.imshow( "original1", img)
#anglex=45
#angley = 45
#anglez = 0
#fov = 42
anglex=random.uniform( 30, 60)
angley =random.uniform( 30, 60)
anglez =random.uniform( 30, 60)
fov = random.uniform( 30, 60)

print(anglex,angley,anglez,fov)
#镜头与图像间的距离,21为半可视角,算z的距离是为了保证在此可视角度下恰好显示整幅图像
z=np.sqrt(w** 2 + h** 2)/ 2/np.tan(rad(fov/ 2))
#齐次变换矩阵
rx = np.array([[ 1, 0, 0, 0],
[ 0, np.cos(anglex*np.pi/ 180), -np.sin(anglex*np.pi/ 180), 0],
[ 0, -np.sin(anglex*np.pi/ 180), np.cos(anglex*np.pi/ 180), 0,],
[ 0, 0, 0, 1]], np.float32)
ry = np.array([[np.cos(angley*np.pi/ 180), 0, np.sin(angley*np.pi/ 180), 0],
[ 0, 1, 0, 0],
[-np.sin(angley*np.pi/ 180), 0, np.cos(angley*np.pi/ 180), 0,],
[ 0, 0, 0, 1]], np.float32)
rz = np.array([[np.cos(anglez*np.pi/ 180), np.sin(anglez*np.pi/ 180), 0, 0],
[-np.sin(anglez*np.pi/ 180), np.cos(anglez*np.pi/ 180), 0, 0],
[ 0, 0, 1, 0],
[ 0, 0, 0, 1]], np.float32)
r = rx.dot(ry).dot(rz)
#四对点的生成
pcenter = np.array([h/ 2, w/ 2, 0, 0], np.float32)
p1 = np.array([ 0, 0, 0, 0], np.float32) - pcenter
p2 = np.array([w, 0, 0, 0], np.float32) - pcenter
p3 = np.array([ 0,h, 0, 0], np.float32) - pcenter
p4 = np.array([w,h, 0, 0], np.float32) - pcenter
dst1 = r.dot(p1)
dst2 = r.dot(p2)
dst3 = r.dot(p3)
dst4 = r.dot(p4)
list_dst = [dst1, dst2, dst3, dst4]
org = np.array([[ 0, 0],
[w, 0],
[ 0,h],
[w,h]], np.float32)
dst = np.zeros(( 4, 2), np.float32)
#投影至成像平面
for i in range( 4):
dst[i, 0] = list_dst[i][ 0]*z/(z-list_dst[i][ 2]) + pcenter[ 0]
dst[i, 1] = list_dst[i][ 1]*z/(z-list_dst[i][ 2]) + pcenter[ 1]
warpR = cv2.getPerspectiveTransform(org, dst)
print(org)
print(dst)
result = cv2.warpPerspective(img, warpR, (h,w),( 0, 255, 0))
print(result.shape)
cv2.imshow( "result", result)
cv2.imencode( '.png',result)[ 1].tofile( 'test2.png')
c=cv2.waitKey( 0)
cv2.destroyAllWindows()
这个问题的出现,在于对透视变化原理的理解;可能还有一些调试的技巧。
int _tmain(int argc_TCHARargv[])
{
    Mat src  = imread("E:/sandbox/test0.png");
    copyMakeBorder(src,src,10,10,10,10,BORDER_CONSTANT);
    if (!src.data)
        return 0;
    vector<Pointnot_a_rect_shape;
    not_a_rect_shape.push_back(Point(10,10));
    not_a_rect_shape.push_back(Point(74,10));
    not_a_rect_shape.push_back(Point(74,77));
    not_a_rect_shape.push_back(Point(10,77));
 
 
    cv::Point2f src_vertices[4];
    src_vertices[0] = not_a_rect_shape[0];
    src_vertices[1] = not_a_rect_shape[1];
    src_vertices[2] = not_a_rect_shape[2];
    src_vertices[3] = not_a_rect_shape[3];
    Point2f dst_vertices[4];
    dst_vertices[0] = Point(0, 10);
    dst_vertices[1] = Point(64,0);
    dst_vertices[2] = Point(84,77);
    dst_vertices[3] = Point(10,87);
    Mat warpMatrix = getPerspectiveTransform(src_verticesdst_vertices);
    cv::Mat rotated;
    warpPerspective(srcrotatedwarpMatrixrotated.size(), INTER_LINEARBORDER_CONSTANT);
    // Display the image
    cv::namedWindow"Original Image");
    cv::imshow"Original Image",src);
    cv::namedWindow"warp perspective");
    cv::imshow"warp perspective",rotated);
    
    cv::waitKey();
    return 0;
}
结果:
img_f2485bbcd27fb8ec646f23a22e25176d.png

img_141a396fda68d58d28ad3993504aa98e.png




目前方向:图像拼接融合、图像识别 联系方式:jsxyhelu@foxmail.com
目录
相关文章
我写了一个自动化脚本涨粉,从0阅读到接近100粉丝(二)
我写了一个自动化脚本涨粉,从0阅读到接近100粉丝
136 0
|
9月前
|
自然语言处理 数据可视化 算法
【传知代码】私人订制词云图-论文复现
本文介绍了词云图的原理和生成步骤,包括分词、统计词频、去除停用词等,并提供了Python实现示例,利用`wordcloud`和`jieba`库。此外,还分享了技巧,如处理中文乱码、选择背景图、词库转换及自定义文字颜色。词云图能直观展示文本关键信息,适用于数据分析和文本挖掘,但也有其局限性,如无法显示词汇的语法关系。源码和更多资源可在文章附件获取。
119 0
【传知代码】私人订制词云图-论文复现
|
8月前
|
移动开发 前端开发 安全
技术心得记录:怎么更快地合成大西瓜?搞懂游戏的源码,闭着眼睛都能成功!
技术心得记录:怎么更快地合成大西瓜?搞懂游戏的源码,闭着眼睛都能成功!
118 0
|
9月前
|
数据采集 自然语言处理 前端开发
让大模型分析csdn文章质量 —— 提取csdn博客评论在文心一言分析评论区内容
让大模型分析csdn文章质量 —— 提取csdn博客评论在文心一言分析评论区内容
121 6
|
9月前
|
定位技术
关于使用用户故事地图的一些自我总结
关于使用用户故事地图的一些自我总结
|
机器学习/深度学习 存储 人工智能
【OpenVI-视觉评价系列之MOS评价实战篇】手机存储不够用,清理照片太痛苦?MOS评价帮你挑选“垃圾”照片
MOS(Mean Opinion Score)是一种常用的主观质量评价方法,常用于视频、图像等多媒体领域中的质量评价。MOS视觉评价通常是通过让受试者观看视频/图像,对视频的清晰度、锐度、颜色饱和度、运动模糊、噪声等方面进行评价。然而,MOS视觉评价也存在一些局限,例如需要大量的受试者,评估时间较长等。因此,近年来,研究者们也开始探索使用客观评价方法来替代或补充MOS视觉评价。
585 2
【OpenVI-视觉评价系列之MOS评价实战篇】手机存储不够用,清理照片太痛苦?MOS评价帮你挑选“垃圾”照片
|
数据采集 Web App开发 JavaScript
我写了一个自动化脚本涨粉,从0阅读到接近100粉丝(一)
我写了一个自动化脚本涨粉,从0阅读到接近100粉丝
143 0
|
编解码 算法 Java
写了上百篇文章后,对文章排版和文章曝光的一些思考
本文就博主编写了百篇博文的一个感想感悟,主要分享关于写博客时的一些排版技巧和曝光方式,对于刚开始编写博客或者想要了解一些写作技巧的小伙伴适用
244 0
文字处理技术:搞明白了表格是如何参与文字方向的
文字处理技术:搞明白了表格是如何参与文字方向的
116 0
|
数据挖掘 搜索推荐
带你读《广告数据定量分析:如何成为一位厉害的广告优化师》之三:广告数据的描述:图表
这是一部面向初级广告优化师、渠道运营人员的广告数据分析和效果优化的实战指南。数据分析功底的深浅,决定了广告优化师能力水平的高低。这本书一方面告诉读者成为一名厉害的广告优化师需要掌握的数据分析技能,以及如何快速掌握这些技能;一方面又为读者总结了SEM广告、信息流广告、应用商店广告数据的分析方法论和效果优化的方法,以及多广告推广渠道的统筹优化。书中提供大量真实数据案例,助你提升广告数据分析的理论深度和业务水平。