《计算机视觉度量深入解析》—第1章1.4节三维表示:体元、深度图、网格和点云-阿里云开发者社区

开发者社区> 人工智能> 正文
登录阅读全文

《计算机视觉度量深入解析》—第1章1.4节三维表示:体元、深度图、网格和点云

简介:

本节书摘来自异步社区《计算机视觉度量深入解析》一书中的第1章1.4节三维表示:体元、深度图、网格和点云,作者【美】Scott Krig(斯科特·克里格),更多章节内容可以访问云栖社区“异步社区”公众号查看。

1.4 三维表示:体元、深度图、网格和点云
深度信息会根据需要采用各种可转化的格式进行表示和存储。这里总结了一些常见格式(如图1-23所示)。


f0f96dc1adca7d2419a11bf8c925aadd96d5e174

图1-23 各种三维深度格式。Zernike多项式的效果图,从左图到右图分别是:深度图、使用三维四边形绘制的多边形网格、点云渲染(相当于体元)

在深度格式之间进行转换的能力对不同的算法而言是有必要的,并且也非常容易实现。常见的三维深度格式包括以下几种。

二维像素阵列,三维深度图:二维像素阵列是二维图像在内存中的缺省格式,它对许多处理操作而言是一种比较自然的存储格式,比如卷积和邻域滤波等。对于深度图的图像,所述的像素值是Z值或深度值。阵列中的每个点可以含有{颜色,深度}。
三维体元体积:三维立体数据结构(包含体元的一个三维数组)对几个算法非常适用,包括整合多个深度图以便进行三维表面重建并利用光线跟踪进行图形渲染。体元是一种体积元素,就如同像素是图像元素一样。每个像素可以包含{颜色,法线}。体积结构中暗含着深度坐标。
三维多边形网格:存储在标准的三维多边形网格中的三维点提供了一组相连的点或顶点,每一个都具有表面法线、三维坐标、颜色和纹理。网格格式非常适用于在GPU流程(如OpenGL或DirectX)中对表面进行渲染。在网格中的每个点可以包含{x,y,z,颜色,法线},并且在标准模式(比如四边形或三角形描述的表面)中与邻近点相互之间有关联。
三维点云:这是一个稀疏的结构,可以直接转换为一个标准的三维多边形网格。点云格式非常适用于稀疏的单目深度感知方法。在云中的每个点可以包含{x,y,z,颜色,法线}。

版权声明:本文内容由阿里云实名注册用户自发贡献,版权归原作者所有,阿里云开发者社区不拥有其著作权,亦不承担相应法律责任。具体规则请查看《阿里云开发者社区用户服务协议》和《阿里云开发者社区知识产权保护指引》。如果您发现本社区中有涉嫌抄袭的内容,填写侵权投诉表单进行举报,一经查实,本社区将立刻删除涉嫌侵权内容。

分享:
人工智能
使用钉钉扫一扫加入圈子
+ 订阅

了解行业+人工智能最先进的技术和实践,参与行业+人工智能实践项目

其他文章
最新文章
相关文章