CVPR 2023 | LED阵列+LCD面板=3072个投影仪:浙大-相芯联合团队实现复杂物体高质量数字化建模

简介: CVPR 2023 | LED阵列+LCD面板=3072个投影仪:浙大-相芯联合团队实现复杂物体高质量数字化建模


如何数字化真实世界中的复杂物体是计算机图形学与计算机视觉中的经典问题,在文化遗产、电子商务和电影特效等诸多领域有着广泛的应用。高精度数字化结果由三维几何与高维外观组成,能在虚拟世界中高保真地重现出本体在任意光照和视角下的「流光溢彩」。


为了提升数字化采集中的信噪比,浙江大学计算机辅助设计与图形系统全国重点实验室和杭州相芯科技有限公司的研究团队首次提出了能同时采集几何与外观信息的轻量级高维结构光光源,通过 LED 阵列与 LCD 面板组合,等效构建了 3072 个分辨率约为 320x320 的投影仪,仅用单个相机即可实现 0.27mm 的几何重建精度以及 SSIM=0.94 的外观重建精度,在复杂物体重建实验中超越了 SOTA。相关研究论文已被 CVPR 2023 接收。



论文主页:https://svbrdf.github.io/

结构光在高质量数字化中被广泛应用,通过对空间域编解码获取几何信息,通过对角度域编解码获取外观信息。结构光能有效地探测物理域并获取与目标高度相关的测量值,最终获得高信噪比的精确重建结果。

对于几何扫描,空间结构光方法将精心设计的光照图案投射到三维空间中来区分不同光线,从而实现精确的三角化测量。主流的高精度几何扫描仪都基于这一原理,已形成了相当成熟的商用市场。代表性的产品包括加拿大 Creaform 的 HandySCAN 3D(下图 1)、卢森堡 Artec3D 的 Spider 和中国先临的 EinScan。

对于外观采集,角度结构光方法编程控制每个光源在不同时刻的亮度,相机测量值可等效为 BRDF(双向反射分布函数)切片与光照图案在角度域上的点积,并以此为依据对复杂外观进行精准推断。代表性工作包括专业级高密度光源采集系统 [Kang et al. 2019](图 1),以及机器之心之前报道过的手持式可微分材质扫描仪 [Ma et al. 2021]。

图 1:基于结构光采集的代表性产品 / 系统。左图为加拿大 Creaform 的 HandySCAN 3D 几何扫描仪,右图为本团队发表于 SIGGRAPH Asia 的专业级非平面外观采集系统 [Kang et al. 2019]。

挑战

虽然结构光已经能单独采集高精度几何或者外观,但如何将其应用到高质量几何与外观的联合采集依然存在困难

一方面,直接同时使用空间和角度结构光会导致硬件设备笨重 [Weinmann et al. 2011],并且这两类光源会竞争安装位置,导致几何与外观采样覆盖的完整性无法兼得。
另一方面,现有的联合采集工作通常只使用一种结构光采集几何或材质,对剩余未知量进行被动光照采集,导致了次优的重建结果。例如 [Holroyd et al. 2010] 使用投影仪获取高质量几何,但不得不依靠强先验来求解角度域上采样不足的外观。[Kang et al. 2019] 在角度域内密集采样外观,然而其被动式几何重建的质量受限于对象表面空间特征分布的丰富程度。

硬件

为了解决上述挑战,团队首先提出了用于高质量联合采集三维几何和高维外观的统一结构光光源。这个轻量级的光源原型由 LED 阵列和 LCD 遮罩组成,本质上是可以视为一个受限的光场投影仪,它可主动探测空间和角度域(下图 2)。

对于几何采集,每个 LED 将一组遮罩图案(mask pattern)投射到空间中以编码形状信息。对于外观采集,相同的 LED 阵列在编程后产生不同的光照图案(light pattern),穿过被设置成全透明的 LCD 遮罩来采样随光照角度变化的外观。该原型有助于捕捉足够多的物理信息,即使从单个视角也能高保真地恢复出每个像素的深度和外观。

图 2:团队自研的结构光硬件原型(图左),包括 64x48 的 LED 阵列、一个 1920x1080 分辨率的 LCD 遮罩(通过对普通液晶显示器拆卸后得到)和一台相机。使用单个 LED 能投影一组遮罩图案来采集三维几何(图中),而多个 LED 能投影光照图案穿过全透明遮罩来采集高维外观(图右)。


具体来说,LED 阵列共有 64x48 个高亮 RGB LED,总功率约 240W。LCD 面板分辨率为 1920x1080,拆卸自一台使用普通 IPS 液晶显示器。相机为一台 4500 万像素的 Canon EOS R5。整个采集系统由自研电路进行控制:电路负责对每个 LED 进行独立亮度设置,并在硬件层面对光源投射和相机曝光进行高精度同步。

软件

为了高效高质量地联合采集几何与外观,需要确定使用什么样的遮罩图案与光照图案来编程 LCD 与 LED。对此,研究人员建立了可微分联合采集管线来自动优化遮罩与光照图案,从而充分利用新型结构光的硬件采样能力

对于几何采集,研究人员为每个 LED 独立学习出一组遮罩图案(18 张),这里的目标是最小化沿任意相机射线的深度不确定性。研究人员还利用了造成遮罩图案投影轻微失焦的物理卷积过程,来编码更丰富的空间信息进行深度消歧。通过使用多个 LED 投影不同的遮罩图案,能改善最终几何结果的完整性和精度。

对于外观采集,光照图案(32 张)作为自编码器的一部分进行优化,该自编码器学习如何捕捉复杂外观的本质 [Kang et al. 2019]。随后使用上述光照图案来获取测量值,并以此为依据优化出高维外观。在这个过程中,已重建的三维几何也会被考虑(用来模拟阴影等由于几何所造成的现象),从而提高外观结果的质量。有关详情请参见论文原文。

图 3:整个系统的采集重建流程.

结果

研究人员使用自研原型系统采集重建了多种复杂物体的几何与外观。下图 4 对比了实拍照片、本系统的几何与外观重建结果以及相关 SOTA 方法的结果。

图 4:实拍照片、本系统的采集重建结果以及相关 SOTA 方法之间的比较。外观质量用 SSIM 衡量,几何质量以精度(缩写为 A)和完整性(缩写为 C)比例来表示。数值越大,质量越高。


本系统生成的外观结果使用工业界标准的各向异性 GGX BRDF 参数纹理来表示,可以由任意基于物理的绘制器(PBR)读取并绘制出全新光照和视角下的图片。下图 5 展示了外观重建结果的分项参数。


图 5:外观重建结果的分项参数(漫反射率、高光反射率、法向量和粗糙度)。

展望

研究人员希望该研究能够抛砖引玉,启发一系列高维结构光方向上的未来工作(例如发展质量可控的自适应采集策略,与最先进光场投影技术结合来研制首个手持式几何与外观联合扫描仪等等),从而进一步推动高质量物体数字化的发展。

参考文献1.Kang, K., Xie, C., He, C., Yi, M., Gu, M., Chen, Z., Zhou, K. and Wu, H., 2019. Learning efficient illumination multiplexing for joint capture of reflectance and shape. ACM Trans. Graph., 38 (6), pp.165-1.2.Ma, X., Kang, K., Zhu, R., Wu, H. and Zhou, K., 2021. Free-form scanning of non-planar appearance with neural trace photography. ACM Transactions on Graphics (TOG), 40 (4), pp.1-13.3.Weinmann, M., Schwartz, C., Ruiters, R. and Klein, R., 2011, May. A multi-camera, multi-projector super-resolution framework for structured light. In 2011 International Conference on 3D Imaging, Modeling, Processing, Visualization and Transmission (pp. 397-404). IEEE.4.Holroyd, M., Lawrence, J. and Zickler, T., 2010. A coaxial optical scanner for synchronous acquisition of 3D geometry and surface reflectance. ACM Transactions on Graphics (TOG), 29 (4), pp.1-12.

相关文章
|
小程序 容器
日程安排小程序实战教程
日程安排小程序实战教程
|
应用服务中间件 索引 nginx
生产环境ES查询延迟排查
最近经常收到业务方配置的ES查询延迟告警,同样的请求手动在Kibana控制台执行只需几十毫秒就返回结果。受影响的整个链路情况如下,php应用程序通过部署在ES集群各节点上的nginx访问ES请求查询数据。
5684 0
|
SQL 存储 数据管理
掌握SQL Server Integration Services (SSIS)精髓:从零开始构建自动化数据提取、转换与加载(ETL)流程,实现高效数据迁移与集成——轻松上手SSIS打造企业级数据管理利器
【8月更文挑战第31天】SQL Server Integration Services (SSIS) 是 Microsoft 提供的企业级数据集成平台,用于高效完成数据提取、转换和加载(ETL)任务。本文通过简单示例介绍 SSIS 的基本使用方法,包括创建数据包、配置数据源与目标以及自动化执行流程。首先确保安装了 SQL Server Data Tools (SSDT),然后在 Visual Studio 中创建新的 SSIS 项目,通过添加控制流和数据流组件,实现从 CSV 文件到 SQL Server 数据库的数据迁移。
4218 0
|
9月前
|
机器学习/深度学习 人工智能 并行计算
量子计算机揭秘:从结构到工作原理的深入探索
量子计算机揭秘:从结构到工作原理的深入探索
270 23
|
人工智能 自动驾驶 算法
AI的未来发展与挑战
本文探讨了人工智能(AI)的未来发展趋势和面临的主要挑战。通过对当前AI技术的概述,本文分析了AI在不同行业中的应用现状,并展望了未来的发展方向。同时,本文还讨论了AI发展中可能遇到的伦理、法律和技术难题,提出了相应的解决策略。
|
11月前
|
存储 机器学习/深度学习 人工智能
获评最高等级!阿里云首批通过信通院企业用云治理能力成熟度评测
获评最高等级!阿里云首批通过信通院企业用云治理能力成熟度评测
409 11
|
11月前
|
人工智能 自然语言处理 安全
谷歌版贾维斯即将问世,最强Gemini 2.0加持!AI自主操控电脑时代来临
谷歌发布的Gemini 2.0标志着AI新时代的到来,被誉为“谷歌版贾维斯”。该系统在自然语言处理、图像识别及自主操控电脑等方面取得重大进展,尤其在多模态数据处理上表现出色,能更准确理解用户需求并执行复杂任务。尽管存在对AI自主操控可能带来的负面影响的担忧,谷歌强调Gemini 2.0旨在辅助而非替代人类工作,且已采取多项措施保障其安全性和可靠性。
286 5
|
存储 缓存 算法
go vendor module
go vendor module
|
人工智能 搜索推荐 新能源
AI ppt生成器 Tome(一)
Tome是一款AI驱动的幻灯片生成工具,输入标题或描述即可自动生成包含标题、大纲、内容和图片的PPT。它提供丰富的模板、素材库、多语言支持及多种内容类型,如文本、图片、视频等。用户可通过提示栏、DALL-E 2生成图像,并可嵌入网页内容。注册后,用户可以方便地创作高质量PPT,支持视频录制和个性化定制。[链接:Tome | Polished & Professional AI Presentations](https://beta.tome.app/)
|
人工智能 网络协议 应用服务中间件
Golang 搭建 WebSocket 应用(一) - 初识 gorilla/websocket
Golang 搭建 WebSocket 应用(一) - 初识 gorilla/websocket
1499 1