使用标记增强技术将虚拟内容呈现到现实场景中

简介: 使用基于标记的增强现实将虚拟内容呈现到场景中。

​一、前言
使用基于标记的增强现实将虚拟内容呈现到场景中。
增强现实 (AR) 通过自然混合真实和虚拟内容来增强现实世界的场景,从而创建新颖的应用程序。例如,增强现实应用程序可以添加虚拟标尺,使用户能够直接从图像数据进行测量。实现增强现实系统需要使用计算机视觉技术来理解场景几何形状,以便可以将虚拟内容以适当的视角和比例添加到场景中。
确定场景几何体的常用方法是使用经过校准的摄像机来检测已知的基准标记,例如 AprilTag。使用基准标记的好处是,它们设计为在各种成像条件和视点下进行检测,并可用于生成准确的相机姿态估计。准确的姿势估计对于产生无缝的AR体验至关重要,这种体验不会随着摄像机在场景中移动而抖动。

在此示例中,校准相机用于检测和跟踪放置在桌子顶部的 AprilTag 标记。AprilTag姿势是在摄像机在场景中移动时估计的,此信息用于在AprilTag顶部投影虚拟长方体。此示例中显示的工作流程突出显示了许多 AR 应用程序中使用的基本计算机视觉技术。

二、加载视频
将视频文件下载到临时目录中。加载要添加AR内容的视频并阅读第一帧。显示第一帧。
1.png

三、加载相机内联函数
AR和VR应用需要经过校准的相机来定义相机在世界上的位置。

四、估计四月标签姿势
函数可用于检测和估计多个AprilTags的姿势。为了估计姿势,该函数需要相机内在和AprilTag的大小。以毫米为单位指定AprilTag的大小,以匹配相机校准期间使用的单位。因为AprilTag是方形的,所以测量一侧的长度就足够了。准确测量尺寸以产生准确的姿势估计非常重要。

若要使 AprilTag 检测速度更快并减少错误检测,请指定 AprilTag 系列。支持广泛的April标签。估计标签姿势。AprilTag 的姿势定义了此示例中使用的世界坐标系。AprilTag的中心是原点。X-Y 平面由 AprilTag 所在的平面定义,Z 轴指向标记。
2.png

按照惯例,该函数返回 AprilTag 姿势,以便 z 轴指向 AprilTag。对于此示例,将 z 轴指向标记之外更为直观,以便可以将位于 AprilTag 顶部的虚拟对象定义为具有正高度值。对估计的标记姿势应用旋转,将 y 轴旋转 180 度以翻转 z 轴。

显示更新的世界坐标轴。

五、定义虚拟内容
定义一个三维长方体以投影到 AprilTag 的顶部。多维数据集以 AprilTag 为中心,并定义为与标记具有相同的大小。

六、向图像添加虚拟内容
使用函数将虚拟长方体顶点投影到影像坐标系中。用虚拟内容扩充图像。

3.png

七、以 3D 形式可视化相机姿势
使用估计的 AprilTag 姿势和相机内在来创建与上面所示图像对应的场景的 3D 虚拟表示。这种虚拟表示对于可视化相机轨迹和调试AR应用程序非常有用。

接下来,使用函数将标签姿势转换为相机外联函数,后者在世界坐标中表示相机方向和位置。最后,使用函数以 3D 形式可视化相机。
5.png

此示例的下一部分演示如何更新相机位置,以便在相机在场景中移动时可视化轨迹。

八、为视频添加虚拟内容并可视化摄像机轨迹
对其余视频帧重复上述步骤。
6.png
7.png
九、总结
此示例展示了使用基于标记的 AR 通过虚拟内容增强场景所需的基本计算机视觉技术。可以扩展此示例中显示的技术,以向场景添加不同类型的内容,例如图像或其他三维形状。

目录
相关文章
|
5天前
|
机器学习/深度学习 物联网
可控文生图:EliGen控制实体的位置细节变化
可控文生图:EliGen控制实体的位置细节变化
|
7月前
|
测试技术
探索软件测试的多维视角:从单元到系统,从静态到动态
【8月更文挑战第27天】本文将带领读者穿越软件测试的迷宫,从最微小的单元测试开始,逐步扩展到复杂的系统测试。我们将一起探索静态测试和动态测试的不同面貌,以及它们如何互补地确保软件质量。通过实际代码示例,我们将揭示测试用例的设计思路和执行过程,旨在为读者提供一个全面而深入的软件测试全景图。让我们开始这段旅程,解锁软件测试的秘密,确保我们的代码不仅能够运行,而且能够完美运行。
|
8月前
|
算法 数据处理 黑灰产治理
模拟点击问题之设备标签在基础风险能力中起什么作用
模拟点击问题之设备标签在基础风险能力中起什么作用
|
7月前
|
vr&ar
AIGC 3D宇宙问题之混合显示的定义如何解决
AIGC 3D宇宙问题之混合显示的定义如何解决
33 0
|
8月前
|
人工智能
Sora信息问题之模拟对象状态变化存在的局限如何解决
Sora信息问题之模拟对象状态变化存在的局限如何解决
61 0
|
10月前
|
监控 安全 网络安全
网络安全行为可控定义以及表现内容简述
网络安全行为可控定义以及表现内容简述
133 1
|
自然语言处理 数据挖掘
我们要对齐什么——从人类反馈数据收集过程中分析语言模型的对齐任务类型与对齐目标
在Modelscope活动中,主办方欲通过模型盲测收集并整理一批人类反馈数据。因为曾经使用直接偏好优化(Direct Preference Optimization)作为课程的小论文而对此领域有所了解,本次我在数据的收集过程之外,根据问答与模型的输出,结合论文From Instructions to Intrinsic Human Values A Survey of Alignment Goals for Big Models,具体探究了本次实验过程中的对齐目标。
383 0
|
机器学习/深度学习 存储 编解码
3D检测无痛涨点 | 上下文感知数据增强方法上下文感知数据增强方法CA-Aug助力3D!
3D检测无痛涨点 | 上下文感知数据增强方法上下文感知数据增强方法CA-Aug助力3D!
202 0
|
自然语言处理 监控 机器人
能看图、会聊天,还会跨模态推理和定位,能落地复杂场景的DetGPT来了
能看图、会聊天,还会跨模态推理和定位,能落地复杂场景的DetGPT来了
203 0
|
机器学习/深度学习 存储 传感器
基于目标导向行为和空间拓扑记忆的视觉导航方法
基于目标导向行为和空间拓扑记忆的视觉导航方法
244 0
基于目标导向行为和空间拓扑记忆的视觉导航方法