LingBot-Map 正式开源!仅用普通摄像头,让机器人实现实时流式三维重建

简介: 灵波团队开源LingBot-Map:首个纯自回归式流式三维重建模型,仅需普通RGB摄像头,即可实时完成相机位姿估计与场景三维建图,20FPS稳定推理,精度、效率、长时稳定性全面领先,填补实时空间感知关键技术空白。

LingBot-Map 正式开源!仅用普通摄像头,让机器人实现实时流式三维重建

近日,灵波团队正式开源流式三维重建模型 LingBot-Map——无需复杂硬件,仅靠一颗普通 RGB摄像头,就能让机器在视频采集过程中,实时完成相机位姿估计与场景三维结构重建,填补实时空间感知领域的关键技术空白,为机器人、自动驾驶等场景提供更可靠的空间理解能力。

在流式三维重建领域,几何精度、时序一致性与运行效率的平衡,一直是行业公认的核心难点。

不同于传统三维重建“先采集、后处理”的模式,流式重建要求系统“边看边理解”,一边接收新画面,一边持续完成定位与建图,同时还要严格控制计算与存储开销,这对模型的设计提出了极高要求。

针对这一痛点,团队打造了 LingBot-Map,以纯自回归式建模为核心,基于几何上下文Transformer,在不依赖未来帧信息的前提下,逐帧处理当前及历史画面,持续输出精准的相机位姿和深度信息,实时还原场景三维结构,真正实现“所见即所建”。

灵波团队引入了几何上下文注意力机制(GCA),能够高效组织与利用跨帧几何信息,在保留关键历史数据的同时,大幅减少冗余计算,兼顾重建质量与运行效率

这一设计借鉴了经典 SLAM 系统对空间信息分层管理的思路,但突破了传统方法依赖手工设计和复杂优化的局限,将核心逻辑交由模型统一学习完成,在长序列场景下也能保持稳定表现。

性能全面领跑:20FPS 实时推理稳定支撑机器人作业

多个权威基准完成严苛测试:

在 Oxford Spires 数据集(大尺度、复杂光照、高标准)上:

  • 绝对轨迹误差(ATE)仅为 6.42 米
  • 轨迹精度较此前最优流式方法提升约 2.8倍
  • 显著优于离线方法 DA3(12.87 米)和 VIPE(10.52 米)

在大场景重建中展现出更强的稳定性。

在 ETH3D、7-Scenes、Tanks and Temples 等多个主流基准上,LingBot-Map 在位姿估计和三维重建质量两个维度全面领先现有流式方法。


其中 ETH3D 基准:重建 F1 分数达到 85.70,较第二名提升超过 8%,场景还原精度大幅提升。

除精度外,LingBot-Map 还兼顾实时性与长时稳定运行能力:

  • 推理速度可实现约 20 FPS
  • 支持 10,000+ 帧 长视频连续推理
  • 长序列运行精度几乎无衰减

这意味着,在机器人导航、避障、操作、交互等需要连续在线处理的真实场景中,它能稳定输出可靠的空间感知结果,为上层应用提供坚实支撑。

持续开源多款模型:补齐实时三维建图关键拼图

自今年 1 月以来,灵波团队相继开源:

  • 高精度空间感知模型 LingBot-Depth
  • 具身大模型 LingBot-VLA
  • 世界模型 LingBot-World
  • 具身世界模型 LingBot-VA

围绕空间感知、具身决策、世界模拟等关键环节,持续夯实具身智能“智能基座”的技术布局。此次 LingBot-Map 的开源,进一步补齐了实时空间理解与在线三维建图的关键能力拼图。

目前,LingBot-Map 的模型和代码已正式在 Hugging Face 和 Model Scope 开源。灵波团队期待更多开发者、研究团队加入进来,一起探索流式三维重建的更多可能,推动技术落地,让机器人更稳定、更高效地理解和适应真实物理世界,赋能更多行业创新。


开源地址:

魔搭社区 ModelScope:https://www.modelscope.cn/models/Robbyant/lingbot-map

HuggingFace:https://huggingface.co/robbyant/lingbot-map

GitHub:https://github.com/Robbyant/lingbot-map

Paper:https://arxiv.org/abs/2604.14141

Homepage:https://technology.robbyant.com/lingbot-map

团队期待更多开发者、研究团队加入进来,一起探索流式三维重建的更多可能,推动技术落地,让机器人更稳定、更高效地理解和适应真实物理世界,赋能更多行业创新。

https://www.modelscope.cn/models/Robbyant/lingbot-map


目录
相关文章
|
17天前
|
人工智能 数据可视化 安全
王炸组合!阿里云 OpenClaw X 飞书 CLI,开启 Agent 基建狂潮!(附带免费使用6个月服务器)
本文详解如何用阿里云Lighthouse一键部署OpenClaw,结合飞书CLI等工具,让AI真正“动手”——自动群发、生成科研日报、整理知识库。核心理念:未来软件应为AI而生,CLI即AI的“手脚”,实现高效、安全、可控的智能自动化。
34827 46
王炸组合!阿里云 OpenClaw X 飞书 CLI,开启 Agent 基建狂潮!(附带免费使用6个月服务器)
|
12天前
|
人工智能 自然语言处理 安全
Claude Code 全攻略:命令大全 + 实战工作流(建议收藏)
本文介绍了Claude Code终端AI助手的使用指南,主要内容包括:1)常用命令如版本查看、项目启动和更新;2)三种工作模式切换及界面说明;3)核心功能指令速查表,包含初始化、压缩对话、清除历史等操作;4)详细解析了/init、/help、/clear、/compact、/memory等关键命令的使用场景和语法。文章通过丰富的界面截图和场景示例,帮助开发者快速掌握如何通过命令行和交互界面高效使用Claude Code进行项目开发,特别强调了CLAUDE.md文件作为项目知识库的核心作用。
11311 36
Claude Code 全攻略:命令大全 + 实战工作流(建议收藏)
|
7天前
|
人工智能 JavaScript Ubuntu
低成本搭建AIP自动化写作系统:Hermes保姆级使用教程,长文和逐步实操贴图
我带着怀疑的态度,深度使用了几天,聚焦微信公众号AIP自动化写作场景,写出来的几篇文章,几乎没有什么修改,至少合乎我本人的意愿,而且排版风格,也越来越完善,同样是起码过得了我自己这一关。 这个其实OpenClaw早可以实现了,但是目前我觉得最大的区别是,Hermes会自主总结提炼,并更新你的写作技能。 相信就冲这一点,就值得一试。 这篇帖子主要就Hermes部署使用,作一个非常详细的介绍,几乎一步一贴图。 关于Hermes,无论你赞成哪种声音,我希望都是你自己动手行动过,发自内心的选择!
2381 24
|
29天前
|
人工智能 JSON 机器人
让龙虾成为你的“公众号分身” | 阿里云服务器玩Openclaw
本文带你零成本玩转OpenClaw:学生认证白嫖6个月阿里云服务器,手把手配置飞书机器人、接入免费/高性价比AI模型(NVIDIA/通义),并打造微信公众号“全自动分身”——实时抓热榜、AI选题拆解、一键发布草稿,5分钟完成热点→文章全流程!
45732 157
让龙虾成为你的“公众号分身” | 阿里云服务器玩Openclaw
|
5天前
|
人工智能 弹性计算 安全
Hermes Agent是什么?怎么部署?超详细实操教程
Hermes Agent 是 Nous Research 于2026年2月开源的自进化AI智能体,支持跨会话持久记忆、自动提炼可复用技能、多平台接入与200+模型切换,真正实现“越用越懂你”。MIT协议,部署灵活,隐私可控。
1576 3
|
11天前
|
机器学习/深度学习 存储 人工智能
还在手写Skill?hermes-agent 让 Agent 自己进化能力
Hermes-agent 是 GitHub 23k+ Star 的开源项目,突破传统 Agent 依赖人工编写Aegnt Skill 的瓶颈,首创“自我进化”机制:通过失败→反思→自动生成技能→持续优化的闭环,让 Agent 在实践中自主构建、更新技能库,持续自我改进。
1782 6

热门文章

最新文章

下一篇
开通oss服务