戴盟联合数十家头部机构,发布全球最大规模含触觉全模态物理世界数据集

简介: 4月15日,戴盟机器人发布全球最大含触觉全模态具身数据集Daimon-Infinity,年内规模将达数百万小时、近十亿条数据。首批10000小时高质量开源数据已上线魔搭社区,覆盖80+真实场景、2000+任务,显著提升模型训练效率10倍。

4 月 15 日,戴盟机器人联合海内外数十家学术机构与知名企业,发布全球最大规模含触觉全模态物理世界具身数据集 Daimon-Infinity。数据规模计划于年内扩展至数百万小时,包含近十亿条具身数据;其中 10000 小时数据面向全行业开放共享,首批数据目前已于阿里魔搭社区上线开源。

当前具身智能难以落地、泛化能力不足,其核心瓶颈正在于缺乏来自真实世界,尤其是含有物理交互信息的数据。不同于视觉的远距离感知,触觉能直接提供接触力、接触形变、接触状态及物体纹理、材质等物理反馈,有效弥补视觉的盲区与错觉。在具身智能的“感知-行动”闭环中,触觉是连接被动观察与主动交互的关键——只有实现视觉与触觉的深度协同,机器人才能在复杂的物理环境中完成精准、稳定的操作。

作为率先提出 VTLA(Vision-Tactile-Language-Action)架构的创新者,戴盟依托全球领先的视触觉技术,将高密度、全模态触觉信息引入具身智能的数据主干,为机器人精细操作提供了更真实、更丰富的训练基础,进一步驱动具身智能向高泛化性与高可靠性演进。


全模态信息

高质量触觉,补全稀缺的物理交互数据

Daimon-Infinity 数据集依托于戴盟自研的二指夹爪及五指手套数据采集设备,其搭载的 11 万感知单元 120Hz 高频率视触觉传感器、鱼眼相机、编码器、IMU、双目相机,为数据集提供触觉、视觉、动作轨迹、执行动作、语音文本等全维度信息。

值得一提的是,Daimon-Infinity 提供了目前行业内最高质量的触觉数据包含接触力、接触形变、滑移,及物体材质、形貌、纹理、软硬等高密度全模态触觉信息,为精细操作补全稀缺的物理交互特征。戴盟视触觉数据获业界广泛认可,得到 OmniVTA、AnyTouch 2 、FG-CLTP 等含触觉模型的验证。

数据处理链路

全流程质量管控,确保数据高效利用

戴盟搭建了全链路数据处理引擎,为 Daimon-Infinity 提供从物理交互到数字世界的全流程质量管控:通过软硬件协同,从前端采集源头实现毫秒级对齐;通过高效编码压缩及序列化压缩,保持数据精度的同时,最小化数据存储成本;数据可从采集设备直传云端,进入处理管线,从中恢复双手运动轨迹,轨迹重建精度达到行业领先水平,确保数据一致性与可用性。

基于戴盟在触觉感知领域的长期积累,数据处理管线可从采集的原始数据中提取出接触形貌、三维形变场、三维分布力,以及六维集中力等十多种模态,将真实世界的交互表征嵌入到每一帧数据中。处理后的数据,通过大模型自动化标注、人工标注及审核,将触觉、视觉、动作等信息融合,输出操作任务的多维度标注,形成了从含触觉的多模态感知到动作的全链路闭环

依托于阿里云人工智能平台PAI、文件存储CPFS、对象存储OSS和无影提供的方案能力,戴盟实现了真机数据安全上传模型高效训练仿真数据可视化展示,解决具身智能从实验室走向产线的工程化难题,加速技术迭代与商业化落地。同时,在数据采集与模型训练方面,戴盟团队积累了规模化、定制化的量产经验——已累计处理并标注数万小时高质量多模态数据,并将核心流程、关键指标沉淀为平台标准能力,提升交付效率与结果一致性。


有效性验证

跨本体通用数据,训练效率跃升10倍

具身智能的快速迭代,高度依赖标准化的高质量数据供给。Daimon-Infinity 采用高度标准化的数据格式规范,支持主流模型需求;采集末端不依赖本体构型,可适配各种机器人,实现跨机器人本体的数据应用。

经验证,模型在 Daimon-Infinity 具身数据上进行预训练后,只需约十分之一的数据量,即可在轴孔装配、污痕擦拭、果蔬切削等多项精细操作任务中达到更优的成功率,驱动不同构型机器人完成自主操作任务,训练效率实现 10 倍的跨越式提升



外发式数据采集范式

突破空间限制,年产数百万小时数据

传统具身数据依赖封闭式采集工厂,成本高、场景单一、数据多样性不足,难以满足具身智能对真实复杂环境与泛化能力的需求。

为突破这一瓶颈,戴盟构建了全球最大规模的外发式具身数据采集网络。依托轻量化设备与分布式数采体系,采集员可深入真实、多变的应用场景,实现不受空间限制的数据获取,年产数据规模可达数百万小时。基于该网络,Daimon-Infinity 已建立全球化数据共建体系,覆盖工业装配、智慧物流、养老护理、家居服务、科研实验、餐饮零售及户外空间等核心场景,实现了跨场景、规模化、低成本的物理交互数据沉淀与可持续供给,构建具身智能的数据基础设施。


开源共建

10000 小时最大规模开源数据集

戴盟深知,具身智能的奇点无法由任何一家企业独立跨越,唯有共建才能推动真正的技术跃迁。

Daimon-Infinity 部分数据将面向行业共享开放,开源规模达10000小时,包含数百万条真实操作轨迹,覆盖 16 个行业、80 个真实场景超 2000 项任务类别,涉及超过 2000 项人类技能、超 300 种真实物品;其中,时长超过40秒的长序列任务超过 1400 个,包含如抓放、插入、堆叠等高频手物交互任务。

物品词云图


目前,首批 1000 小时真实世界数据已上线阿里魔搭社区。戴盟诚邀行业伙伴共建开放的数据生态,共同推动具身智能迈向通用的新阶段。


魔搭链接:

https://modelscope.cn/datasets/daimonrobotics/Daimon-Infinity


目录
相关文章
|
14天前
|
人工智能 数据可视化 安全
王炸组合!阿里云 OpenClaw X 飞书 CLI,开启 Agent 基建狂潮!(附带免费使用6个月服务器)
本文详解如何用阿里云Lighthouse一键部署OpenClaw,结合飞书CLI等工具,让AI真正“动手”——自动群发、生成科研日报、整理知识库。核心理念:未来软件应为AI而生,CLI即AI的“手脚”,实现高效、安全、可控的智能自动化。
34762 38
王炸组合!阿里云 OpenClaw X 飞书 CLI,开启 Agent 基建狂潮!(附带免费使用6个月服务器)
|
8天前
|
人工智能 自然语言处理 安全
Claude Code 全攻略:命令大全 + 实战工作流(建议收藏)
本文介绍了Claude Code终端AI助手的使用指南,主要内容包括:1)常用命令如版本查看、项目启动和更新;2)三种工作模式切换及界面说明;3)核心功能指令速查表,包含初始化、压缩对话、清除历史等操作;4)详细解析了/init、/help、/clear、/compact、/memory等关键命令的使用场景和语法。文章通过丰富的界面截图和场景示例,帮助开发者快速掌握如何通过命令行和交互界面高效使用Claude Code进行项目开发,特别强调了CLAUDE.md文件作为项目知识库的核心作用。
8784 26
Claude Code 全攻略:命令大全 + 实战工作流(建议收藏)
|
3天前
|
人工智能 JavaScript Ubuntu
低成本搭建AIP自动化写作系统:Hermes保姆级使用教程,长文和逐步实操贴图
我带着怀疑的态度,深度使用了几天,聚焦微信公众号AIP自动化写作场景,写出来的几篇文章,几乎没有什么修改,至少合乎我本人的意愿,而且排版风格,也越来越完善,同样是起码过得了我自己这一关。 这个其实OpenClaw早可以实现了,但是目前我觉得最大的区别是,Hermes会自主总结提炼,并更新你的写作技能。 相信就冲这一点,就值得一试。 这篇帖子主要就Hermes部署使用,作一个非常详细的介绍,几乎一步一贴图。 关于Hermes,无论你赞成哪种声音,我希望都是你自己动手行动过,发自内心的选择!
1744 17
|
25天前
|
人工智能 JSON 机器人
让龙虾成为你的“公众号分身” | 阿里云服务器玩Openclaw
本文带你零成本玩转OpenClaw:学生认证白嫖6个月阿里云服务器,手把手配置飞书机器人、接入免费/高性价比AI模型(NVIDIA/通义),并打造微信公众号“全自动分身”——实时抓热榜、AI选题拆解、一键发布草稿,5分钟完成热点→文章全流程!
45659 155
让龙虾成为你的“公众号分身” | 阿里云服务器玩Openclaw
|
8天前
|
机器学习/深度学习 存储 人工智能
还在手写Skill?hermes-agent 让 Agent 自己进化能力
Hermes-agent 是 GitHub 23k+ Star 的开源项目,突破传统 Agent 依赖人工编写Aegnt Skill 的瓶颈,首创“自我进化”机制:通过失败→反思→自动生成技能→持续优化的闭环,让 Agent 在实践中自主构建、更新技能库,持续自我改进。
1549 5
|
15天前
|
人工智能 JSON 监控
Claude Code 源码泄露:一份价值亿元的 AI 工程公开课
我以为顶级 AI 产品的护城河是模型。读完这 51.2 万行泄露的源码,我发现自己错了。
5642 24
|
3天前
|
云安全 人工智能 供应链
|
5天前
|
IDE Java 编译器
【全网最详细】JDK17下载安装图文教程 | Java17编程环境搭建步骤详解
JDK 17是Java官方长期支持(LTS)版本,提供编译、调试、运行Java程序的完整工具链。具备高稳定性、强安全性及现代语言特性(如密封类、模式匹配),广泛用于企业开发、教学入门与生产环境,是学习和实践Java的首选基础工具。(239字)

热门文章

最新文章

下一篇
开通oss服务