LET数据集来魔搭了!开源首批超60,000分钟全尺寸人形机器人真机数据

简介: 国内最大全尺寸人形机器人真机数据集“LET数据集”正式发布,首批开源超6万分钟高质量数据,覆盖6大真实场景,支持多模态融合与标准化应用,助力具身智能研发,已在魔搭社区开放共享。

近日,国内规模最大的面向真实作业场景的全尺寸人形机器人真机数据集“LET数据集”正式发布!其首批开源60,000+分钟数据已在魔搭社区官网同步上线。

LET数据集由乐聚智能(深圳)股份有限公司、国家地方共建人形机器人创新中心、北京数聚通启运营管理有限公司和苏州吴江智训未来运营管理有限公司联合主导构建。该数据集不仅精准填补了具身智能领域对高质量真机数据的迫切需求,更为行业创新发展提供了关键的数据支撑。


国地标准共建,引领数据协同新生态

LET数据集以国家地方共建人形机器人创新中心规范为基准,从源头确保数据的高质量、专业合规性与可用性,旨在为开发者、企业及科研团队提供“开箱即用”的标准化数据资产。

通过统一流程与标准化处理,数据集有效破解了多源异构、数据格式不一、质量参差不齐等行业痛点,不仅实现了规模化高质量数据生产,更为行业数据体系建设提供了关键范本。与此同时,项目方正联合开展国家及行业标准研制,推动国家级标准化试点标准验证与实施应用。

高质量数据是驱动模型实现能力跃迁的关键。LET数据集此次发布包含超60,000分钟的真机数据,其质量更高,标准更严格。

这也将为验证Scaling Law提供更优质的数据基础,推动模型不再局限于简单的动作模仿,而是能够学习背后的通用规律与决策策略,从“机械执行”迈向“自主理解与推理”。


统一真机实采,锻造高鲁棒性模型

LET数据集基于乐聚夸父系列全尺寸人形机器人进行统一采集。该人形机器人具备40+自由度,身高约1.66米,体重约55公斤,同时搭配头部立体相机与腕部RGB-D相机,可有效避免因机器人形态差异导致的数据偏差问题。


得益于真机实采所包含的真实物理约束、环境扰动与传感器噪声,LET数据集为模型训练提供了高一致性的数据基础。这使得训练出的模型在端到端部署中展现出卓越的迁移能力与鲁棒性,其性能显著优于基于仿真数据的模型,能够高度契合复杂现实场景的应用需求。


多模态数据融合,数据更精细标准

LET数据集融合了机器人头部视角与双腕视角的清晰、稳定视频流,并同步采集RGB图像、深度图、关节状态及末端执行器状态等关键模态信息,全方位捕捉操作细节,为算法训练提供高一致性、高完整度的真机数据基础,能让模型更接近人类认知方式。


同时,LET数据集构建了一套系统的多模态对齐标注体系,通过任务标注细化与多维度语义标签,显著提升了数据的质量标准。


六大真实作业场景,铸就强大泛化能力

LET数据集以真实作业场景为核心,全面覆盖工业、商业零售及日常生活3大领域,6大场景,31项任务,117种原子技能。场景具体涵盖汽车工厂、快消场景、3C工厂、酒店服务、生活服务及物流场景,包含抓取放置、工具使用、搬运、协作等典型任务,覆盖移动平台、机械臂单臂抓取,多臂协作等多种操作形态,系统化支撑机器人算法在多样化真实场景中的泛化能力,为复杂技能的学习与组合提供坚实基础。

数采链三大技术创新,定义高质量数据

LET数据集通过数采链路三大技术创新,系统性提升数据质量、对齐精度与模型可验证性。

1. 构建视觉伺服闭环数据:将有误差的机器人本体和传感器,转变为依赖一个统一的、抽象的坐标系或特征,有效解决了多设备数据一致性难题,使数据质量一致性达到 90% 以上。

2. 采用高效的组帧技术:将多传感器数据帧的时间戳误差与延迟严格控制在10ms以内,确保数据层时序同步。

3. 建立自动化Benchmark评测体系:对数据收敛度、样本效率与稳定性进行全面评估,确保数据迁移的有效性和泛化能力。


模型使用开发者友好

LET数据集提供了一套数据转换、模型训练、仿真测试与真机部署的全流程数据工具链,这将进一步推动具身智能行业的研发与落地。


真机数据应用案例

日化生产场景

日化产品定姿摆放

汽车制造场景

SPS零件分拣

物流场景

快递分拣应用

3 C场景

传送带物料分拣应用


开源!全球共享高质量LET数据集

目前,LET数据集首批60,000+分钟高质量数据已上线魔搭社区!目前开发者可通过以下三种方式获取数据集:

2.魔搭社区官网链接:

3.公开平台扫码获取数据:魔搭社区/ GitHub


扫码获取数据

魔搭社区  

https://www.modelscope.cn/profile/LejuRobotics


扫码获取资源

GitHub

https://github.com/LejuRobotics/kuavo_data_challenge


目录
相关文章
|
2月前
|
数据采集 存储 编解码
智源RoboCOIN重磅开源!全球本体数最多、标注最精细、使用最便捷的高质量双臂机器人真机数据集来了
北京智源研究院联合多家机构发布全球首个“本体数最多、标注最精细、使用最便捷”的双臂机器人真机数据集RoboCOIN,覆盖15类机器人、18万条轨迹、421项任务,首创“层级能力金字塔”标注体系,推动具身智能迈向真实场景应用。
353 11
 智源RoboCOIN重磅开源!全球本体数最多、标注最精细、使用最便捷的高质量双臂机器人真机数据集来了
|
2月前
|
人工智能 前端开发 测试技术
告别 GUI Agent 工程基建噩梦!阶跃星辰开源 4B 模型,本地轻松部署,玩转安卓应用
阶跃星辰开源GELab-Zero,首发4B GUI Agent模型及完整基建,支持一键部署,在多端性能达SOTA。同步推出真实场景评测基准AndroidDaily,推动GUI智能体规模化落地。
506 10
告别 GUI Agent 工程基建噩梦!阶跃星辰开源 4B 模型,本地轻松部署,玩转安卓应用
|
2月前
|
机器学习/深度学习 测试技术 API
DeepSeek V3.2 正式版:强化 Agent 能力,融入思考推理
DeepSeek发布正式版V3.2与高性能Speciale版本,支持思考模式下工具调用,推理能力达全球领先水平。V3.2平衡效率与性能,适用于通用任务;Speciale专注复杂推理,在数学与编程竞赛中表现卓越,已开源并上线API。
758 9
|
2月前
|
人工智能 算法 架构师
你的团队是"精锐特种兵",还是"草台班子"?就差这一份"源代码"
针对技术团队管理混乱、过度依赖个人的痛点,提出用AI指令将经验转化为标准SOP的解决方案。通过工程化思维重构管理流程,实现团队经验的"开源"与"复用",释放核心人才价值。
265 10
|
3月前
|
人工智能 API Python
Gemini 3 Nano Banana 的MCP服务器开发设计和 国内直连方案
基于Gemini 3 API开发的MCP绘图工具,支持在Coding客户端中边写代码边生成流程图。项目采用Python实现,兼容Gemini 2.5 Flash与3 Pro图像API,集成超时控制、国内直连路由转发功能,可高效调用AI生图。提供完整GitHub开源代码及在线试用地址,欢迎提交Issue交流。
|
3月前
|
机器学习/深度学习 人工智能 缓存
让AI评测AI:构建智能客服的自动化运营Agent体系
大模型推动客服智能化演进,从规则引擎到RAG,再到AI原生智能体。通过构建“评估-诊断-优化”闭环的运营Agent,实现对话效果自动化评测与持续优化,显著提升服务质量和效率。
1847 86
让AI评测AI:构建智能客服的自动化运营Agent体系
|
2月前
|
机器学习/深度学习 人工智能 自然语言处理
Z-Image:冲击体验上限的下一代图像生成模型
通义实验室推出全新文生图模型Z-Image,以6B参数实现“快、稳、轻、准”突破。Turbo版本仅需8步亚秒级生成,支持16GB显存设备,中英双语理解与文字渲染尤为出色,真实感和美学表现媲美国际顶尖模型,被誉为“最值得关注的开源生图模型之一”。
3382 9
|
3月前
|
机器学习/深度学习 编解码 JSON
混元OCR模型宣布开源,参数仅1B,多项核心能力SOTA
腾讯混元推出全新开源OCR模型HunyuanOCR,仅1B参数,基于原生多模态架构,实现端到端高效推理。在复杂文档解析、文字检测识别等多场景表现卓越,支持14种小语种翻译,广泛适用于票据抽取、视频字幕识别等应用,多项指标达业界SOTA水平。
610 8
|
20天前
|
自然语言处理 物联网 计算机视觉
从 Image-to-LoRA 到 In-Context Edit
阿里发布Qwen-Image-Edit-2511-ICEdit-LoRA模型,通过上下文内编辑技术,利用“编辑前后图像对”实现图像编辑能力迁移。该模型仅需少量样本即可训练,支持风格、光照、表情等复杂编辑,并可拓展至图像分割等视觉任务,未来将持续优化与应用探索。
306 6

热门文章

最新文章