AgiBot World:智元机器人开源百万真机数据集,数据集涵盖了日常生活所需的绝大多数动作

简介: AgiBot World 是智元机器人开源的百万真机数据集,旨在推动具身智能的发展,覆盖家居、餐饮、工业等五大核心场景。

❤️ 如果你也关注 AI 的发展现状,且对 AI 应用开发非常感兴趣,我会每日跟你分享最新的 AI 资讯和开源应用,也会不定期分享自己的想法和开源实例,欢迎关注我哦!

🥦 微信公众号|搜一搜:蚝油菜花 🥦


🚀 快速阅读

  1. 数据集规模:AgiBot World 包含百万级真机数据,覆盖五大核心场景。
  2. 硬件配置:数据集采集依托于配备8个摄像头和6个自由度的灵巧手的机器人平台。
  3. 开源计划:智元机器人计划开源千万仿真数据,并发布具身基座大模型。

正文(附运行示例)

AgiBot World 是什么

公众号: 蚝油菜花 - agibot-world

AgiBot World 是智元机器人开源的百万真机数据集,旨在推动具身智能的发展。数据集包含八十余种日常技能,覆盖家居、餐饮、工业等五大核心场景,数据规模和质量远超谷歌的Open X-Embodiment。

基于智元自建的数据采集工厂和实验基地,通过8个摄像头和6个自由度的灵巧手等高级硬件配置,实现了全域真实场景的高质量数据采集。数据集不仅涵盖了基础操作如抓取、放置,还包括复杂动作如搅拌、折叠、熨烫等,几乎涵盖了日常生活所需的绝大多数动作需求。

AgiBot World 的主要功能

  1. 多样化任务覆盖:AgiBot World 数据集收录了八十余种日常生活中的多样化技能,从基础操作如抓取、放置、推、拉,到更复杂的动作如搅拌、折叠、熨烫等,几乎涵盖了日常生活所需的绝大多数动作需求。
  2. 全域真实场景:数据集诞生于智元机器人自建的大规模数据采集工厂与应用实验基地,空间总面积超过4000平方米,包含三千多种真实物品,复刻了家居、餐饮、工业、商超和办公五大核心场景,为机器人提供了一个高度真实的生产生活环境。
  3. 全能硬件平台:数据集采集所依托的机器人平台配备了8个摄像头环绕式布局,能够实时全方位感知周围环境的动态变化。机器人还具备6个主动自由度的灵巧手,能够完成熨衣服等多种复杂操作。全身最高32个自由度,末端六维力传感器和高精度视触觉传感器的配备,让机器人在面对精细操作任务时能够有条不紊。
  4. 全程质量把控:智元机器人在AgiBot World的采集过程中采取了多级质量把控和全程人工在环的策略,从采集员的专业培训,到采集过程中的严格管理,再到数据的筛选、审核和标注,每一个环节都经过了精心设计和严格把控。

如何运行 AgiBot World

1. 下载数据集

首先,从 HuggingFace 页面下载 AgiBot World 数据集。

git clone https://huggingface.co/datasets/agibot-world/AgiBotWorld-Alpha

2. 数据预处理

将数据转换为 LeRobot Dataset 格式,具体操作请参考 HuggingFace 页面 的详细说明。

3. 训练模型

利用 LeRobot Dataset 的简便性,我们提供了一个用户友好的 Jupyter Notebook 用于在 AgiBot World 数据集上训练扩散策略。

资源


❤️ 如果你也关注 AI 的发展现状,且对 AI 应用开发非常感兴趣,我会每日跟你分享最新的 AI 资讯和开源应用,也会不定期分享自己的想法和开源实例,欢迎关注我哦!

🥦 微信公众号|搜一搜:蚝油菜花 🥦

相关文章
|
11月前
|
传感器 人工智能 算法
傅利叶开源人形机器人,提供完整的开源套件!Fourier N1:具备23个自由度和3.5米/秒运动能力
傅利叶推出的开源人形机器人N1搭载自研动力系统与多模态交互模块,具备23个自由度和3.5米/秒运动能力,提供完整开源套件助力开发者验证算法。
850 3
傅利叶开源人形机器人,提供完整的开源套件!Fourier N1:具备23个自由度和3.5米/秒运动能力
|
12月前
|
数据采集 人工智能 数据可视化
SpatialLM:手机视频秒建3D场景!开源空间认知模型颠覆机器人训练
SpatialLM 是群核科技开源的空间理解多模态模型,能够通过普通手机拍摄的视频重建 3D 场景布局,赋予机器人类似人类的空间认知能力,适用于具身智能训练、自动导航、AR/VR 等领域。
997 5
SpatialLM:手机视频秒建3D场景!开源空间认知模型颠覆机器人训练
|
机器学习/深度学习 人工智能 算法
ToddlerBot:告别百万经费!6000刀就能造人形机器人,斯坦福开源全套方案普及机器人研究
ToddlerBot 是斯坦福大学推出的低成本开源人形机器人平台,支持强化学习、模仿学习和零样本模拟到现实转移,适用于运动操作研究和多场景应用。
1257 3
ToddlerBot:告别百万经费!6000刀就能造人形机器人,斯坦福开源全套方案普及机器人研究
|
Web App开发 机器学习/深度学习 人工智能
Weebo:支持多语言和实时语音交流的开源 AI 聊天机器人,回复具备语调、情感的语音
Weebo 是一款基于 Whisper Small、Llama 3.2 和 Kokoro-82M 技术的 AI 语音聊天机器人,支持实时语音交互和多语言对话,适用于个人助理、娱乐互动和教育辅导等多种场景。
1270 17
Weebo:支持多语言和实时语音交流的开源 AI 聊天机器人,回复具备语调、情感的语音
|
数据采集 人工智能 算法
Seer:上海 AI Lab 与北大联合开源端到端操作模型,结合视觉预测与动作执行信息,使机器人任务提升成功率43%
Seer是由上海AI实验室与北大等机构联合推出的端到端操作模型,结合视觉预测与动作执行,显著提升机器人任务成功率。
657 20
Seer:上海 AI Lab 与北大联合开源端到端操作模型,结合视觉预测与动作执行信息,使机器人任务提升成功率43%
|
传感器 人工智能 自然语言处理
RDT:清华开源全球最大的双臂机器人操作任务扩散基础模型、代码与训练集,基于模仿能力机器人能够自主完成复杂任务
RDT(Robotics Diffusion Transformer)是由清华大学AI研究院TSAIL团队推出的全球最大的双臂机器人操作任务扩散基础模型。RDT具备十亿参数量,能够在无需人类操控的情况下自主完成复杂任务,如调酒和遛狗。
860 22
RDT:清华开源全球最大的双臂机器人操作任务扩散基础模型、代码与训练集,基于模仿能力机器人能够自主完成复杂任务
|
人工智能 机器人 开发工具
LazyLLM:还在为AI应用开发掉头发?商汤开源智能体低代码开发工具,三行代码部署聊天机器人
LazyLLM 是一个低代码开发平台,可帮助开发者快速构建多智能体大语言模型应用,支持一键部署、跨平台操作和多种复杂功能。
703 3
|
人工智能 算法 机器人
EMMA-X:新加坡科技设计大学推出具身多模态动作模型,使夹爪机器人具备空间推理和任务规划能力
EMMA-X是由新加坡科技设计大学推出的具身多模态动作模型,具备70亿参数,通过在链式思维推理数据上微调OpenVLA创建。该模型结合层次化的具身数据集,增强空间推理和任务规划能力。
535 3
EMMA-X:新加坡科技设计大学推出具身多模态动作模型,使夹爪机器人具备空间推理和任务规划能力
|
人工智能 算法 机器人
开源极客桌面机器人 Desk-Emoji
Desk-Emoji 是一款开源的实体 AI 桌面陪伴机器人,具备酷炫外观、流畅 Emoji 表情、双自由度云台及大模型语音聊天功能,支持手势识别和情绪反馈,适合 DIY 和二次开发,是性价比极高的桌面机器人。
3249 1
开源极客桌面机器人 Desk-Emoji
|
人工智能 搜索推荐 机器人
一款开源的宝藏聊天机器人Typebot
Typebot 是一个强大的开源聊天机器人框架,支持多种 AI 模型,包括 Claude 3.5 和 Dify.AI 助手,适用于客服、电商推荐等场景。它通过 Webhook 块实现与外部服务的交互,帮助开发者轻松创建和管理对话式 AI 应用。通过阿里云账号登录,即可快速创建和部署自己的聊天机器人。

热门文章

最新文章