IROS 2025 |从数字智能走向物理智能,“桃源”与真实世界机器人学习挑战赛启动,2大赛道等你来战

本文涉及的产品
交互式建模 PAI-DSW,每月250计算时 3个月
模型在线服务 PAI-EAS,A10/V100等 500元 1个月
模型训练 PAI-DLC,100CU*H 3个月
简介: 2025年10月,IROS (智能机器人与系统国际会议)期间,上海人工智能实验室(上海AI实验室)将举办物理世界中的多模态机器人学习研讨会,IROS 2025“桃源”与真实世界机器人学习挑战赛(机器人学习挑战赛)现已启动报名,欢迎全球创新者与挑战者参加。

 

2025年10月,IROS (智能机器人与系统国际会议)期间,上海人工智能实验室(上海AI实验室)将举办物理世界中的多模态机器人学习研讨会,IROS 2025“桃源与真实世界机器人学习挑战赛(机器人学习挑战赛)现已启动报名,欢迎全球创新者与挑战者参加。

近期,上海AI实验室发布了『书生』具身全栈引擎Intern-Robotics,通过构建虚拟仿真建模、虚实数据贯通、训测一体化等技术体系,一站式破解具身智能从数据、训练到实际应用的全链条难题,推动具身大脑从 “碎片化开发” 迈向 “全栈化量产”时代。欢迎全球开发者体验:https://internrobotics.shlab.org.cn

 

赛事介绍

挑战赛设置2大赛道,聚焦操作与导航两类具身智能典型任务,旨在打通仿真与现实壁垒,推动具身智能技术从“看起来能做”到“现实中能做”的关键跨越。

2大赛道赛程均分为线上和线下两阶段,线上赛将在“桃源 Intern·Utopia”通用具身仿真平台(GitHub地址:https://github.com/InternRobotics/InternUtopia)中进行,晋级队伍将进行线下决赛。

冠军队伍可获得七万现金奖励,优胜团队将受邀参加IROS Workshop,现场展示算法方案,与领域顶级专家面对面交流。优秀参赛者有机会参加上海AI实验室组织的各类前沿学术交流活动。

本次赛事由上海AI实验室主办,群核科技与阿德莱德大学协办,字节跳动、华为、众擎、荣耀、魔搭社区、阿里云、松灵机器人、越疆机器人等企业联合赞助支持。

 

image.gif 编辑

参赛方式

进入赛事官网,填写报名信息(点击文末阅读原文直达)。

https://internrobotics.shlab.org.cn/challenge/2025/

 

image.gif 编辑

(扫码报名)

赛道介绍

赛道1:开放桌面场景的视觉语言操作任务

任务简介:

本赛道旨在构建具备语言理解与执行能力的多模态机器人操作系统。参赛者需设计端到端的操控策略模型,实现从视觉感知、语言指令理解到动作控制预测的完整流程。机器人需在开放的桌面场景中,控制机械臂完成复杂指令引导下的多种操控任务。

主要挑战包括:

  • 融合语言与视觉信息,驱动感知-决策-控制一体化流程;
  • 长程的操作任务,挑战模型决策控制的稳定性和自我纠偏能力;
  • 多样化的场景布局、物体类型、操作指令,挑战模型泛化能力。

 

image.gif 编辑

 

赛道2:物理环境中的视觉语言导航任务

任务简介:

本赛道任务旨在构建具备语言理解能力的多模态移动机器人导航系统。参赛者需设计感知-决策模型,实现从自我中心视觉感知、语言指令理解、历史轨迹建模到导航动作预测的完整流程。机器人需在真实物理引擎环境中,驱动足式机器人(如人形机器人 Unitree H1)在语言引导下完成室内导航任务,具备应对视角抖动、高度变化及局部避障等挑战的能力,实现稳健、安全的视觉语言导航行为。

主要挑战包括:

  • 融合语言与视觉信息,驱动感知-决策-控制一体化流程;
  • 在物理引擎驱动的人形机器人平台上,稳健处理行走过程中的视角抖动、高度变化及局部避障等问题;
  • 真实复杂的室内场景、多样化的导航指令,挑战模型应对复杂新场景与指令的泛化能力。

 

image.gif 编辑

比赛奖励

  • 总奖励价值近百万元人民币(包括奖金,奖品,机器人代金券等);
  • 每个赛道的冠军团队七万元人民币奖金激励;
  • IROS 2025现场展示机会;
  • 上海AI实验室前沿学术沙龙参会名额。

线下每个赛道的前三名均可获得现金奖励,以及差旅资助。所有线下参赛队伍可获得参赛证书和纪念品。

名次

奖金(元)

其他奖励

第1名

70,000

奖品 + 证书

第2名

35,000

奖品 + 证书

第3名

21,000

奖品 + 证书

赛程安排

7月25日:报名启动及赛事材料包发布

7月30日:测试服务器上线

9月30日:提交截止

10月18日:线下挑战

10月20日:IROS 2025现场颁奖

*(日程如有调整将另行通知)

研讨会嘉宾

10月20日,上海AI实验室将在IROS 2025大会现场举办物理世界中的多模态机器人学习研讨会,多位国内外机器人学习和计算机视觉领域的顶尖专家将出席会议并分享前沿观点。

 

image.gif 编辑

 

目录
相关文章
|
1月前
|
Web App开发 人工智能 自然语言处理
从搜索到执行,全自动|AutoHub重塑ModelScope使用体验
自 2022 年 11 月成立以来,魔搭社区(ModelScope)已迅速成长为中国最大 AI 开源平台。 目前,社区已托管超 7 万个开源模型,覆盖大语言模型(LLM)、对话、语音、图像生成、视频生成、AI 作曲等多个领域;支持模型的 体验、下载、调优、训练、推理与部署全流程操作。
154 0
|
人工智能 缓存 NoSQL
【深度】企业 AI 落地实践(四):如何构建端到端的 AI 应用观测体系
本文探讨了AI应用在实际落地过程中面临的三大核心问题:如何高效使用AI模型、控制成本以及保障输出质量。文章详细分析了AI应用的典型架构,并提出通过全栈可观测体系实现从用户端到模型推理层的端到端监控与诊断。结合阿里云的实践经验,介绍了基于OpenTelemetry的Trace全链路追踪、关键性能指标(如TTFT、TPOT)采集、模型质量评估与MCP工具调用观测等技术手段,帮助企业在生产环境中实现AI应用的稳定、高效运行。同时,针对Dify等低代码平台的应用部署与优化提供了具体建议,助力企业构建可扩展、可观测的AI应用体系。
|
机器学习/深度学习 人工智能
手动实现一个扩散模型DDPM(下)
手动实现一个扩散模型DDPM(下)
771 2
|
机器学习/深度学习 算法框架/工具
什么是ablation study(消融实验)?
什么是ablation study(消融实验)?
什么是ablation study(消融实验)?
|
存储 人工智能 编译器
C/C++期末考试复习---知识点+习题
C/C++期末考试复习---知识点+习题
1869 2
抖音评论插件,全自动评论脚本留言,点赞关注私信autojs
脚本提供了完整的抖音自动化操作功能,包括随机滑动视频、点赞、关注、评论和私信。代码中包
|
7月前
|
机器学习/深度学习 计算机视觉
RT-DETR改进策略【注意力机制篇】| 2023 MCAttention 多尺度交叉轴注意力 获取多尺度特征和全局上下文信息
RT-DETR改进策略【注意力机制篇】| 2023 MCAttention 多尺度交叉轴注意力 获取多尺度特征和全局上下文信息
145 2
RT-DETR改进策略【注意力机制篇】| 2023 MCAttention 多尺度交叉轴注意力 获取多尺度特征和全局上下文信息
|
算法框架/工具 C++ Python
根据相机旋转矩阵求解三个轴的旋转角/欧拉角/姿态角 或 旋转矩阵与欧拉角(Euler Angles)之间的相互转换,以及python和C++代码实现
根据相机旋转矩阵求解三个轴的旋转角/欧拉角/姿态角 或 旋转矩阵与欧拉角(Euler Angles)之间的相互转换,以及python和C++代码实现
1064 0
|
12月前
|
存储 缓存 NoSQL
Redis过期Key的清理机制
Redis过期Key的清理机制
257 1
|
弹性计算 Unix Linux
带你读《弹性计算技术指导及场景应用》——1. 单实例上运行Linux桌面多开解决方案(1)
带你读《弹性计算技术指导及场景应用》——1. 单实例上运行Linux桌面多开解决方案(1)
284 2

热门文章

最新文章