近年来,随着人工智能技术的迅猛发展,它不仅改变了我们的生活方式,也对各行各业产生了深远影响。在这个领域,英伟达一直处于领先地位,其图形处理器(GPU)技术被广泛应用于机器学习和深度学习等领域。如今,英伟达再次展现其技术雄心,宣布成立全新研究部门——"GEAR",旨在打造具身智能体,引领未来技术潮流。
GEAR,全称为通用具身智能体研究(Generalist Embodied Agent Research),由英伟达的AI高级研究科学家Jim Fan和著名计算机科学家Yuke Zhu教授共同领导。该团队的使命是构建跨多模态、多场景的智能应用,致力于开发多模态基础模型、通用型机器人研究、虚拟世界中的基础智能体以及模拟与合成数据技术。这一举措标志着英伟达在AI领域的进一步深耕,为未来科技发展注入新的活力和动力。
GEAR的核心研究领域包括:
多模态基础模型:GEAR致力于开发基于大规模互联网数据源训练的LLMs(大型语言模型),用于规划与推理、视觉-语言模型以及世界模型。这些模型旨在打通不同模态信息间的壁垒,实现信息的跨域融合与应用。
通用型机器人研究:通用型机器人研究是GEAR的另一重要方向,该团队致力于研发能够适应复杂环境、实现稳健移动与灵巧操作的机器人模型与系统,以提升其在各类实际场景下的普适性与效能。
虚拟世界中的基础智能体:在虚拟世界中,基础智能体的研究对于游戏开发、虚拟现实技术等领域具有重要意义。GEAR的团队专注于创建能够在多种游戏与模拟环境中自主探索并持续自我提升能力的大型动作模型,为虚拟世界的智能交互设定新标准。
模拟与合成数据技术:模拟与合成数据技术是支撑智能体学习的重要基础。GEAR致力于构建大规模学习所需的仿真基础设施及合成数据流水线,为智能体的学习过程提供有力支持。
GEAR的成立不仅是英伟达在AI领域的重大战略举措,也是其开放与合作的体现。目前,GEAR已经开放职位申请,包括研究科学家、高级研究科学家和研究实习生等岗位,希望能吸引更多优秀的人才加入到这一前沿的研究团队中来。
在GEAR的重点项目中,有几个备受关注:
Eureka项目:通过编码大型语言模型实现人类水平的奖励设计。
Voyager项目:采用大型语言模型驱动的开放式具身智能体。
VIMA项目:利用多模态提示实现通用机器人操作能力。
MineDojo项目:借助互联网规模知识库构建开放式具身智能体。
这些项目涉及的技术领域广泛,涵盖了自然语言处理、机器人学、计算机视觉等多个方面,具有极高的科研价值和商业化前景。
英伟达创立GEAR团队是一个前瞻性的战略决策,它致力于在未来技术浪潮中占据领先地位,并推动整个人工智能和机器人行业的持续进步与发展。通过成立GEAR团队,英伟达表明其在先进AI和自主系统领域积极抢占技术和应用的制高点,旨在研发能够适应各种环境、具备广泛技能并能在虚拟与现实世界中有效运作的智能体。