Meta的AI让你在元宇宙中可以“语出成真”

简介: 正如Meta展示的那样,Builder Bot用语音命令制作的3D环境,能让用户在其中自由活动。

086dd4548951330f4da7807360b36041b35486.jpg

你想象过“语出成真”的世界吗?Meta的CEO马克扎克伯格今天在现场活动中展示了一个产品原型,让你在元宇宙中可以通过说出你自己的需求,来构筑你的虚拟世界。这个原型称为 “Builder Bot”,它可能是吸引人们进入Meta元宇宙的“大杀器”,同时也是用AI辅助艺术创作的重大机会。

在预先录制的演示视频中,扎克伯格向观众介绍了使用Builder Bot创建虚拟空间的过程,从“带我们去海边”开始,他的一系列语言命令,让AI在他周围一步步地创建了一个海边的卡通 3D 景观,而据扎克伯格描述,这些内容“都是由人工智能生成的”。

随后,演示中还出现了创建岛屿、添加高积云、播放热带音乐等命令,AI一一应对了这些命令,无论是相对宽泛的,还是十分具体的。然而,这个演示视频并没有具体说明,Builder Bot究竟是基于有限的人工模型库,还是已经可以实现AI对内容的自动生成。

时下,市面上已经有AI项目实现了基于文本描述的图像生成,包括OpenAI的“DALL-E”、英伟达的“GauGAN2”和“VQGAN+CLIP”等。但是,这些项目只能生成2D图像,并且不带有交互组件,而3D对象的生成还处在研究当中。

正如Meta展示的那样,Builder Bot用语音命令制作的3D环境,能让用户在其中自由活动。而 Meta 的目标还并不止于此,它想要的是更完善的交互。扎克伯格在活动主题演讲中承诺:“你将能够创造细致入微的世界,用你的声音与他人一同探索并分享经验。” Meta在活动期间发布了其他几项有关AI系统的新进展,包括通用语言翻译器的计划、新版本的对话式AI系统、以及为没有大量书面数据集的语言构建新翻译模型的倡议。

扎克伯格承认,复杂的交互性是VR目前面临的重大挑战。许多虚拟对象的交互实现起来非常困难,而用户可能感受不到开发的难度。如果用户要求提供不适当的内容,或者人工智能的训练再现了人类对世界的偏见和刻板印象,AI可能会带来许多问题。同时,Meta还未能给Builder Bot设限,以规避上述问题。所以至少现在这段时间,Builder Bot还不会上架Meta的VR平台。然而,Meta未来的AI计划也确实令人期待。


本文转载自51CTO,本文一切观点和机器智能技术圈子无关。原文链接
免费体验百种AI能力以及试用热门离线SDK:【点此跳转】

相关文章
|
4月前
|
机器学习/深度学习 人工智能 自然语言处理
AI Compass前沿速览:IndexTTS2–B站、HuMo、Stand-In视觉生成框架、Youtu-GraphRAG、MobileLLM-R1–Meta、PP-OCRv5
AI Compass前沿速览:IndexTTS2–B站、HuMo、Stand-In视觉生成框架、Youtu-GraphRAG、MobileLLM-R1–Meta、PP-OCRv5
398 10
AI Compass前沿速览:IndexTTS2–B站、HuMo、Stand-In视觉生成框架、Youtu-GraphRAG、MobileLLM-R1–Meta、PP-OCRv5
|
6月前
|
机器学习/深度学习 人工智能 机器人
Meta AI Research:虚拟/可穿戴/机器人三位一体的AI进化路径
本文阐述了我们对具身AI代理的研究——这些代理以视觉、虚拟或物理形式存在,使其能够与用户及环境互动。这些代理包括虚拟化身、可穿戴设备和机器人,旨在感知、学习并在其周围环境中采取行动。与非具身代理相比,这种特性使它们更接近人类的学习与环境交互方式。我们认为,世界模型的构建是具身AI代理推理与规划的核心,这使代理能够理解并预测环境、解析用户意图及社会背景,从而增强其自主完成复杂任务的能力。世界建模涵盖多模态感知的整合、通过推理进行行动规划与控制,以及记忆机制,以形成对物理世界的全面认知。除物理世界外,我们还提出需学习用户的心理世界模型,以优化人机协作。
580 3
|
7月前
|
机器学习/深度学习 人工智能 API
基于昇腾适配Meta AI在Science正刊发表的蛋白质结构预测模型ESMFold
ESMFold是由Meta AI团队开发的一种基于深度学习的高效蛋白质结构预测模型,其核心目标是利用大规模蛋白质语言模型(ESM)直接从氨基酸序列快速推断蛋白质的三维结构。ESMFold通过预训练的语言模型捕捉序列中的进化与结构关联性,结合几何优化模块生成高精度原子坐标,显著降低了传统方法对多重序列比对(MSA)和模板依赖的计算成本。该模型在蛋白质从头预测(de novo prediction)、功能位点解析、突变效应模拟等领域具有重要价值,以高效的推理性能,推动结构预测技术的普惠化应用。
|
9月前
|
机器学习/深度学习 人工智能 自然语言处理
这个模型让AI角色会说话还会演!MoCha:Meta联手滑铁卢大学打造对话角色视频生成黑科技
MoCha是由Meta与滑铁卢大学联合开发的端到端对话角色视频生成模型,通过创新的语音-视频窗口注意力机制实现精准的唇语同步和全身动作生成。
575 12
这个模型让AI角色会说话还会演!MoCha:Meta联手滑铁卢大学打造对话角色视频生成黑科技
|
11月前
|
存储 人工智能 编解码
Pippo:Meta放出AI大招!单张照片秒转3D人像多视角视频,AI自动补全身体细节
Pippo 是 Meta 推出的图像到视频生成模型,能够从单张照片生成 1K 分辨率的多视角高清人像视频,支持全身、面部或头部的生成。
1109 9
Pippo:Meta放出AI大招!单张照片秒转3D人像多视角视频,AI自动补全身体细节
|
12月前
|
机器学习/深度学习 人工智能 算法
Transformer打破三十年数学猜想!Meta研究者用AI给出反例,算法杀手攻克数学难题
《PatternBoost: Constructions in Mathematics with a Little Help from AI》提出了一种结合传统搜索算法和Transformer神经网络的PatternBoost算法,通过局部搜索和全局优化交替进行,成功应用于组合数学问题。该算法在图论中的Ramsey数研究中找到了更小的反例,推翻了一个30年的猜想,展示了AI在数学研究中的巨大潜力,但也面临可解释性和通用性的挑战。论文地址:https://arxiv.org/abs/2411.00566
318 13
|
3月前
|
消息中间件 人工智能 安全
云原生进化论:加速构建 AI 应用
本文将和大家分享过去一年在支持企业构建 AI 应用过程的一些实践和思考。
842 45
|
4月前
|
人工智能 安全 中间件
阿里云 AI 中间件重磅发布,打通 AI 应用落地“最后一公里”
9 月 26 日,2025 云栖大会 AI 中间件:AI 时代的中间件技术演进与创新实践论坛上,阿里云智能集团资深技术专家林清山发表主题演讲《未来已来:下一代 AI 中间件重磅发布,解锁 AI 应用架构新范式》,重磅发布阿里云 AI 中间件,提供面向分布式多 Agent 架构的基座,包括:AgentScope-Java(兼容 Spring AI Alibaba 生态),AI MQ(基于Apache RocketMQ 的 AI 能力升级),AI 网关 Higress,AI 注册与配置中心 Nacos,以及覆盖模型与算力的 AI 可观测体系。
1098 51
|
3月前
|
人工智能 运维 Kubernetes
Serverless 应用引擎 SAE:为传统应用托底,为 AI 创新加速
在容器技术持续演进与 AI 全面爆发的当下,企业既要稳健托管传统业务,又要高效落地 AI 创新,如何在复杂的基础设施与频繁的版本变化中保持敏捷、稳定与低成本,成了所有技术团队的共同挑战。阿里云 Serverless 应用引擎(SAE)正是为应对这一时代挑战而生的破局者,SAE 以“免运维、强稳定、极致降本”为核心,通过一站式的应用级托管能力,同时支撑传统应用与 AI 应用,让企业把更多精力投入到业务创新。
538 30

热门文章

最新文章