Meta的AI让你在元宇宙中可以“语出成真”

简介: 正如Meta展示的那样,Builder Bot用语音命令制作的3D环境,能让用户在其中自由活动。

086dd4548951330f4da7807360b36041b35486.jpg

你想象过“语出成真”的世界吗?Meta的CEO马克扎克伯格今天在现场活动中展示了一个产品原型,让你在元宇宙中可以通过说出你自己的需求,来构筑你的虚拟世界。这个原型称为 “Builder Bot”,它可能是吸引人们进入Meta元宇宙的“大杀器”,同时也是用AI辅助艺术创作的重大机会。

在预先录制的演示视频中,扎克伯格向观众介绍了使用Builder Bot创建虚拟空间的过程,从“带我们去海边”开始,他的一系列语言命令,让AI在他周围一步步地创建了一个海边的卡通 3D 景观,而据扎克伯格描述,这些内容“都是由人工智能生成的”。

随后,演示中还出现了创建岛屿、添加高积云、播放热带音乐等命令,AI一一应对了这些命令,无论是相对宽泛的,还是十分具体的。然而,这个演示视频并没有具体说明,Builder Bot究竟是基于有限的人工模型库,还是已经可以实现AI对内容的自动生成。

时下,市面上已经有AI项目实现了基于文本描述的图像生成,包括OpenAI的“DALL-E”、英伟达的“GauGAN2”和“VQGAN+CLIP”等。但是,这些项目只能生成2D图像,并且不带有交互组件,而3D对象的生成还处在研究当中。

正如Meta展示的那样,Builder Bot用语音命令制作的3D环境,能让用户在其中自由活动。而 Meta 的目标还并不止于此,它想要的是更完善的交互。扎克伯格在活动主题演讲中承诺:“你将能够创造细致入微的世界,用你的声音与他人一同探索并分享经验。” Meta在活动期间发布了其他几项有关AI系统的新进展,包括通用语言翻译器的计划、新版本的对话式AI系统、以及为没有大量书面数据集的语言构建新翻译模型的倡议。

扎克伯格承认,复杂的交互性是VR目前面临的重大挑战。许多虚拟对象的交互实现起来非常困难,而用户可能感受不到开发的难度。如果用户要求提供不适当的内容,或者人工智能的训练再现了人类对世界的偏见和刻板印象,AI可能会带来许多问题。同时,Meta还未能给Builder Bot设限,以规避上述问题。所以至少现在这段时间,Builder Bot还不会上架Meta的VR平台。然而,Meta未来的AI计划也确实令人期待。


本文转载自51CTO,本文一切观点和机器智能技术圈子无关。原文链接
免费体验百种AI能力以及试用热门离线SDK:【点此跳转】

相关文章
|
11天前
|
机器学习/深度学习 人工智能 计算机视觉
MILS:无需对LLM进行额外训练就能处理多模态任务,Meta AI提出零样本生成多模态描述方法
MILS 是 Meta AI 推出的零样本生成高质量多模态描述方法,支持图像、视频和音频的描述生成,无需额外训练。
102 34
MILS:无需对LLM进行额外训练就能处理多模态任务,Meta AI提出零样本生成多模态描述方法
|
2天前
|
存储 人工智能 编解码
Pippo:Meta放出AI大招!单张照片秒转3D人像多视角视频,AI自动补全身体细节
Pippo 是 Meta 推出的图像到视频生成模型,能够从单张照片生成 1K 分辨率的多视角高清人像视频,支持全身、面部或头部的生成。
49 9
|
26天前
|
机器学习/深度学习 人工智能 算法
Transformer打破三十年数学猜想!Meta研究者用AI给出反例,算法杀手攻克数学难题
《PatternBoost: Constructions in Mathematics with a Little Help from AI》提出了一种结合传统搜索算法和Transformer神经网络的PatternBoost算法,通过局部搜索和全局优化交替进行,成功应用于组合数学问题。该算法在图论中的Ramsey数研究中找到了更小的反例,推翻了一个30年的猜想,展示了AI在数学研究中的巨大潜力,但也面临可解释性和通用性的挑战。论文地址:https://arxiv.org/abs/2411.00566
74 13
|
2月前
|
机器学习/深度学习 人工智能
Leffa:Meta AI 开源精确控制人物外观和姿势的图像生成框架,在生成穿着的同时保持人物特征
Leffa 是 Meta 开源的图像生成框架,通过引入流场学习在注意力机制中精确控制人物的外观和姿势。该框架不增加额外参数和推理成本,适用于多种扩散模型,展现了良好的模型无关性和泛化能力。
104 11
Leffa:Meta AI 开源精确控制人物外观和姿势的图像生成框架,在生成穿着的同时保持人物特征
|
2月前
|
机器学习/深度学习 人工智能 自然语言处理
Llama 3.3:Meta AI 开源新的纯文本语言模型,专注于多语言对话优化
Meta AI推出的Llama 3.3是一款70B参数的纯文本语言模型,支持多语言对话,具备高效、低成本的特点,适用于多种应用场景,如聊天机器人、客户服务自动化、语言翻译等。
128 13
Llama 3.3:Meta AI 开源新的纯文本语言模型,专注于多语言对话优化
|
2月前
|
人工智能 安全 PyTorch
SPDL:Meta AI 推出的开源高性能AI模型数据加载解决方案,兼容主流 AI 框架 PyTorch
SPDL是Meta AI推出的开源高性能AI模型数据加载解决方案,基于多线程技术和异步事件循环,提供高吞吐量、低资源占用的数据加载功能,支持分布式系统和主流AI框架PyTorch。
104 10
SPDL:Meta AI 推出的开源高性能AI模型数据加载解决方案,兼容主流 AI 框架 PyTorch
|
2月前
|
机器学习/深度学习 人工智能 算法
Meta Motivo:Meta 推出能够控制数字智能体动作的 AI 模型,提升元宇宙互动体验的真实性
Meta Motivo 是 Meta 公司推出的 AI 模型,旨在控制数字智能体的全身动作,提升元宇宙体验的真实性。该模型通过无监督强化学习算法,能够实现零样本学习、行为模仿与生成、多任务泛化等功能,适用于机器人控制、虚拟助手、游戏角色动画等多个应用场景。
106 4
Meta Motivo:Meta 推出能够控制数字智能体动作的 AI 模型,提升元宇宙互动体验的真实性
|
29天前
|
人工智能 算法 前端开发
OmAgent:轻松构建在终端设备上运行的 AI 应用,赋能手机、穿戴设备、摄像头等多种设备
OmAgent 是 Om AI 与浙江大学联合开源的多模态语言代理框架,支持多设备连接、高效模型集成,助力开发者快速构建复杂的多模态代理应用。
191 72
OmAgent:轻松构建在终端设备上运行的 AI 应用,赋能手机、穿戴设备、摄像头等多种设备
|
15天前
|
人工智能 自然语言处理 搜索推荐
【上篇】-分两篇步骤介绍-如何用topview生成和自定义数字人-关于AI的使用和应用-如何生成数字人-优雅草卓伊凡-如何生成AI数字人
【上篇】-分两篇步骤介绍-如何用topview生成和自定义数字人-关于AI的使用和应用-如何生成数字人-优雅草卓伊凡-如何生成AI数字人
91 24
【上篇】-分两篇步骤介绍-如何用topview生成和自定义数字人-关于AI的使用和应用-如何生成数字人-优雅草卓伊凡-如何生成AI数字人
|
9天前
|
机器学习/深度学习 存储 人工智能
MNN-LLM App:在手机上离线运行大模型,阿里巴巴开源基于 MNN-LLM 框架开发的手机 AI 助手应用
MNN-LLM App 是阿里巴巴基于 MNN-LLM 框架开发的 Android 应用,支持多模态交互、多种主流模型选择、离线运行及性能优化。
787 14
MNN-LLM App:在手机上离线运行大模型,阿里巴巴开源基于 MNN-LLM 框架开发的手机 AI 助手应用