杨立昆狠批Sora不是世界模型

简介: 【2月更文挑战第13天】杨立昆狠批Sora不是世界模型

4f73b682ffcd8707e55d19c3c0c425c6.jpeg
在人工智能领域,对于通用人工智能(AGI)的追求一直是研究者们的终极目标。而构建一个真正理解和模拟现实世界的模型,被视为实现AGI的重要一步。在这个过程中,Sora作为OpenAI发布的视频生成模型引发了一场争议,杨立昆等知名人士质疑其是否真正具备世界模型的能力。

Sora被定位为能够理解和模拟现实世界模型的基础,其发布引起了广泛关注。然而,杨立昆在社交平台上多次对Sora进行批评,认为其生成式技术路线注定失败。杨立昆指出,仅仅通过生成视频并不能代表模型理解了物理世界,而世界模型的建立需要更多基于因果预测的方法。这一观点引发了人们对于Sora能否真正模拟世界的质疑。

除了杨立昆外,其他知名人士也对Sora提出了类似的观点。比如Keras之父François Chollet认为,仅仅通过让AI观看视频是无法完全学习到世界模型的,现实世界的复杂性远远超出了任何模型通过有限数据所能学习到的范围。这些质疑引发了对Sora技术路线的深入探讨和反思。

针对Sora技术路线的争议,人们开始思考何为真正的世界模型,以及构建世界模型的最佳方法是什么。一方面,Sora代表了生成式技术路线,通过分析视频并生成新的视觉内容来模拟现实世界。其采用的Transformer架构以及Diffusion Model等技术在视频生成领域取得了显著成就,但其是否能够真正理解和模拟物理世界的能力却受到了质疑。

另一方面,一些学者开始探讨非生成式技术路线,认为通过基于因果预测的方法构建世界模型可能更为有效。例如,Meta发布的V-JEPA,即代表了非生成式路线,其采用自我监督学习方法,通过预测视频中的缺失部分来学习世界模型。V-JEPA的发布引发了对于非生成式技术路线的关注和探讨。

在这场关于世界模型的辩论中,人们开始反思什么才是真正的世界模型,以及如何才能更好地构建这样的模型。一些学者认为,世界模型应该能够理解和预测物理世界中发生的事情,而不仅仅是通过生成内容来模拟现实。因此,基于因果预测的方法可能更能符合世界模型的本质。

然而,生成式技术路线也有其独特的优势和潜力,尤其是在视觉内容生成领域取得了显著的成就。因此,如何在生成式和非生成式技术之间找到平衡,并结合两者的优势,可能是构建真正世界模型的关键。

目录
相关文章
|
6月前
|
人工智能
Sora是世界模型吗?
【2月更文挑战第13天】Sora是世界模型吗?
69 2
Sora是世界模型吗?
|
6月前
|
编解码 搜索推荐
Sora能做什么?
【2月更文挑战第5天】Sora能做什么?
424 2
Sora能做什么?
|
6月前
|
机器学习/深度学习 人工智能 计算机视觉
多模态模型可能是大模型的终局
多模态模型可能是大模型的终局
|
5月前
|
编解码 机器人 测试技术
2024年6月计算机视觉论文推荐:扩散模型、视觉语言模型、视频生成等
6月还有一周就要结束了,我们今天来总结2024年6月上半月发表的最重要的论文,重点介绍了计算机视觉领域的最新研究和进展。
142 8
|
6月前
|
编解码 边缘计算 自然语言处理
2024年5月计算机视觉论文推荐:包括扩散模型、视觉语言模型、图像编辑和生成、视频处理和生成以及图像识别等各个主题
五月发布的计算机视觉领域重要论文涵盖了扩散模型、视觉语言模型、图像生成与编辑及目标检测。亮点包括:1) Dual3D提出双模式推理策略,实现高效文本到3D图像生成;2) CAT3D利用多视图扩散模型创建3D场景,仅需少量图像;3) Hunyuan-DiT是多分辨率的中文理解扩散Transformer,可用于多模态对话和图像生成;4) 通过潜在扩散模型从EEG数据重建自然主义音乐,展示复杂音频重建潜力。此外,还有关于视觉语言模型和图像编辑的创新工作,如BlobGEN用于合成具有控制性的图像。
245 3
|
6月前
|
机器学习/深度学习 人工智能
Sora为什么会被称为世界模型?
【2月更文挑战第6天】Sora为什么会被称为世界模型?
105 2
Sora为什么会被称为世界模型?
|
6月前
|
人工智能 自然语言处理
Sora适用于哪些领域?
【2月更文挑战第9天】Sora适用于哪些领域?
130 4
Sora适用于哪些领域?
|
6月前
|
机器学习/深度学习 人工智能 算法
为什么说Sora很重要?
【2月更文挑战第9天】为什么说Sora很重要?
73 3
为什么说Sora很重要?
|
6月前
|
人工智能 计算机视觉
Sora的训练方法
【2月更文挑战第9天】Sora的训练方法
123 1
Sora的训练方法
|
6月前
|
人工智能 自然语言处理
你想用Sora生成什么样的视频?
【4月更文挑战第2天】Sora是OpenAI发布的一款文生视频大模型,能根据文本自动生成视频,从而为影视制作行业提高效率。该技术适用于短视频、MV制作,降低创作成本。同时也希望通过Sora,根据小学语文课本或古诗生成视频,帮助理解和记忆。
下一篇
无影云桌面