看了OpenAI 发布文生视频模型 Sora,短视频、AI 视频行业、传统的影视公司等要悬了吗!

简介: 如果非要用三个词来总结Sora,那就是“60s超长长度”、“超强语义理解”和“世界模型”。

看了Sora,您有什么最深切的感受?我在撸了九九六十四遍以后,突然感到有点毛骨悚然:与Runway、Pika那些竞品“帕金森”风格的视频相比,这些视频里的物理结构,也太TM稳定真实了!

Sora官网有更多视频:https://openai.com/sora


如果非要用三个词来总结Sora,那就是“60s超长长度”、“超强语义理解”和“世界模型”。

不可否认AI技术正在变得越来越强大,为创作者提供了强大的工具,但并不会完全取代人类的创造力。




因为历史已经重演过了。


ChatGPT并没有干翻写作行业,只不过像英文润色、八股文写作之类的东西被降维打击了,但是正儿八经的文学创作,ChatGPT无能为力。

AI绘画也没有干翻绘画行业,只不过一些出图质量速度都不怎么样的画师被边缘化了,因为无论哪一点都不如AI,但是这些东西到了高手画师手里面变成了加速生产力的工具。

到了Sora了,它是可以生成很精美的视频,但是同样的,干不翻视频和影视行业。

作为辅助工具:就像数字画板帮助画师提高生产力一样,AI可能成为视频和影视制作人的一个帮手,加快内容创作的过程,而不是取代他们。

它在一些重复性或技术性较强的任务中,比如视频制作中的一些基础分镜和背景角色渲染,甚至视频特效的添加等领域,已经开始或将会减少对人工劳动的需求。但对于真正需要创意、审美和艺术构思的工作,AI仍然无法取代人类。

但是它会很大程度的搅乱现有的视频创作者的格局,造成两极分化更严重。


(ps: Sora 怎么使用?

目前 openai 官方还未开放 sora 灰度,不过根据文生图模型 DALL·E 案例,一定是先给 ChatGPT Plus 用户使用,需要注册或者升级可以看这个教程:

https://mp.weixin.qq.com/s/V8pJHAWF9JPzf7cDtqQE8Q

(一分钟完成升级)



很可能会有三个现象:

第一,以前的技术缺乏但创意能力强的视频创作者会异军突起,他们在以前不是没有点子,而是由于比如技术原因、设备原因等等实现不了自己的创意,但是在Sora的加成下,他们的创意可以被最大程度的还原。


第二,高级创作者会更具有竞争力,他们本身就是技术和创意都顶尖,这种可以极大加成视频创作的工具在他们的手上可能会大放异彩。


第三,处于中间层的创作者会比较难过,在技术被迅速拉平的情况下,创意可能会成为取胜的关键,而这个可能需要中间层的创作者更加的提升也有可能。


短的来看,Sora不会对现有的行业格局有什么较大的影响,远的来看,虚实不分是趋势,甚至我们未来会处于无限虚拟的世界里,但可能会比最真的真实还要真。


相关文章
|
4天前
|
存储 人工智能 Serverless
一键解锁 AI 动画视频创作,赢好礼
短视频行业的快速增长使得内容创作的速度和质量成为竞争关键。传统动画故事制作复杂且昂贵,限制了创作者对市场热点的快速反应和创新实现。本方案通过 AI 生成剧本和动画,简化创作流程并降低技术门槛,使创作者能高效生产高质量作品,迅速适应市场需求。
|
4天前
|
人工智能 安全 机器人
重磅发布的「AI视频通话」如何10分钟就实现?
2024年,OpenAI发布GPT-4o,支持文本、音频和图像的组合输入与输出,使交互更接近自然交流。传统语音助手需经历多阶段处理,容易出现延迟或误解,体验感差。本文介绍如何在阿里云上快速创建可视频通话的AI智能体,实现拟人化交互、精准感知、情绪捕捉等功能,提供高质量、低延时的音视频通话体验。通过简单的部署流程,用户可以轻松创建并体验这一先进的人机交互技术。点击“阅读原文”参与活动赢取惊喜礼物。
|
27天前
|
机器学习/深度学习 人工智能 算法
【AI问爱答-双十一返场周】第二场企业办公视频
【AI问爱答-双十一返场周】探讨AI大模型时代对企业办公的影响。AI员工旨在辅助而非替代人类,通过深度学习、大规模训练数据和自我监督学习提升效率。视频介绍生成式智能工具如全妙系列,助力企业内容生产。关注AI问爱答,了解更多AI技术与应用。
|
21天前
|
机器学习/深度学习 人工智能 自然语言处理
VideoWorld:字节开源自回归视频生成模型,支持输入视频指导AI生成视频!弥补文本生成视频的短板
VideoWorld 是由字节跳动、北京交通大学和中国科学技术大学联合推出的自回归视频生成模型,能够从未标注的视频数据中学习复杂知识,支持长期推理和规划任务。
292 8
VideoWorld:字节开源自回归视频生成模型,支持输入视频指导AI生成视频!弥补文本生成视频的短板
|
21天前
|
人工智能 编解码
CogVideoX-Flash:智谱首个免费AI视频生成模型,支持文生视频、图生视频,分辨率最高可达4K
CogVideoX-Flash 是智谱推出的首个免费AI视频生成模型,支持文生视频、图生视频,最高支持4K分辨率,广泛应用于内容创作、教育、广告等领域。
226 5
CogVideoX-Flash:智谱首个免费AI视频生成模型,支持文生视频、图生视频,分辨率最高可达4K
|
21天前
|
人工智能 自然语言处理 搜索推荐
GLM-Realtime:智谱推出多模态交互AI模型,融入清唱功能,支持视频和语音交互
GLM-Realtime 是智谱推出的端到端多模态模型,具备低延迟的视频理解与语音交互能力,支持清唱功能、2分钟内容记忆及灵活调用外部工具,适用于多种智能场景。
55 4
GLM-Realtime:智谱推出多模态交互AI模型,融入清唱功能,支持视频和语音交互
|
27天前
|
人工智能 边缘计算 双11
【AI问爱答-双十一返场周】第三场社交娱乐视频
【AI问爱答-双十一返场周】第三场社交娱乐视频探讨了AI在社交、教育和培训中的应用,特别是虚拟导师和教练的角色。邀请听力熊联合创始人苟津川分享AI在智能教育硬件领域的探索与挑战,包括云端协同、端侧模型优化及数据安全问题。欢迎持续关注并参与互动。
|
4月前
|
机器学习/深度学习 人工智能 并行计算
"震撼!CLIP模型:OpenAI的跨模态奇迹,让图像与文字共舞,解锁AI理解新纪元!"
【10月更文挑战第14天】CLIP是由OpenAI在2021年推出的一种图像和文本联合表示学习模型,通过对比学习方法预训练,能有效理解图像与文本的关系。该模型由图像编码器和文本编码器组成,分别处理图像和文本数据,通过共享向量空间实现信息融合。CLIP利用大规模图像-文本对数据集进行训练,能够实现zero-shot图像分类、文本-图像检索等多种任务,展现出强大的跨模态理解能力。
418 2
|
2月前
|
Go 开发工具
百炼-千问模型通过openai接口构建assistant 等 go语言
由于阿里百炼平台通义千问大模型没有完善的go语言兼容openapi示例,并且官方答复assistant是不兼容openapi sdk的。 实际使用中发现是能够支持的,所以自己写了一个demo test示例,给大家做一个参考。
|
10天前
|
机器学习/深度学习 人工智能 算法
o3-mini:OpenAI 发布最新推理模型,强大的STEM推理能力,灵活调整推理强度
OpenAI o3-mini是OpenAI推出的全新推理模型,专为科学、数学和编程等技术领域优化,支持三种推理强度,灵活调整性能。
128 25
o3-mini:OpenAI 发布最新推理模型,强大的STEM推理能力,灵活调整推理强度

热门文章

最新文章