Sora: 开创视频创作新纪元
PS:目前 openai 官方还未开放 sora 灰度,根据 dalle 和 gpts 的经验,肯定是优先ChatGPT Plus 付费用户使用,需要注册或者升级 GPT Plus 可以看这个教程: 保姆级升级 GPT4 的教程 ,一分钟完成升级
2024年2月16日,OpenAI在其官方网站上正式宣布了一个划时代的文本到视频的大型模型——Sora。此模型标志着视频创作领域的一大步进展,使得根据简单文本描述生成长达60秒的高质量视频成为可能。当前,Sora尚处于灰度测试阶段,预计将优先向ChatGPT Plus付费用户提供使用权限。对于有意体验或升级至GPT Plus的用户,可以参照升级ChatGPT Plus的教程一探究竟。
Sora的特点
综合 Sora 和其他模型对比,他这么强体现在以下两个方面
- 空间连续性:在多个分镜中保持物体连续
- 时间连续性:在线性时间推进,物体能够保持连贯,面包仍然是面包,大象是大象
- 世界模型模拟:sora 通过大规模参数训练涌现出了某种物理规律理解的能力:如在我的世界视频中,光标颜色会随镜头切换而改变
- 长度超出预期:之前的生成视频长度大都在 3-5s,而 sora 一口气可以生成 60s 的视频
Sora的应用展示
Sora的应用横跨多个领域,如教育、产品演示、内容营销等,以下是一些精彩的使用案例展示:
- 东京霓虹街头:一位时尚女性在充满霓虹灯光和活力的东京街头自信漫步。
- 雪地巨型长毛象:几只长毛象在雪地中缓慢行走,背景是雪覆盖的树木和山峦。
- 加州淘金热历史影像:展现加利福尼亚淘金热时期的珍贵历史镜头。
- 禅宗花园玻璃球:一个玻璃球内部的禅宗花园,其中有个小矮人正在整理沙地。
- 卡通袋鼠迪斯科舞:一只卡通袋鼠在舞池中翩翩起舞。
- 野外探险:一辆白色老式SUV在陡峭的山路上驰骋,周围是红杉和松树。
- 东京郊区列车之旅:列车穿越东京郊区,窗户映出的倒影。
- 艺术画廊之旅:参观多风格的精美艺术品。
- 生日庆祝:一位祖母在生日蛋糕前吹熄蜡烛的温馨时刻。
- 中国农历新年庆祝:中国龙的农历新年庆祝视频。
部分视频截图
如何使用Sora
在使用Sora前,请确保已注册并升级至OpenAI账户)(大概率 Plus 会员才能用),获取Sora的访问权限。使用步骤如下:
- 准备文本描述:登录OpenAI账户,进入Sora界面,输入您的视频创意文本描述。
- 生成视频:提交文本后,点击“生成视频”,Sora将处理您的请求并生成视频。
看完 Sora 的 prompt,可能仍然对 Prompt 是一个不小的考研,因为涉及到故事情节设计,分镜等,语言表达是一个不小的挑战。
截至2024年2月18日,Sora的访问权限仍然限于部分专业用户,但OpenAI已发布了大量的案例(约 100 个)
技术背景
Sora基于Transformer架构,采用了扩散模型来提高生成视频的质量和多样性。此外,Sora模型通过数据处理和压缩技术,在保持高质量视频输出的同时,优化存储使用。
详细技术报告可以参考我的另一篇文章:4000 字入门 Sora & 变现案例分析
变现思路分析
提供部分变现思路:
- 售卖 Sora 账号或者邀请码
- 售卖高质量的视频生成 prompt
- 制作/代生成 ai 视频
- 使用 Sora 生成的视频,做个人的自媒体账号
- 电商:围绕 sora 搜索词做生意
- 套壳网站
常见问题解答
- Sora能做什么?:Sora能根据文本描述生成高达60秒的视频,适用于多种场景和主题。
- 如何开始使用Sora?:需登录OpenAI账户,并通过Sora界面提交视频描述。
- Sora的优势在哪里?:Sora基于最新的AI技术,能生成高质量、逼真的视频内容。
Sora开启了AI视频创作的新时代,不论是专业人士还是视频制作爱好者,都可以轻松创作出富有创意的视频内容。随着技术的进一步发展,期待Sora为视频创作领域带来更多革新,后面有技术报告会第一时间跟进