OpenAI又出王炸了!正式推出超强AI视频模型Sora

本文涉及的产品
实时计算 Flink 版,1000CU*H 3个月
智能开放搜索 OpenSearch行业算法版,1GB 20LCU 1个月
实时数仓Hologres,5000CU*H 100GB 3个月
简介: OpenAI正式推出AI视频生成模型Sora,可根据文本提示生成逼真视频,面向美国及其他市场ChatGPT付费用户开放。Sora Turbo支持生成长达20秒的视频及多种变体,具备模拟物理世界的新兴能力,可创建多镜头视频,提供Remix和Storyboard等创新功能。

OpenAI又出王炸了!正式推出超强AI视频模型Sora

爱技术分享网获悉,当地时间周一,OpenAI宣布正式向用户开放人工智能(AI)视频生成模型Sora,该系统可以根据文本提示生成逼真的视频,这距离OpenAI首次公开预览这款产品已过去了10个月时间。

img

图片来源:OpenAI官网截图

根据OpenAI的介绍,Sora将于当天晚些时候向美国及其他市场的ChatGPT付费用户开放。新版工具Sora Turbo可以生成最长达20秒的视频,并且可以提供这些视频的多种变体。

自今年2月首次预告Sora以来,OpenAI便开始与电影制片厂、媒体高管以及经纪公司展开会谈。OpenAI还允许一些艺术家、知名演员和导演试用该服务。

OpenAI声称Sora是一项理解和模拟现实的基础性AI技术,是开发能够与物理世界互动模型的重要一步。

然而,Sora在早期测试中显示出明显的局限性。据悉,在一次测试中,Sora存在“多余肢体”的问题,并对物理现象的理解不够准确。此外,与图像生成器或聊天机器人相比,Sora生成每个视频所需的时间和算力明显更多了。

OpenAI首席执行官奥尔特曼表示,初期Sora的使用仍然受限,ChatGPT Plus订阅用户可以每月生成50个低分辨率视频,ChatGPT Pro订阅用户可以无限制的“较慢”生成高分辨率视频,以及500个快速生成的视频。

最令人印象深刻的特点是,Sora能够逼真地模拟物理世界、OpenAI称之为"新兴的模拟能力"。在此之前,还没有任何文字视频模型能与之相媲美。

例如,Sora“可以在单个生成的视频中创建多个镜头,准确地体现人物和视觉风格”。它可以制作长达1分钟的视频,但用户也可以随心所欲地制作短视频。可以制作不同分辨率的竖版、方形和水平视频。而且计算量越高,视频质量也会越高。

有评论称,本周一上线的Sora与OpenArt的AI工具DALL-E类似,用户输入期望的场景,Sora将回馈高清视频剪辑结果。

本周一OpenAI官网的Sora页面介绍了一些Sora的功能。其中,名为Remix的重新混合功能可以替换、删除或重新构想视频中的元素,比如设计一个打开大门通向图书馆的场景时,用户可以用法式对开门替换普通的大门,可以把图书馆变成一艘宇宙飞船,然后可以移除宇宙飞船,添加一片丛林,还用月球景观代替丛林。

image-20241210103825597

图片来源:OpenAI官网视频截图

img

图片来源:OpenAI官网视频截图

Sora还包含一个名为Storyboard的选项,用户可以通过它详细描述希望视频在不同时间点发生的内容,从而更好地指导一系列片段的生成。此外,Sora还提供了一个功能,让用户可以浏览其他人创作的视频集锦。

img

图片来源:OpenAI官网视频截图

img

图片来源:OpenAI官网视频截图

Sora的发布是OpenAI为期12天的产品直播活动的一部分,上周已推出了更昂贵的ChatGPT Pro订阅选项,可无限制访问OpenAI最强大的AI模型。

定价方面,Sora目前纳入OpenAI的两个产品套餐,其中,ChatGPT Plus每月收费20美元,为订阅用户生成的视频分辨率高达720p,时长最长5秒,ChatGPT Pro每月收费200美元,订阅用户可以无限量生成高分辨率的视频,分辨率高达1080p、最长时长20秒,并且可以五个视频同时生成,视频可以无水印下载。

最后附上最新最实用的ChatGPT升级教程,送给想要体验Sora神奇能力的小伙伴。

img

图片来源:OpenAI官网视频截图

目录
相关文章
|
1月前
|
人工智能 API 数据安全/隐私保护
近期非常风靡非常逼真的AI视频内容由sora生成的视频是怎么回事?-优雅草卓伊凡
近期非常风靡非常逼真的AI视频内容由sora生成的视频是怎么回事?-优雅草卓伊凡
467 12
近期非常风靡非常逼真的AI视频内容由sora生成的视频是怎么回事?-优雅草卓伊凡
|
7月前
|
人工智能 测试技术 API
PaperBench:OpenAI开源AI智能体评测基准,8316节点精准考核复现能力
PaperBench是OpenAI推出的开源评测框架,通过8316个评分节点系统评估AI智能体复现学术论文的能力,涵盖理论理解、代码实现到实验执行全流程。
501 30
PaperBench:OpenAI开源AI智能体评测基准,8316节点精准考核复现能力
|
6月前
|
人工智能 自然语言处理 安全
💻 Codex 来了:OpenAI 推出多任务软件工程 AI 代理,开发者工作方式将被重塑?
Codex 是 OpenAI 推出的一款云端智能开发代理,基于优化后的 Codex-1 模型,能够执行从代码编写、Bug 修复到 PR 提交的完整工程任务。通过 ChatGPT 的界面,用户可向 Codex 分配任务,它将在独立沙盒中运行并返回结果。Codex 支持多任务异步处理,遵循项目规范(AGENTS.md),并生成日志与测试报告以确保透明性。作为“AI 参与式开发”的里程碑,Codex 不仅提升效率,还可能重塑开发者角色,使他们从具体编码转向指导 AI 完成任务,推动软件工程进入意图驱动的新时代。
543 16
|
7月前
|
人工智能 搜索推荐 开发者
GPT-4o测评准确率竟不到1%!BrowseComp:OpenAI开源AI代理评测新基准,1266道高难度网络检索问题
OpenAI最新开源的BrowseComp基准包含1266个高难度网络检索问题,覆盖影视、科技、艺术等九大领域,其最新Deep Research模型以51.5%准确率展现复杂信息整合能力,为AI代理的浏览能力评估建立新标准。
499 4
GPT-4o测评准确率竟不到1%!BrowseComp:OpenAI开源AI代理评测新基准,1266道高难度网络检索问题
|
7月前
|
人工智能 自然语言处理 测试技术
自然语言生成代码一键搞定!Codex CLI:OpenAI开源终端AI编程助手,代码重构+测试全自动
Codex CLI是OpenAI推出的轻量级AI编程智能体,基于自然语言指令帮助开发者高效生成代码、执行文件操作和进行版本控制,支持代码生成、重构、测试及数据库迁移等功能。
1441 0
自然语言生成代码一键搞定!Codex CLI:OpenAI开源终端AI编程助手,代码重构+测试全自动
|
8月前
|
人工智能 编解码 运维
当ChatGPT能写情书、Sora会造电影:我们必须掌握的AI内容识别技能
随着AI技术迅猛发展,AI生成内容在文学、新闻、绘画等领域广泛应用,但其真假难辨、质量参差不齐,可能带来信息误导、知识产权侵犯及安全风险等问题。学会识别AI生成内容至关重要,包括通过逻辑漏洞排查、语言风格分析、生物特征异常检测等手段审核文本、图片和视频。人工审核在面对高隐蔽性内容时仍不可替代,需结合工具与上下文理解共同筑起防护屏障。守护真实信息、规避风险,是每个人在AI时代应尽的责任。
249 7
|
8月前
|
Web App开发 人工智能 JavaScript
Nanobrowser:开源版OpenAI Operator!AI自动操控浏览器,复杂网页任务一键搞定
Nanobrowser 是一款开源的 Chrome 扩展工具,基于多智能体系统实现复杂的网页任务自动化,支持多种大型语言模型,完全免费且注重隐私保护。
1154 1
|
9月前
|
人工智能
D1net阅闻 | OpenAI进军虚拟助手领域 AI智能体加速迈入商业化阶段
D1net阅闻 | OpenAI进军虚拟助手领域 AI智能体加速迈入商业化阶段
|
9月前
|
人工智能 算法 机器人
D1net阅闻|OpenAI CEO奥尔特曼:预计第一批AI智能体今年“加入劳动力大军”
D1net阅闻|OpenAI CEO奥尔特曼:预计第一批AI智能体今年“加入劳动力大军”
|
1月前
|
人工智能 运维 Kubernetes
Serverless 应用引擎 SAE:为传统应用托底,为 AI 创新加速
在容器技术持续演进与 AI 全面爆发的当下,企业既要稳健托管传统业务,又要高效落地 AI 创新,如何在复杂的基础设施与频繁的版本变化中保持敏捷、稳定与低成本,成了所有技术团队的共同挑战。阿里云 Serverless 应用引擎(SAE)正是为应对这一时代挑战而生的破局者,SAE 以“免运维、强稳定、极致降本”为核心,通过一站式的应用级托管能力,同时支撑传统应用与 AI 应用,让企业把更多精力投入到业务创新。
390 29