OpenAI又出王炸了!正式推出超强AI视频模型Sora

本文涉及的产品
实时数仓Hologres,5000CU*H 100GB 3个月
检索分析服务 Elasticsearch 版,2核4GB开发者规格 1个月
智能开放搜索 OpenSearch行业算法版,1GB 20LCU 1个月
简介: OpenAI正式推出AI视频生成模型Sora,可根据文本提示生成逼真视频,面向美国及其他市场ChatGPT付费用户开放。Sora Turbo支持生成长达20秒的视频及多种变体,具备模拟物理世界的新兴能力,可创建多镜头视频,提供Remix和Storyboard等创新功能。

OpenAI又出王炸了!正式推出超强AI视频模型Sora

爱技术分享网获悉,当地时间周一,OpenAI宣布正式向用户开放人工智能(AI)视频生成模型Sora,该系统可以根据文本提示生成逼真的视频,这距离OpenAI首次公开预览这款产品已过去了10个月时间。

img

图片来源:OpenAI官网截图

根据OpenAI的介绍,Sora将于当天晚些时候向美国及其他市场的ChatGPT付费用户开放。新版工具Sora Turbo可以生成最长达20秒的视频,并且可以提供这些视频的多种变体。

自今年2月首次预告Sora以来,OpenAI便开始与电影制片厂、媒体高管以及经纪公司展开会谈。OpenAI还允许一些艺术家、知名演员和导演试用该服务。

OpenAI声称Sora是一项理解和模拟现实的基础性AI技术,是开发能够与物理世界互动模型的重要一步。

然而,Sora在早期测试中显示出明显的局限性。据悉,在一次测试中,Sora存在“多余肢体”的问题,并对物理现象的理解不够准确。此外,与图像生成器或聊天机器人相比,Sora生成每个视频所需的时间和算力明显更多了。

OpenAI首席执行官奥尔特曼表示,初期Sora的使用仍然受限,ChatGPT Plus订阅用户可以每月生成50个低分辨率视频,ChatGPT Pro订阅用户可以无限制的“较慢”生成高分辨率视频,以及500个快速生成的视频。

最令人印象深刻的特点是,Sora能够逼真地模拟物理世界、OpenAI称之为"新兴的模拟能力"。在此之前,还没有任何文字视频模型能与之相媲美。

例如,Sora“可以在单个生成的视频中创建多个镜头,准确地体现人物和视觉风格”。它可以制作长达1分钟的视频,但用户也可以随心所欲地制作短视频。可以制作不同分辨率的竖版、方形和水平视频。而且计算量越高,视频质量也会越高。

有评论称,本周一上线的Sora与OpenArt的AI工具DALL-E类似,用户输入期望的场景,Sora将回馈高清视频剪辑结果。

本周一OpenAI官网的Sora页面介绍了一些Sora的功能。其中,名为Remix的重新混合功能可以替换、删除或重新构想视频中的元素,比如设计一个打开大门通向图书馆的场景时,用户可以用法式对开门替换普通的大门,可以把图书馆变成一艘宇宙飞船,然后可以移除宇宙飞船,添加一片丛林,还用月球景观代替丛林。

image-20241210103825597

图片来源:OpenAI官网视频截图

img

图片来源:OpenAI官网视频截图

Sora还包含一个名为Storyboard的选项,用户可以通过它详细描述希望视频在不同时间点发生的内容,从而更好地指导一系列片段的生成。此外,Sora还提供了一个功能,让用户可以浏览其他人创作的视频集锦。

img

图片来源:OpenAI官网视频截图

img

图片来源:OpenAI官网视频截图

Sora的发布是OpenAI为期12天的产品直播活动的一部分,上周已推出了更昂贵的ChatGPT Pro订阅选项,可无限制访问OpenAI最强大的AI模型。

定价方面,Sora目前纳入OpenAI的两个产品套餐,其中,ChatGPT Plus每月收费20美元,为订阅用户生成的视频分辨率高达720p,时长最长5秒,ChatGPT Pro每月收费200美元,订阅用户可以无限量生成高分辨率的视频,分辨率高达1080p、最长时长20秒,并且可以五个视频同时生成,视频可以无水印下载。

最后附上最新最实用的ChatGPT升级教程,送给想要体验Sora神奇能力的小伙伴。

img

图片来源:OpenAI官网视频截图

目录
相关文章
|
7月前
|
人工智能 文字识别 测试技术
AI创企深度求索推出DeepSeek-VL系列大模型
【2月更文挑战第24天】AI创企深度求索推出DeepSeek-VL系列大模型
267 1
AI创企深度求索推出DeepSeek-VL系列大模型
|
7月前
|
机器学习/深度学习 人工智能 自然语言处理
揭秘Google Gemini:AI界的多模态革命者与ChatGPT-4的较量
揭秘Google Gemini:AI界的多模态革命者与ChatGPT-4的较量
216 0
|
人工智能 自然语言处理 Linux
AI谱曲 | 基于RWKV的最佳开源AI作曲模型魔搭推理实践
AI谱曲 | 基于RWKV的最佳开源AI作曲模型魔搭推理实践
|
20天前
|
SQL 机器学习/深度学习 人工智能
今日 AI 开源|共 4 项|DeepSeek 推出新一代 AI 推理模型,实力比肩 OpenAI o1-preview!
本文介绍了四个最新的 AI 开源项目,涵盖多模态生成式 AI、自然语言到 SQL 转化、多模态数学推理和复杂逻辑推理等多个领域,为 AI 应用开发提供了丰富的资源和工具。
94 0
今日 AI 开源|共 4 项|DeepSeek 推出新一代 AI 推理模型,实力比肩 OpenAI o1-preview!
|
2月前
|
人工智能
智谱 AI 大模型
智谱是清华大学技术成果转化公司,推出中英双语千亿级大模型 GLM-130B、对话模型 ChatGLM、开源模型 ChatGLM-6B、AI 提效助手智谱清言、高效率代码模型 CodeGeeX、多模态理解模型 CogVLM、文生图模型 CogView 和文生视频模型 CogVideo。是国内开源大模型的领先者,大模型领域的经典成功商业案例。
|
2月前
|
人工智能 自然语言处理 安全
【通义】AI视界|Adobe推出文生视频AI模型,迎战OpenAI和Meta
本文精选了过去24小时内的重要科技新闻,包括微软人工智能副总裁跳槽至OpenAI、Adobe推出文本生成视频的AI模型、Meta取消高端头显转而开发超轻量设备、谷歌与核能公司合作为数据中心供电,以及英伟达股价创下新高,市值接近3.4万亿美元。这些动态展示了科技行业的快速发展和激烈竞争。点击链接或扫描二维码获取更多资讯。
|
3月前
|
人工智能 自然语言处理 数据挖掘
【通义】AI视界|性能超越GPT-4o?最强大的开源AI模型来了……
本文介绍了五项最新AI技术动态,包括性能超越GPT-4o的开源AI模型Reflection70B、智谱清言App限时免费的视频通话功能、哈佛医学院研发的癌症诊断AI模型CHIEF、Replit推出的AI编程助手,以及英特尔与日本AIST合作设立的芯片制造研发中心。这些进展展示了AI领域的快速创新与广泛应用。更多详情,请访问通义官网体验。
|
4月前
|
人工智能 安全 机器人
谷歌推出其最强大的AI模型Gemini
谷歌推出其最强大的AI模型Gemini
|
4月前
|
Web App开发 人工智能 安全
Gemini vs ChatGPT:谷歌最新的AI和ChatGPT相比,谁更强?
Gemini vs ChatGPT:谷歌最新的AI和ChatGPT相比,谁更强?
|
6月前
|
机器学习/深度学习 人工智能 算法
OpenAI发布全新AI视频模型Sora:引领视频创作新纪元
OpenAI发布全新AI视频模型Sora:引领视频创作新纪元