前言
OpenAI自2015年成立以来,一直是人工智能领域的佼佼者。他们在深度学习和自然语言处理等多个方面取得了显著进展,GPT-4的推出更是巩固了他们在技术创新和应用开发上的领导地位。
OpenAI的目标不仅仅是技术突破,更重要的是推动AI技术的安全和伦理发展,以造福人类社会。
Sora AI 大地惊雷
1.什么是Sora?
2024年2月16日,OpenAI发布了其最新成果Sora,这是一个先进的视频生成大模型,标志着公司在视频生成技术方面的重大突破。Sora的发布展示了OpenAI在提高视频质量、分辨率、文本到视频的语义转换等方面的卓越能力。Sora不仅能够生成长达一分钟的高质量视频,还能准确展现光影效果、物理遮挡和碰撞关系,以及流畅的镜头转换,其性能远超当前市面上的任何产品。
2.Sora为何热度如此之高?
Sora的出现立即引发了全球的关注。人们惊叹于人工智能技术的快速发展,许多知名人士也对此发表了看法。例如,360公司创始人周鸿祎高度评价了Sora,他认为Sora的诞生将通用人工智能的实现时间大幅缩短。周鸿祎还强调了科技竞争的重要性,他认为与其他创业团队相比,拥有核心技术的公司如OpenAI的实力非常强大。他还指出,尽管国内的大模型发展已接近GPT-3.5,但与GPT-4相比还有巨大的差距。Sora的发布不仅展示了OpenAI的强大实力,也让人们看到了AI技术未来发展的无限可能。
3.Sora的能力
Sora的能力在于其生成视频的质量和复杂性。用户只需在提示框中输入单词、短语或句子。就可以达到这些效果:
生成具有多个角色和特定动作的丰富细节
根据用户提示准确详细描述主题的复杂场景
理解在生成的场景中的物存在关系
OpenAI表示,Sora不仅能理解用户的请求,还能理解物理世界中事物的存在方式。
4.Sora的当前限制
- 未能精确反映复杂物理过程的复杂性方面
- 会将时间细节和特定的事件序列混合在一起
- 在生成可信的动作以及准确地建模对象和角色之间的交互方面存在问题
如何使用Sora
1.Sora是否向公众开放,是否免费?
虽然Sora目前还未向公众开放,但OpenAI已经向一小部分专家和创作者提供了访问权限,以便收集反馈并改进平台。OpenAI的目标是使Sora成为一个对创意专业人士有用的工具。相信不久的将来, 会先开放部分免费的功能, 然后更高级的功能采用订阅制, 类比于GPT-4
2.如何获取Sora的访问权限并使用Sora?
现在你还不能登录使用Sora AI哦。我们还没开放申请访问的渠道。
目前,Sora的大门只对少数测试者敞开。OpenAI特别邀请了一些红队研究员、视觉艺术家、设计师和电影制作人,让他们先睹为快。这是为了评估Sora可能带来的风险,搜集各方的创意见解,以及提升Sora的能力。
不过,大家还需要耐心等待一下,因为现在还没有开放公共API,也没有更广泛的使用途径。
虽然OpenAI的官网上已经展示了一些令人兴奋的能力展示,让我们对这款从文本到视频的生成模型充满期待,但目前手动访问的权限还只限于内部测试和一些特定的外部试点项目。
OpenAI也提到了,他们未来可能会考虑把Sora融入商业产品,并逐步开放更多的访问权限。但具体公开访问的时间点还没有确定下来。
所以,现在这个富有创新精神的Sora模型,还只是对OpenAI以外的一小撮测试用户开放。我们能获得更广泛的公共访问权限,可能还需要看OpenAI的使用策略和对这项新技术的风险评估。
Sora的安全性
1.Sora是否安全?
就像我们对其他AI平台那样,对于Sora能创造出什么样的内容,大家也是有点担心的。OpenAI在这方面也是很上心,正在积极寻找解决方案。
除了和红队的小伙伴们携手并肩,OpenAI还在忙着打造一些新工具,帮大家辨别出哪些内容是Sora搞出来的,其中就包括一个“检测分类器”。
这个文本分类器的工作,就是要“检查并拒绝”那些不符合使用政策的内容。比如说,如果有人想让Sora生成一些极端暴力、色情、仇恨或者是侵犯名人肖像权、他人知识产权的东西,这个分类器就会说“不”。
OpenAI还提到,他们计划和全球的政策制定者、教育家还有艺术家们合作,听听他们的担忧,同时探索这项新技术能带来的好处。
2.Sora的内容限制
Sora紧守道德底线和安全规范,不给暴力、侵权或其他有害内容以传播之机。它倡导在一个充满安全感和相互尊重的环境中,释放每个人的创造力。
安全措施
- 与红队合作评估道德法律等潜在危害或风险。
- 与微软安全团队合作, 开发用于检测误导内容的工具
- 应用来自DALL·E 3的现有安全方法,包括文本和图像分类器,以确保遵守使用政策。
Sora API相关
1.OpenAI Sora API
在OpenAI的一篇博客文章中,他们向我们介绍了Sora,笔者在这里也透露个小秘密:目前,Sora还没有公开的API可供大家使用。
这就意味着,除了少数被挑选的测试用户,大家都还没法亲自尝试Sora。这样的决定,主要是因为他们在考虑到使用Sora可能带来的一些风险。
不过,博客里提到一项利好的消息:将来,我们或许可以通过OpenAI的一些商业产品来接触到Sora。虽然现在还没有直接访问的方式,但未来OpenAI可能会开放更多的门径,让我们能够体验到Sora的魅力。
简言之,虽然Sora现在还处于内部测试阶段,未向公众开放API,但OpenAI似乎在考虑将来的某个时刻,让Sora走入更广阔的世界。这一切都还在规划中,具体会怎样,我们还得拭目以待。
2.Sora定价及Sora API的定价
Sora AI是否免费使用?我不这么认为,因为生成视频需要GPU。 OpenAI将对公开发布的Sora模型收取多少费用, 这个笔者猜测不会低于GPT-4的订阅价格。
在回顾了OpenAI发布的有关Sora能力的研究之后,我预测他们将采取基于输出分辨率等因素的分层定价方法。对于需要最多计算资源的全高清质量视频,价格可能从每分钟生成10美元起;更高的价格也不会令人意外。我的感觉是,初始需求将最强烈地来自电影、流媒体节目和游戏开发等娱乐领域,这些领域可以充分利用视频AI助手。但成本将决定除这些行业之外的专业创作者能多广泛地利用Sora。
Sora技术相关
1.Sora最大的技术突破是什么?
到目前为止,在制作文生视频这个领域,高质量长视频一直难以问世。原因多种多样,比如处理帧之间的依赖关系、训练数据的获取、算力资源的分配,还有过拟合问题。
但Sora在这方面取得了重大突破,它能在不牺牲视频质量的前提下,创造出长达一分钟的视频。这在业界可是非常少见的成就,再一次证明了OpenAI在大型模型研发领域的强大实力。
2.Sora原理概述
Sora是扩散模型,它从一段充满静态噪声的视频开始,通过一系列的步骤逐渐去掉这些噪音,慢慢地把视频变得清晰起来。
就像ChatGPT一样,Sora也是基于Transformer架构的。它还借鉴了DALL-E 3的技术,能为视觉内容生成精确且描述性强的字幕。这就是为什么Sora在把用户的文字提示转换成视频时,能如此精确地还原意图,因为它懂得如何让这些文字生动起来。
Sora常见问题及解答
1.GPT商店中有Sora GPT吗?
目前没有任何GPT可以使用Sora AI, OpenAI仅对少数的艺术创作者提供测试使用, 有些人使用“Sora”这个关键词来吸引注意,实际上是不可用的。
2.OpenAI的Sora有替代品吗?
目前没有。Sora在视频生成技术方面远超其他产品, 如Runway、Pika、Stable video。
3.我可以在ChatGPT上使用Sora AI吗?
目前为止,个人用户没有使用Sora的权限
4.Sora对未来影响几何?哪些人会因此失业
毫无疑问,技术进步是一把双刃剑,既带来无限可能,也引发了人们对未来的忧虑,尤其是担心人工智能会夺走他们的生计。
特别是在影视制作领域,比如视频剪辑师和后期制作人员可能首当其冲。Sora这样的视频模型能够自动或半自动生成视频内容,可能会减少对传统视频制作和编辑岗位的需求。从剪辑到特效,再到音效处理,这些环节都可以通过AI技术实现自动化,或至少是半自动化。
然而,Sora的问世也展示了人工智能的巨大潜力。随着2024年这个重要的里程碑的达成,我们看到的更多是希望而不是绝望。它并不一定会导致大规模失业,反而可能推动视频产业向更高端、更创新的方向发展。