Sora的发布将会颠覆哪些行业?

简介: 以ChatGPT闻名海外的OPENAI,最近推出首个文本视频生成模型——Sora,其效果极其流畅程度令人叹为观止!

引言

以ChatGPT闻名海外的OPENAI,最近推出首个文本视频生成模型——Sora,其效果极其流畅程度令人叹为观止!

先来感受一下Sora依据文本生成的视频:

提示词: A stylish woman walks down a Tokyo street filled with warm glowing neon and animated city signage. She wears a black leather jacket, a long red dress, and black boots, and carries a black purse. She wears sunglasses and red lipstick. She walks confidently and casually. The street is damp and reflective, creating a mirror effect of the colorful lights. Many pedestrians walk about. 【一位时尚女性走在充满温暖霓虹灯和动画城市标牌的东京街道上。她穿着黑色皮夹克、红色长裙和黑色靴子,拎着黑色钱包。她戴着太阳镜,涂着红色口红。她走路自信又随意。街道潮湿且反光,在彩色灯光的照射下形成镜面效果。许多行人走来走去。】

hynz.png

Sora根据提示词,生成60s镜头,不仅主要人物动作流畅,切近镜头时还可以看到主角的脸上皮肤细节,后面的场景还可以自如切换。这里,想说一个该视频的不足,视频右方的背景人物感觉很多脸感觉是空白的,看起来有一丢丢诡异;然后,有一个突然切近镜头的转换有一点不太自然。整体的流畅度以及视频的可观赏性还是有的!

提示词:A cat waking up its sleeping owner demanding breakfast. The owner tries to ignore the cat, but the cat tries new tactics and finally the owner pulls out a secret stash of treats from under the pillow to hold the cat off a little longer.【一只猫叫醒熟睡的主人,要求吃早餐。主人试图忽视这只猫,但猫尝试了新的策略,最后主人从枕头下拿出秘密藏匿的零食,让猫再呆一会儿。】
8566c7b3ae54059706b176b109b762dd (3).gif

相比于上一个60s的长镜头,我个人感觉这个8s的镜头做的更好。首先是猫咪的瞳孔,它是符合常识的!这一点很细节!而且,女生的神态变化和猫咪的动作很贴,感觉真的很像一个真实发生的场景!但缺点是,它好像不是特别贴提示词。

提示词:The camera follows behind a white vintage SUV with a black roof rack as it speeds up a steep dirt road surrounded by pine trees on a steep mountain slope, dust kicks up from it’s tires, the sunlight shines on the SUV as it speeds along the dirt road, casting a warm glow over the scene. The dirt road curves gently into the distance, with no other cars or vehicles in sight. The trees on either side of the road are redwoods, with patches of greenery scattered throughout. The car is seen from the rear following the curve with ease, making it seem as if it is on a rugged drive through the rugged terrain. The dirt road itself is surrounded by steep hills and mountains, with a clear blue sky above with wispy clouds.【镜头跟随一辆带有黑色车顶行李架的白色老式SUV,它在陡峭的山坡上一条被松树环绕的陡峭土路上加速行驶,轮胎扬起灰尘,阳光照在SUV上飞驰。土路,给整个场景投射出温暖的光芒。土路缓缓地蜿蜒延伸至远方,看不到其他汽车或车辆。道路两旁都是红杉树,零星散落着一片片绿意。从后面看,这辆车轻松地沿着曲线行驶,看起来就像是在崎岖的地形上行驶。土路周围是陡峭的丘陵和山脉,上面是清澈的蓝天和缕缕云彩。】
freecompress-04750d8596c3305e8507f0cc903bcf45 (1).gif

这个20s的视频首先它很有光影感,而且汽车影子是随着汽车移动的,但是个人感觉车扬起来的土差点意思。

Sora凭什么这么强大呢?

根据OpenAI给出的技术报告,Sora的技术特色:

  1. 将视觉数据转换为Patch
  2. 视频压缩网络
  3. 时空潜在补丁
  4. 转换变换器以生成视频
  5. 变化的持续时间、分辨率、宽高比
  6. 对语言的理解
  7. 图像、视频、文本均可作为提示词
  8. 视频拼接
  9. 图像生成能力
  10. 涌现的模拟能力

就像OpenAI自己在官网说的:我们正在教授人工智能理解和模拟运动中的物理世界,目标是训练模型帮助人们解决需要现实世界交互的问题。

结论

目前,Sora的对物理世界的模拟还在初级阶段,感觉已经很不可思议了!但是,对于很多人说,未来可能是输入小说直接生成对应的视频图像我仍然持保留态度。因为自我观点,Sora只是通过大量输入数据的学习,对文本处理后进行图像模拟,还远远达不到对真实物理世界的智能理解。

最后

虽然目前Sora还在没有对所有用户全部开放,但照OpenAI的开发速度,Sora应该很快就会向所有用户开放!

虽Sora目前还未正式上线,预计后续会覆盖GPT Plus用户。

相关文章
|
6月前
|
人工智能 自然语言处理 API
重磅报告:2023AIGC如何颠覆传统营销模式?
主张“植物内衣更健康”的新锐品牌——有棵树,借助瓴羊ERP的AI智能化能力,将电商渠道与AI技术相结合,以更智能的新营销模式实现降本增效,在众多案例中脱颖而出,顺利入选《2023AIGC赋能营销报告》。
1356 5
|
2月前
|
搜索推荐 数据可视化 虚拟化
五大领域将首先受到Sora带来的颠覆级改变
【2月更文挑战第9天】五大领域将首先受到Sora带来的颠覆级改变
72 4
五大领域将首先受到Sora带来的颠覆级改变
|
3月前
|
搜索推荐
AIGC的到来对元宇宙意味着什么?
【1月更文挑战第6天】AIGC的到来对元宇宙意味着什么?
39 1
AIGC的到来对元宇宙意味着什么?
|
机器学习/深度学习 传感器 人工智能
要论AI应用影响 这五大行业首当其冲
人工智能的应用案例层出不穷:提高能源运营的效率并对其进行可持续优化;提高患者筛查的效率;帮助人类更好地探测火星;帮助更好地维护工业设备,甚至缓解供应链危机等。
要论AI应用影响 这五大行业首当其冲
|
机器学习/深度学习 传感器 数据采集
人工智能影响医疗保健行业的12个方式
如今的医疗保健行业已经十分成熟,可以进行一些重大变革。从慢性病和癌症到放射学和风险评估,医疗保健行业似乎有着无数的机会利用技术在患者护理方面部署更精确、高效和有效的干预措施。
|
人工智能 自动驾驶 物联网
华为首次全面阐述汽车战略:我们不造车,但要创造70%新价值
华为要做自动驾驶汽车的传闻近年来经常出现在媒体和业内人士口中。的确,在 5G 和 AI 快速发展的今天,很难想象这家公司不会投身于颠覆出行方式的浪潮。今天在上海国际车展上,华为轮值 CEO 徐直军首次向我们披露了华为的智能驾驶计划。
143 0
华为首次全面阐述汽车战略:我们不造车,但要创造70%新价值
|
传感器 人工智能 监控
驾培行业刮起“AI”风,规模普及这点需注意
近两年,我国各地驾校陆续开始引入AI、机器人、VR等智能技术和设备,替代传统教练进行智能教学,开启了智能化驾培新模式。
195 0
驾培行业刮起“AI”风,规模普及这点需注意
|
存储 人工智能 运维
超越软件:数字时代不容忽视的大主题——车联网!
阿里波特导读 | 车联网,英文叫做 IoV Internet of Vehicles,它属于物联网 IoT Internet of Things 的一种。
超越软件:数字时代不容忽视的大主题——车联网!