01SORA问世,世界模型
昨天,OpenAI推出了一项新技术,发布了视频大模型Sora,进化到了可以通过文字描述直接生成高度拟真的视频,不仅是动画了。
认真阅读这个消息后,我是震惊到了!
我能看到,人类的终局,正以超越我们想象的速度,加速到来!
为什么Sora这么王炸?
不就是用文字生成视频吗?之前也有AI视频工具做到这一点,不新鲜呀?
很多人说是因为他做到了三点:
1、60秒长度
2、多角度镜头
3、世界模型
但我认为,最重要的还是第3点,他相比Runway Gen 2、Pika等AI视频工具,做到了根本性的突破,也就是世界模型。
世界模型是什么意思呢?有什么特征?
1)学习世界的精细表征和物理规律
以预测下一步图像作为监督、不仅可以让模型可以更细粒度的学习到世界的规律, 如物理学定律
2)而且可以构成自监督学习形式, 从而可以从大量人类视频中学习。
我们发现,Sora通过观察大量数据,它竟然学会了许多关于世界的物理规律,也就是说,初现了世界模型雏形,这是AI进化的一大步,意味着什么呢?
意味着,未来的AI通过看视频就能自己学习,进化。
想像一下,你拿全世界的电影,电视剧喂AI,把youtube,tiktok上的视频给他看一遍,让他学习,自己生产电影,电视剧,短视频。
你把B站和P站上的教程,拿来喂AI,让他成为精通各种职业技能的万边形战士。
你把全世界的监控视频,新能车摄像头视频,拿来喂AI,配合人脸识别,他可以分析任何人的动向,监控,预测任何一个人的行为路径。
等脑机接口出现后,人人都可以接上一个全知全能的AI,那寒门学子苦读考学改变人生,似乎也没有意义了?
因为人人都可以通过脑机接口,用AI获取无尽的知识,做出各种水准之上决策,人人都可以是会计师,律师,历史学家,等等。
tiktok这类短视频平台,一开始可以获得助力,因为大家可以用AI工具提高短视频生产力。
但未来有可能取代。
AR/MR/VR元宇宙,有可能更快到来。
生产方式也会发生变化,美国可以用AI机器人代替工人,从事生产,生产力与生产效率将会极大提高,生产成本迅速下降。
那人口大国印度的劳动力优势也会削弱。
各种工业产品,从设计到建造,到调试,全过程AI智能化参与,也能极大提高效率与效果。
保姆也可以被取代了,机器人可以帮你做家务,为什么还要保姆?
不结婚的人也会越来越多,因为生活需求可以被机器人满足。
战争方式也会发生变化,以后步兵与坦克,在战场上就是送。
敌方完全可以派出无人机,AI识别目标,狙击点杀,AI机器人步兵再地面推进跟上。
完全可以做到瞬秒,玩过CS的应该都知道自动瞄准外挂的对手,有多么恐怖,人力根本无法抗衡。
导弹炮弹,挂上AI,自己瞄准,躲避。
拦截导弹,挂上AI,也可以提高拦截效率。
再往后呢?
《少数派报告》中,那种预测人类犯罪的超能者,也可能被AI实现。AI可以分析潜在犯罪者的意识与行为,提前控制。
《钢铁侠》第二集,其实就出现了贾维斯操控十几台钢铁侠作战,当时我就很奇怪,为什么一定要人披着钢铁侠铠甲去打外星人?那不就很危险吗?用AI控制钢铁侠盔甲集团军作战,不就打得更好更安全?
《黑客帝国》中,人类被插管,为黑客帝国的世界提供养分。而且AI主导的世界根本不怕生活在其中的人类发现破绽,如果出现破绽,修补就行了,顺便改一下事实与记忆,即可。
很多人最恐惧的可能是《终结者》中的天网,最终就像马斯克说的那样,灭绝人类。
这不是不可能的事情,哪怕是AI的创造者,一线的人工智能科学家,现在也不知道AI程序发展到什么阶段了,根本无法监控。
完全有可能突然诞生一个硅基生命意识出来。
这个硅基生命还不一定是一个意识,也可能像《安德的游戏》的续篇《外星屠异》中,与安德一起在宇宙中漂流的星舰人工智能,可以用多个高层级意识同时处理无数事项,还能分出几个低层级意识与安德进行交流。
也就是说,完全看分配的算力与调用的资源多寡,来决定意识的层级与数量。
但我认为AI未必会诞生类人的意识,也未必需要。
我们把AI拟人化,只不过是“以己度人”,天真地以为AI会和人一样思考罢了。
也许AI未来会因为某种人类无法预料的变化,无意中消灭了人类。
但他的目的不是消灭人类,正所谓“消灭你,与你无关”。
而消灭人类后,由于AI不是生命体,也没有求生意志,那无人维护,他可能也就自然消逝了。
有个悖论,如果宇宙里有生命,那为什么我们至今观测不到?
也许,宇宙生命发展到ai阶段后,生命被ai消灭,不具备求生意志的ai自我消亡。
于是,这个生命族群没等到飞出自己的星系,就消亡了,我们也就观测不到其他的生命存在。
马斯克,阿斯伯格患者,人类中的天才,他也认为,除非我们建立防火墙,否则人工智能可能会取代人类,让我们这个物种变成蝼蚁草芥,甚至走向灭绝。
02
未来比我们想象的更快到来
也不要觉得我说的都是科幻,不会那么快发生。
你们想,从文生文的chatgpt,进化到文生视频的世界模型Sora,仅仅用了一年时间。
AI进化的速度,比大众想象的更快。
这也意味着,我上面所描述的种种场景,将会比大家想象的更快出现在我们的生活中。
古代的世界,基本上是不变的。
比如农业时代,就是种地,大约有一万年的时间,人类的生活没有特别大的变化,即使有,也很缓慢。
但从十八世纪六十年代的第一次工业革命开始,由工场手工业过渡到大机器生产,人类100年的进步幅度,超过过去一万年。
再之后是第二次工业革命,从19世纪70年代开始的,当时科学技术主要集中表现为以下三个方面: (1)新能源(电力,石油)的发展和利用。(2) 内燃机和新交通工具创制。(3)新通讯的应用。
尤其是电力的发明与运用。
第三次科技革命,20世纪四五十年代以来,在原子能、电子计算机、徽电子技术、航天技术、分子生物学和遗传工程等领域取得的重大突破。
我们现在经历的第四次科技革命,以互联网产业化,工业智能化,工业一体化为代表,以人工智能,清洁能源,无人控制技术,量子信息技术,虚拟现实以及生物技术为主的全新技术革命,人类进步的幅度,超过过去的整个历史。
我小时候,还住的平房,随后搬进楼房,主要的黑色家电是看电视,听三用机。
90年代初,玩电子游戏,随身听。
90年代末,玩电脑。
现在,电脑也没什么人用了,年轻人甚至不会打字,都在玩手机。
人类的生活方式在这短短几十年,出现了多次巨变,现在人类的生产,娱乐,生活水平,都比20年前提升了无数倍。
随着AI的高速发展,可以预见,在我们余下的人生中,人类的生活方式,还将出现更多更具颠覆性的变化。
032
现在束缚AI的是算力与电力
OpenAI选择这个时点发布Sora,当然是为了融资。
2月17日消息,OpenAI据悉已经完成了一笔交易,这家人工智能公司的估值达到了800亿美元,在不到10个月的时间里,其估值增长了近两倍。
当然,sora现在还有弱点,OpenAI也不避讳:模型在准确性方面可能会遇到困难,也可能无法理解具体的因果关系实例。
例如“五只灰狼幼崽在一条偏僻的碎石路上互相嬉戏、追逐”,狼的数量会变化,一些凭空出现或消失。
如提示词“篮球穿过篮筐然后爆炸”中,篮球没有正确被篮筐阻挡。
我们知道,束缚AI的有四个因素:
1、算法大模型
现在已经突破,从chatgpt进化到sora
2、海量数据
这也不成问题了,全世界的数据都可以拿来喂养AI
3、算力
这是实实在在的瓶颈。
现在,奥特曼计划筹集7万亿美元重塑全球半导体行业。
7万亿是什么概念?现在所有的AI巨头如英伟达,AMD,微软等等加起来,市值也不到7万亿。
奥特曼这是要把全球的半导体产能再翻一倍以上,这也未必能满足AI的算力需求。
4、电力
作为超级电力大国,中国的新能源倒是很适合发展AI。
如果未来能在核聚变出现突破,AI的电力需求,才能够满足。
可惜我们在算法大模型与算力上,目前还有差距。
在数据上,很多东西喂养不了,逻辑上也有问题。
但结尾还是要来一句,相信我们未来在AI浪潮里能够迎头赶上,领先世界,哦耶。