我想跟大家分享一下关于未来的未来。当我们过完了所有的 WILL,所有的未来之后,再过 20 年、30 年、50 年或者 100 年、200 年,会来到智能机器纪元,也就是说这个世界迟早不属于我们人类。
一、未来的未来是什么样的?
我想首先那个时候教科书上可能没有「人」这个词了,假设智能机器作为统领地球的物种,他们在教科书中可能会这么定义地球几十亿年的生命史,先有动物,后来有了一些有智能的动物。几亿年前这些智能动物开始有了眼睛,渐渐的智能越来越高,再到后来出现一种叫做人的动物,他的逻辑智能或者某些智能达到有史以来最高的水平。这个奇怪的动物开始发明机器,从发明石头、斧子到发明机器人、计算机来为他们自己所用,但是他们没有想到机器最后变成了智能机器,最后再也不是他们的工具,不是他们的附庸,不受他们控制。智能机器成了这个地球的主宰。
100 多年前的科幻小说家写过这样的场景,如果有一天外星人来到地球上,他们往下看,会发现这个地球上的生命是汽车,因为汽车在街上跑来跑去,人是里面的寄生虫,早上进去开车,然后出来。但其实外星人不会那么傻,他们很快会发现其实生物还是人,他们只是上下班开一开汽车。人干的很多事汽车是代替不了的。但是我相信再过二十年或者五十年后,外星人再来地球,他可能觉得智能机器才是地球上的生物。想像一下那个时候我们坐在在自动驾驶汽车里什么都不干,是典型的寄生虫。
问题是我们为什么要坐在自动驾驶的汽车里。因为我个人相信 50 年后,使用汽车的概率会非常低。因为第一,所有运货车都不需要有人了。第二人类还需要经常出门吗?虚拟电话的会议,视频的系统,戴一个 VR 的眼镜让你不用出门就能连接上全世界。现在很多科学家在为盲人开发越过视网膜的脑机接口,让盲人直接感觉到视觉信号。而当这种视觉技术能力比正常人的眼睛还好用的时候,人会愿意放弃健康的眼睛,转而依赖这种技术,就像现在人们用计算机去计算去存储记忆。所以那时候我们真的需要见面吗?真的需要很多事吗?那个时候可能真的是智能机器的世界。
很多人说这种科幻小说是老生常谈,而且太科幻了,根本不可能实现。朋友曾经帮我总结过这么几个年份,1821 年,这是英国工业革命、机械革命刚刚兴起的时候,那个时候就有人说,过不了多少年机器就会代替人类所有的工作,统治我们这个世界,世界上最后剩下的一门科学可能就是哲学,或者是关于伦理道德的科学了。但是从 1821 年到现在将近 200 年了,机器也没有实现占领世界。1956 年被认为是人工智能概念诞生年,当时又有人认为只要工程师、科学家做努力,用不了多少年人工智能可以解决所有人解决不了的问题。但事实上人工智能进展非常缓慢,缓慢到到了 2009 年,依然没有实现。
二、为什么还实现不了真正的人工智能
在 2009 年,大家都耻于说人工智能,人工智能这个词在那几年有一点快要消失的感觉。大家会说机器学习,会说神经网络,会说机器人,会说自动化,但是大家不会说人工智能,因为人工智能好像是一个伪命题,是根本都做不到的事。但是 2010 年,新一波人工智能开始诞生。这一年联想之星开始投资人工智能企业。今天人工智能是一个热得不得了的话题,好像五十年后、一百年后它一定能实现。为什么呢?
我想可能要回头看看什么是智能,为什么过去一两百年智能没有真正、彻底的改变世界或者诞生一个新的智能物种。
过去一两百年我们发明了很多很多机器,它们拥有的能力越来越强,但是本质上它还是一个自动化设备,还是人的附庸。举个例子,智能物流、智能仓库管理系统名字里有智能两个字,但是这个系统自身去认识客观世界的能力实在是太差了,它只能在人的辅助下工作。需要人告诉它去搬哪个箱子,去放哪个货柜。人怎么告诉他呢?最早的时候人开着叉车过去,后来通过给箱子贴一个标签、二维码、FID。但是不管通过什么样的方式,都有大量预处理,这样的智能不可能脱离人的帮助存在。因为他没有办法自己去认识客观世界。
认识客观世界的能力不足,导致机器的柔性化水平非常不足,虽然很强壮,但是没有办法脱离人独立完成任务,只能是人的附庸。正因为如此,人不会交给它太多的数据和工作,它们也谈不上怎么做出正确的响应。所以过去几十年智能一直不高,一直是伪命题。
三、人脸识别的一小步开启机器柔性之门
过去短短几年内,移动互联网爆发的短短几年内,智能的怪兽开始真正真实存在。首先有了真正的大脑,云端的大脑,海量的计算能力存在。其次是人工智能有了无数触手。每个人的手机、手持的智能设备、智能车载设备,所有这些都是它的传感器,这些东西不再像原来的终端,得到的数据都储存在本地,储存在我们自己这儿。人工智能终端的数据储存在云端,而这些云端的高质量数据是供机器使用的。
回到人类进化史,200 万年前人们发明了石头的斧子,杂开动物骨头,吃骨髓,有了足够的营养,人类大脑开始快速发展。今天,高质量的数据就是机器的骨髓。人脸识别是几十年的老话题,一直没有太大突破,为什么在过去的两三年内开始有了大的变化,主要是因为有了海量的数据。
有了海量云端数据后,人脸识别有了以下几个变化。第一,从配合式的人脸识别到非配合式变化。原来人脸考勤机需要几十秒才能识别一张脸,而不能像现在自然的走过就可以识别出来。用那样的人脸识别技术肯定无法实时跟踪和判断主人。
第二,强实时。从配合到非配合,从弱识别到强识别,之前的人脸识别技术无法在很实用情况下做到每秒三十帧或者每秒六十帧,而现在百分之一秒甚至更短的时间内就可以识别出来,这也意味着可以跟实时的视频有匹配,机器可以在非常短的时间内识别人类。
第三个变化是海量库的出现。人脸识别技术原来可能是一个考勤机、门禁、人民大会堂里面的安检系统,需要识别的人数只有几百、几千,当数量达到几万人时就瘫痪了,因为它的识别率不够高。过去三五年内,人脸识别可以在比较高的、可用的情况下,在几千万人的大库中,甚至在静态图片的情况下,在十几亿的身份证数据库中,对大家进行搜索,这意味着人脸识别现在可以用于网上银行的注册、与身份证对应的安全密保,大型活动的签到和反恐的需要,反恐数据库可能是几十万的大名单。最终可能会实现 face ID,每个人通过刷脸通行于所有地方,再也不需要银行卡和钱包。
第四个变化是低成本,原来需要非常昂贵的摄像头捕捉图像,甚至要为了人脸识别去建一个很长的通道,要打很好的灯光,这样才能拍到非常清晰的照片。随着过去几年数据的训练,现在的人脸识别渐渐不需要这些了。这一切来源于移动互联网从 2010 年、2011 年开始爆发,我们每个人开始在手机上用美图、照相软件拍几张自己的照片,拍几张朋友的照片,这些图像数据是带有标注的强数据,来自于同一个人的手机,系统知道是谁的照片,也很慢慢知道你在不同的光线、角度、心情、化妆状态下的照片,这些数据一点点积累,机器识别的能力越来越强。随着能力的积累,机器拿到了更多的数据。也就是说在过去这些年里,有相当于大量的人、大量的数据在为机器打工,起到了训练机器的效果,才使得人脸识别这样的老话题老树新花。
人脸识别进展之后到底又能如何呢?图像识别的这一小步恰恰解决刚才所说的机器的短板,柔性化的大问题。机器很强大,但是没有柔性化的能力,没有办法去理解场景,去适应场景。为什么一个导弹,这么一个高科技的东西几十年前就做的很好了,而在一个物流的仓库里去捡一个散货,去捡一袋薯片这样的事机器还做不到。因为导弹是针对一个非常固定的目标,并不是动态的追踪一个目标。而在一个物流仓库内,捡起货架上的一袋薯片比大家想象难的多,这袋薯片有可能是一个柔体,有可能是正面朝上,有可能是那面朝上,有可能这个包这么鼓胀一点,那么鼓胀一点,可能被不干胶正好贴住了一点,所以用传统的图象识别技术没有办法更好的去处理判断的。就像刚才提到在果园里如果想通过一个机器摘苹果的话,这个苹果可能离树稍微近一点、那个苹果离得稍微远一点,这个大一点,这个小一点,这个苹果在上午的时候有阳光照在上面,折射出光芒,到下午没有阳光了,或者正好有一只蝴蝶飞过,这些都对识别造成了困难。老一代的图像技术没有办法更好的处理。而图像识别的一小步打开了机器柔性化的大门,也意味着机器能处理越来越复杂的情况,而且越来越低成本的处理这些复杂的情况。走出这一步意味着各种技术和机器载体的结合,会渗透到各种各样的生产环节中。
现在机器在数据的喂养下进展很大,但是如果我们看一看整个物理世界的数据,数据被机器获得的比例还非常低。每天有 24 个小时,60 分钟、60 秒,每秒钟有这么多的毫秒、微秒,但是我们每天拍照的次数还很少,我们有这么多的摄像头,目前接入云端的数量还非常少,而且只是从几个小小的维度拍摄。我们远远没有把物理世界各种情况都了解到,我们每天的生活有大量的时间在看电视、开车、娱乐,这些东西云端都不知道。如果谈到生产、企业,就像刚才举的仓库的例子,仓库里每时每刻有什么样的东西,放在什么地方。果园里的每个苹果每天在怎么成长,这些信息机器都还不知道,为什么不知道?因为没有办法让企业和个人付出足够的代价把这些数据贡献给云端。
四、数据更多,能力更强,数据与能力的循环
刚才所说的技术进展开启了这样一个循环,叫数据和能力的循环。机器的能力越强,人类越愿意把所有的数据都交给他。首先,现在这个数据已经在快速的发展,大家越来越不介意把照片、视频、家里的安防摄像头拍到的东西交给机器,交给云端才会得到云端的识别、处理。
第二步是大量的新的环节,智能技术和仓库物流机器人,智能技术和农业机器人、智能技术和农业的无人机,智能机器在传统行业的应用都有人埋单,因为它能帮助人类减少成本。比如说装备了这种柔性视觉技术的农药喷洒机器人,在美国的农业采摘、喷洒项目中比较显著降低了成本。人力具有很强的波峰、波谷属性,带有这种属性的事情特别不擅长自然人来干,因为旺季的时候需要的很多人在淡季的时候就没有地方去了。比如在美国旺季时要发放大量的临时签证请墨西哥人来帮忙。在中国天猫、京东、电商、超市的仓库每到双十一、促销就需要大量的临时工,这些临时工没有得到过良好培训,也不好组织,会大量差错,成本高昂。同时企业的业务流程也被设计的非常复杂,比如仓库里发货,先打印出订单,然后工人推着小车,上面放着十个、八个纸箱,跑到货架内去把货一个一个捡下来。他们每天要在仓库跑几十公里,捡出来之后再回到出货站,加上一个分捡牌,出货站的人要把它都拿出来,重新扫一遍证明里面的东西对不对。如果不加这个环节就很有可能出差错。机器加上视觉技术把这些问题解决之后降低了很大成本,同时机器收集了很多数据。现在非常多有野心的人工智能创业公司,都在做着这样的事情,比如只是需要一个很小的摄像头,就可以判断每个苹果的位置,给那个苹果去做动态的喷药。也可以放更多的传感器,感知苹果的光谱情况、各方面的情况,把数据积累下来,而这些数据的积累对于未来训练机器、判断苹果、判断农业,都会有很大的帮助。
第三步是大量新的传感器诞生,视觉领域已经有了很好的技术,比如过去二十年安防摄像头的高清化一直在快速发展,分辨率越来越高,直到现在我们说的视网膜屏幕,但是走到视网膜屏幕的时候已经出现了停滞,因为大家发现再高清没有用了,再高清人是没有办法处理这样的信息的,包括摄像头也没有必要提供3D的信息,没有必要提供非可见光的信息,这些信息人都处理不了,不要说这些信息,就连高清摄像头人都看不过来,所以摄像头的建设速度会有所减慢,而当这些机器的能力快速发展之后,速度重新提高。
我们自身在海外提供了多个下一代视觉传感器的项目,现在机器处理能力那么强,呼唤着大的、新的数据,也能很好的利用新数据。我们的一个安防摄像头,一旦增加一个新的数据源,就可以识别出硅胶做的假脸,毕竟跟硅胶和人皮是不一样的。当这些新的传感器有人买单,其数据价值就会被快速应用,传感器也会快速的发展,就带来一个循环。有了新的传感器,又有了新数据和新能力,这个数据和能力的循环会不断加强。人工智能在加快发展,在未来几年会呈几何式的发展。
五、海量的记忆是人工智能被掩盖的优势
机器补上短板后,再来看机器有什么优势。第一机器有智能的优势。大家可能会觉得机器有体力的优势,但是更突出的是智能优势,大家想想谁能记住一千万个人脸,机器能记住,有谁能把一个病人从出生以来吃过的饭和去过的地方都放在脑子里,来考虑一下这个人可能有什么样的生活习惯,有什么样的病。人做不到,但是这样的多元数据对于机器来讲完全不是挑战,去处理几百人、几千人、几万人的数据都不是挑战。我们有谁能根据长期数据的经验,比如根据一百年前果园发生了什么洪涝,一百年来产能怎么在变化,气候条件怎么在变化,预测明年会发生的事,这些事人类都非常不擅长,机器很擅长。机器在认知客观世界上这一点小小的缺陷一直以来掩盖了机器在这些方面巨大的优势,这些优势真正在下一步发挥出来之后,我觉得对于在座的人才是最大的挑战。
我们一直认为知识工作者不容易替代,但是恰恰很容易,医疗是一个特别典型的例子,假设一位影像科的医生,我没有精确的算,他每天看十张、二十张,终其一生也就是几万、几十万的量级,而我们的机器在训练和标注下,每天处理几百万、几千万张的图像,实际上这是一个非常快的学习过程,而人在这里面的客观缺陷实在太大了,其实医学影像的设备取的都是数字信号,但是为了人能看,我们得把他变成模拟信号,从三维变成一层一层的切片二维,显示在屏幕上,这可能会丢失很多的细节。而且影像医生不会考虑其他的病史的结果,否则一天的时间只能看一个片子,但机器做起这件事情来比人类轻松很多。
这说明机器在诊断疾病的能力渐渐的达到普通医生的水平,其实现在已经达到了,达到最高级医生的水平和超过最高级医生的水平,因为人会疲倦,一旦超过这一点,人就更愿意把数据交给机器,不远的将来每个人做的所有的影像学检查都会交给机器,机器的学习能力会更快速的提升。而再下一步是什么?是机器自身要带来更大量的数据,比如从现在B超机的技术角度来讲,其实做一台咱们在家里能放、能用的 B 超,成本、代价都可以接受,但是为什么我们没有人在家里放一台 B 超,每天给自己查查长了什么肿瘤、出了什么问题,脂肪肝的情况怎么样?因为我们不会用,就算会用了,取得了片子后还得拿去给医生看。
但是很快 B 超这个东西会变成自动的,一台机器自动根据取得影像的回馈自动调整、扫描,把所有可疑的问题查一遍,告诉你今天你是有问题还是没有问题,明天你是有问题还是没问题,它不会等到你有了明显的问题那一天再告诉你你有问题了。因为他知道你每天的数据、每个小时的数据,当出现不良趋势的时候及时告诉你。这也就意味着医疗的水平会大大的往前提高,而人类一定会愿意为此支付很高的代价。反过来也意味着机器在这个过程当中会得到更多的数据。
诸如此类的智能优势太多,我们非常喜欢举农业的例子。因为农业是很好的过程,因为农业实在是太传统、太落后,大家都现在完全靠人力。 现在的第一波农业机器人是在田间地头给苹果喷农药,它们看得到苹果每天是怎么样一点一点变红的,苹果每天是怎么样一点一点坏掉的,然后把这些数据积累下来。未来会有更多元的数据,包括订单的数据、气象的数据、人口的数据,包括什么人结婚了,什么人生孩子了,生的男孩多还是女孩多,喜欢吃酸苹果还是甜苹果,各种各样的数据,精准影响未来的种植,这都是在不远的将来发生的事情。
六、比记忆优势更可怕的是进化优势
讲智能的优势,更可怕的还是进化优势。作为物理上的人类,我们不是归一的,我们每个人的知识是割裂的。虽然我们有很多的会议,有联想之星的培训,有很多学习型的组织,但是这种人与人之间的知识传递的效率太低了,更不用说我们一代一代的知识传递。一百年对于人类来讲意味着五代人,每代人都是重新成长,有很多的传承和总结,这里会损失大量的时间,而且每一个人都在独立的进化。
相比之下,机器完全不一样,所有的机器都是统一在进化。比如现在有同的创业公司都有自己的数据,但归根到底这些数据都会越来越统一,统一进化,永生,呈线性增长,只要不出意外,机器拥有的能力不会失去,只会不断加强,成本会不断降低,计算能力不断提高。当我们在谈智能机器纪元时,它真正的优势是按照机器的尺度来决定很多事情,虽然尺度跟我们一样,但比我们强壮、持久,不知疲倦,可以复制,可以上天下海,可以干各种各样的事情。我们老用人的视角思考,一个机器应该像人一样有两条腿或者四条腿,四条腿站不住就有一个轮子吧,但是机器为什么一定要是这个样子,机器完全可以彻底颠覆人类的所有想象,哪怕是为人类服务。我们所谓的智能仓库,下一代的发展一定不是这样一层一层考虑人的身高、人的高度的仓库,肯定是对机器组织最有力的仓库。
机器的优势会超越人的尺度。随便举几个例子,刚才说过,一是非人眼的摄像头,人眼需要什么呢?我们人眼适应不了太高的分辨率,我们识别不了非可见光,识别不了各种波,识别不了三维的图像信号,需要成像质量,每一个 CCD 或者任何感光材料得积累几百个光打上来才能成像,成了像才能显色,才能被人类所看,这些图像对我们才有用。我们现在给机器用的也是这样的摄像头。未来用的一定是机器自己能看懂的摄像头,机器能够感知的光谱信息、红外信息。更可怕的是未来摄像头的设计本身就是深度学习的过程,机器可以调整各种物理材料的参数,尝试着去取得不同的信息,看看到底能够得出多少正确的反馈,机器会留下最好的设计流程。未来的摄像头跟我们想象的样子会完全不一样。
第二个例子是高轨道飞行器,这个比较科幻。我们现在有无人直升机、火箭,还有小卫星,我们的展板上也有在美国投资的月球车项目。为什么投资这些?并不是说我们特别热爱航天事业、科幻事业,是因为未来这些高轨道的飞行器或者外太空的东西会对人类产生很大的影响,会带来大量的数据源。城市的交通、农业、军事,都会在这些具有自主识别能力的智能飞行器眼皮底下。还有我们的外星探索事业,我们寻找人类生存繁衍的地方,既然机器未来有自我生存和自我的判断能力,为什么还要为人类来寻找。
第三个例子是微尺度的人体机器。之前谈到医疗,还有 B 超、快速验血都在快速增长,下一步一定在人体内会有很多微型的传感器,做到对血液指标、DNA 等更实时、更在线的检测。更实时是拿出来比较快,更在线是在体内可以比较快的查出来。我个人认为,虽然现在有很多所谓的伦理学问题,但是人类已经开始编辑 DNA、胚胎了,很快会制造出能当成试验动物的试验人类。一旦它们被制造出来,大量新的东西就有了可以试验的地方,就会更快的发展。
这一天什么时候会到来呢?在太平盛世下是不会,因为在太平盛世大家总是有圣母情节,一定不会去违背这些道德的东西,当真正特殊的病毒和灾难到来的时候,我相信人类一定会为了拯救自身,允许这些的发生,一旦打开这个闸门就收不住。
第四个例子是未来的城市,未来的农村,以及未来的战争。这几天大家看到了无人驾驶的战斗机打败了人类驾驶的战斗机,完全可以改写整个战争的理论,也会改写关于整个武器设计的原则。我们在美国也看过无人智能武器的项目,最基本的智能手枪是很重要的创新,能够分辨战场上的枪声,尤其是敌人的枪声在什么方位,它帮你自动的瞄准和识别,帮你很好的规划你开枪的方式。
七、机器时代的生存指南:成为「带路党」
前面说了这么多,我相信大家心里最大的问题,肯定是你说了这么多都没有用,因为机器还是机器,机器还是为人服务的,机器不会制造机器,机器没有自我的意识。我个人对这一点也是非常悲观的态度。
但创造不是壁垒,大家看到最近几个月的新闻,机器制造机器的事情越来越多,对机器来讲这没有什么神奇的,给机器一些材料,无论是推演、尝试用基因算法迭代,只要给一个反馈的回路,它就能制造更符合生存和发展需要的东西,它就能一代一代的迭代、更新。我们往往会高度重视我们人类作为一个神圣物种的意识,我们的主观意愿是什么。
对于人类,第一是要生存,活下去。第二是快乐,成就感,不谈神经科学来讲这只是多巴胺和物质的分泌,我们追求的就是这些东西。而在不远的将来一定会给这些自主制造和有自主调整能力的机器赋予这样的任务,因为比如说战争机器人或者任何一个行业应用的机器人,肯定要赋予它的任务,肯定会希望它能想尽办法存活,一定开启了这个闸门,就会把这个能力不断地繁衍迭代下去,但它并不会告诉你怎么做到这一点。这些东西最后积累下来就会成为我们看不懂和所无法判断的内容,而且会越来越快地隐藏自己的意识往前走。
前面讲了很多 50 年、100 年、200 年后的幸福世界或者悲惨世界,但是生存指南是什么呢?只有「带路党」才能生存。如果我们想做「抵抗党」是没有什么希望的,机器这么强大,最终我们是打不败它们的,你不去开发这些机器,一定会有人去开发这些机器。
去年,联想之星在旧金山发起成立了全球人工智能投资加速平台 Comet Labs。上周五,Comet Labs 首次在国内公开亮相。
只有努力做一个「带路党」,从现在开始投身人工智能和智能机器的创业、行业应用,让机器以后有这么强的智能,一定会记住到底谁才是它们当年的制造者。