AI对中国工程院院士、中科曙光董事长李国杰而言,并不是新事物。
作为中国最早一批计算机科学领域的专家学者,他在美国求学时便已亲身经历过上一波人工智能浪潮,其后又在科研任教和工业研发中,在并行处理、计算机体系结构、人工智能、组合优化等领域,颇多建树。当然,AI也是中科曙光的最新战略重点所在。
在近日接受量子位等媒体的采访时,李国杰院士谈到了他对当前AI发展的看法,特别是中国在AI竞争中存在的机会和挑战,他也提醒AI创业公司,要摆脱众多公司之前“不是被收购就是死亡”的命运,注重技术和商业的结合。
量子位《大咖来信》栏目在不改变原意的基础上,以第一人称的方式,把我们与李国杰院士的对话进行了整理。
△ 李国杰院士
AlphaGo带动人工智能火热之后,不少人问我:现在的人工智能进入了什么阶段,会不会再进入50年代和80年代的历史周期?
我想每一个新技术的发展,都有一个类似四季春夏秋冬的过程,云计算是这样、物联网是这样,可能智慧城市也会是这样。
人工智能有点不同,因为人工智能已经热过好几回了,好像没有分明的四季,这其中有它的特殊性。
但我个人判断而言,人工智能现在的“季节”是秋天,即到了收获的季节,这背后有几个方面的原因。
一方面,深度学习的算法、规则都相对成熟了,而且不是大家熟知的AlphaGo才开始的。
像我的朋友李凯和李飞飞发起ImageNet的时候,已经是8年前的事,很难想象一开始申请经费都得不到批准。
再后来Hinton用深度学习的方法,一下子把在ImageNet上的识别率提高到了80%多,让大家看到了方向。
不过这也是有时代背景的。为什么以前的机器没有这个能力?核心是数据没有这么多,联网设备也没有这么多,所以现在条件保证了,人工智能也就见效了。
这就好比你在路上走,你的路径、车灯数据都有了,所以现在沿着过去的积累,一切狂飙突进都变得水到渠成了。而且新的器件、超导、量子计算等新规则都在不断涌现,可能会进一步加强加快这个过程。
所以我认为AI进入到一个新时代,今后一二十年都应该会有更多进一步的发展。
不过,这也不意味着此次人工智能在任何领域都能一帆风顺。
我们回顾过去,AI发展从来不会水银泻地般突破各个领域。
比如无人车,2004年美国DARPA开始搞无人车测试,结果所有的车都翻车了,200英里的比赛没有车跑过10英里就翻了,才让参赛者意识到人工自己编写系统是不行的,于是转而走人工神经网络来做。
但其后神经网络也不是就完全没有问题,也出过笑话。比如微软机器人网上聊天,被年轻人胡乱教一气,最后机器就认为911是假的,希特勒是好的。本来这些和机器聊天的年轻人是恶作剧,但机器辨别不了,你给它正确的东西它就学习正确的,你给它错误的知识它也学习,最核心的是没有“常识”。
所以现在美国AI计划里,特别强调推理、解释等方面的尝试,这可能是一条光明的路,但肯定还有很多的困难需要进一步克服。
靠算法弯道超车?
当然,每每谈到当前人工智能,话题肯定也离不开大国竞争,中美对比。
之前也谈过,人工智能产业要像一棵大树,必须扎根在系统结构和软件理论的深土中,发展人工智能不能停留在算法层面,要关注从算法、软件、人机截面到系统结构和芯片这一完整的产业链和生态系统。
但现在国内来看,更多还关注在算法层面,这可能不足以支撑我们走更远。
重视算法也无可厚非,因为算法的作用比较容易显现。
现在越来越多的科研机构、公司都以算法为核心,原因是算法研究的门槛比较低、论文发表的难度也低,容易出成果,这是人之常情、可以理解。
但问题也随之而来。一个公司光靠算法,或者行业都围着算法你争我赶,很难有竞争力。今天你看着算法机会多,容易赚钱,但也很容易被别人赶超。
而且真正标新立异的颠覆性算法现在还比较少,更多还是一些改进性的算法,所以把大部分的精力集中在算法上,是不全面的。
这也是中国的问题,我们现在总说我们和国外的差距如何如何,每讲到核心技术,总是受制于人,但对于基础技术方面又没有积累和投入的意识,这样的亏吃得还不够多吗?
比如芯片,国外的领先优势就在两代以上,我们一直没能缩短。我们现在用的20纳米不太成熟,以后别人都是28纳米、14纳米,甚至7纳米,我们都没有办法跟上,更别说赶超了。
还有很多基础软件,最核心的基础的东西都是别人的,我们只在上面做一些小修改,整个生态都建立在别人的基础上,原来是X86,后来就更多。
这些基础问题不解决,就容易地动山摇,整个国家的竞争实力就要受制于人。
全世界200强的公司中,美国有14家芯片公司,14家软件公司,中国呢?一家都没有,所以这个差距不得不重视,越是基础的东西,对我们的未来越重要,这是衡量一个国家人工智能强不强的基本判断之一。
另一个基本判断是计算。人工智能是计算出来了,没有计算就没有智能,计算力也是一个非常基础的东西。
但如果按照服务器拥有量来衡量国家计算力,我们现在和国外的差距也不小。国外每年花在服务器上的钱,可能是整个终端投入的60%-70%,但中国只有20%-30%,在这些基础设施上,我们的重视程度也还不够。
值得注意的是,重视基础就不能“喜新厌旧”。
中国人很重“名”,“名不正则言不顺”,信息领域不断创造新名词,一旦新名词、新学科上升为行业意志,原来的基础学科就被边缘化。
去年国家自然科学基金计算机学科的4863项申请项目中,计算机科学的基础理论只有16项,计算机体系结构22项,程序设计语言及支撑环境13项,高速数据传输技术2项。
但是,计算机图像与视频处理有439项,模式识别理论及应用357项,人工智能应用258项,这是巨大的反差。
基础!基础!基础!没有基础的话,将来还是难以扳回局面。
中国的AI优势
中国的优势在于用户多,网民多,这就让我们在数据方面有优势。
不说BAT了,就说滴滴这样一家年轻的公司,他们切入的这个领域,以后的数据量可能不比阿里、腾讯少,因为每天都有那么多的车在给它产生数据。
所以在中国这个大市场里,人工智能应用就有得天独厚的条件,中国搞算法的多、人才多,有后备力量,在相关方面就比国外超前。
比如云识别、人脸识别等模式和算法领域,都是世界一流。在目前最核心的图像和语音识别领域,应用也越来越多。
但人工智能不限于这些,还有很多和智能制造、无人驾驶、医疗健康等相关的领域,这不是算法好和市场大就能快速起来的。
还需要相关垂直领域的专家配合,比如AI+医疗,你就需要借助医疗、智能医疗方面的专家。
未来我们想在人工智能发展中做大做强,不仅需要巩固算法和市场这样的优势领域,还需要在那些会结合但又不强的地方,加大力量投入。
产学研结合 理论创新
我们有数据和市场的优势,在算法方面也不弱,有机会能在下一波AI技术跃迁中占得先机,甚至理论创新上领先。
我个人看来,下一波AI技术跃迁,核心突破肯定还是在于算法和理论。
人工智能这几年取得了很大突破,但还是没能解决一些在人看来很基础的问题。
比如你教小孩认识事物,可能不出10、20张图片就能让他知道这是马、这是车,但对于机器还做不到,可能机器需要的是上百万张图片。
这就是典型的小数据学习,为什么人可以,机器不可以?但如果考虑到人类一代代经过了几百万年的进化,才慢慢形成人脑的连接、基因,并有了固定的人脑结构,这好像也能解释为什么会有从大数据到小数据的过程。
所以现在的关键是,把AI提升到理论上能解释的地步,比如还有很多很多的基本的东西没能搞明白,深度学习效果这么好,但决策过程可能我们还无法解释,黑箱还没变成白箱,这需要一些基本理论的研究。
这些基本理论的研究,也可能会借由其他领域取得突破,比如量子力学。之前我演讲举例说过,以色列科学家提出“信息瓶颈”理论,有一套完整的科学,他们发现这个过程和深度学习极为相似,这甚至是“深度学习”发明时预料不到的。
但我们也应该看到,现在很多重大理论上的突破,中国并不在其中。
理论创新难以规划产生
之所以不能太乐观,一方面是投入确实不算多,另一方面还是基础研究的特性,它不是能规划出来的,是冒出来的,所以对国家来说,环境培育更重要。
我们国家刚颁布了人工智能战略规划,跟美国一比较,我们做得很细。但参与拟定规划的潘云鹤院士也跟我说,基础研究方面,可能会“有心栽花花不开”,可能你列了5个,但5个都没有冒大成果来。
所以政策层面,基础研究不能太受指南之类的影响,除了大方向上给予指导,可能也要鼓励一些自己选方向的发展,主要看这个人和团队。
归结起来,我们发展AI,应该是生态式的,而不是方向式的,有魄力支持一些人去做现在可能还想不到的事情。
也有人问,在AI发展里,国家和企业应该怎么分工,才能更好促进整个产业发展?
我想我们国家一方面有钱、有积极性,这是好事,但也要分清楚政府和市场的定位。
我认为政府主要做的事,应该是人工智能突飞猛进之后,如何树立一个公平经营、竞争的环境,有政策、有导向防止两极分化之类的事情。政府主要还是给一个好的环境、生态。
至于具体的研究方向、投多少钱,可能交给企业去做更合适。
地方政府现在扶持或落地一些AI项目也是这样,有钱、有政策导向是好事,但具体方向、重点领域如何选择等,交给企业更合适,因为AI里面还有很多未知的东西。
另外,现在我最担心的问题,是公有开放的机器训练平台的缺乏。
BAT都有自己的大数据平台,但让智能软件和服务行业每个中小型创业公司都建立自己的机器学习训练平台,既无必要也不可能。各地双创园区要建立共享的大数据分析平台和机器学习训练平台,这是新时代的重要基础设施,另外,也不能让中小企业被迫都使用BAT的平台,让这些企业未来受限于垄断。
最后,涉及政府层面的,还有政府数据怎么公开,让大家都用起来、共享起来,需要动一些脑筋,据说青岛在山东各地区中是做得比较好的,政府的数据共享、打通等已经做了很多工作,但如果我们能够进一步在电子病历等方面打通,可能以后智慧医疗就会发展很快。
而医疗健康之类的产业,才是AI应用、科技方案中需要优先解决的“刚需”。
现在有一些应用完全是满足吸引眼球的需求,大家一乐就结束了。刚性需求,像涉及人的健康、安全等方面可能不太容易马上反映在GDP中,但老百姓需要。比如关心残疾人、关心老人等弱势群体,都是刚性寻求,我们的AI不能完全朝着高校、白领等年轻人群做,否则很容易两极分化,政府应该在其中有一些引导。
AI初创公司命运魔咒
对于AI初创公司,之前还有一些魔咒。过去,人工智能创业公司只有两个命运:一个是被大公司收购,一个是倒闭。
AI公司要在卖产品、授权、广告、服务模式中找到新的赚钱末路,或者另外开辟技术变成钱的商业模式。AI公司要做大做强,不但要有一技之长,而且要有自己的平台和特有的数据,软件和硬件都要有过人的实力。
现在,人工智能企业还是以高技术的为主,未必都是企业家,真正让技术和商业结合,找到帮助企业成长的模式,还是一个难题。
所以我的判断是让更多技术型人才和商业型人才结合。
人工智能肯定还会冒出很多新技术,也会产生很大的市场,几百亿、几千亿之类的都有可能,但也需要时间。
我们看到国外的统计材料,一个新的技术出来变成十亿的市场要二十年,变成一百亿的市场可能要三四十年,需要一个过程。
所以现在看起来,今后十到十五年,真正变成市场的技术,可能不是这几年变出来的,肯定在应有的技术方面如何创新商业模式,要在这方面动脑筋,不光是技术上有新的发明,在商业模式上还要有新的创新,结合起来才可以把新的技术用好。
给年轻学子的建议
对一些年轻人想从事AI,我有一个基本的判断,人工智能从科研角度来讲,它就是计算机科学的前沿研究,从应用来讲也是计算机的应用。
本质上是计算机的技术,是计算技术,虽然可以从脑科学学到一些东西,从数学里拿到一些东西,但是离不开计算机的基本技术,所以在国外人工智能的一些学习者学习课程,开课都开在计算机系里面,极少有搞一个人工智能学院、系等。
首先要搞清楚这是一个计算机学科的重要的组成部分,所以离不开计算机的本身,如果抛开计算机是不行的,想投入这个行业的人,至少把计算机的一些基本的课程要学的比较扎实,包括算法的课程、系统结构、软件等都是基础,现在还没有案例说:缺少计算机基础的人可以做好人工智能。
还有就是明确科幻、舆论和科研之间的距离,宣传总是会超前一些。比如一讲就是机器要超过人,通讯之间不需要机器等,一讲就是很新奇的想法,很吸引人,对这个难度要充分的估计,不是这么简单的。
现在有一些被广泛传播的实验,比如一个人在国外,一个人在国内,两个人不说话,脑之间有脑电波收到一个信号,给到美国去,两个人不见面,我想说你好,这个信号就会通过脑电波传到你的脑电波里面去,那个人就知道你在讲你好,这样的实验已经有了,但是真正所谓的脑脑之间完全靠电波来联系,不是做两个例子,这是很长的路要走。
人脑是多少万年的进化,所以年轻人不要觉得未来把脑科学的东西变成人工智能的东西,好像马上就可以应用,得有一种走艰苦路的思想准备,不是一天两天就可以搞成的。
总而言之,人工智能任重而道远,最后引用一首诗与大家共勉:
莫言下岭便无难,
赚得行人空欢喜。
正入万山圈子里,
一山放过一山拦。
——宋•杨万里《过松原晨炊漆公店》
大咖来信往期回顾
大咖来信 | 姚期智:算法将推动下一波AI浪潮,现有革新将达极限
— 完 —