【干货】王小川:AlphaGo的幕后与思考-阿里云开发者社区

开发者社区> 数据派> 正文

【干货】王小川:AlphaGo的幕后与思考

简介:

嘉宾介绍:


王小川,搜狗公司CEO,前搜狐高级副总裁、首席技术官。1994年王小川用吴文俊消元法,首次在微型机下完成初等几何命题的全部证明。1996年王小川代表中国队参加第8届国际信息学奥林匹克竞赛(IOI),获得金牌,后为中国队教练。


2015年,王小川以“群体智能支撑的互联网技术及应用”科技成果获得北京市科学技术奖一等奖;获得了科技北京百名领军人才、推动“北京创造”的10大科技人物奖、以及北京市劳动模范称号。此前王小川还入选了2014年北京市高层次创新创业人才计划,并获得了2014年安永中国新兴企业家奖等多个奖项。


2016年王小川代表搜狗捐赠清华大学1.8亿元成立“天工智能计算研究院”,共同致力于人工智能前沿技术的研究。王小川先生毕业于清华大学计算机专业,拥有工学学士、工学硕士,以及EMBA学位。


640?wx_fmt=png&wxfrom=5&wx_lazy=1


我今天的题目是《AlphaGo的幕后与思考》。大家可以看道这张图显示的是人机大战中41的比分我的理解是一个学术与市场营销的完美的结合全中国人估计95%都知道这样一场比赛,而且这场比赛也彻底颠覆了我们对技术、对人工智能的理解。

 

640?wx_fmt=png&wxfrom=5&wx_lazy=1


为什么这么说呢?

 

我先用一个词,Google背后的心机。Google在今年1月份在《自然》杂志上发表了一篇文章,讲的是跟樊麾打一场比赛,比赛前跟樊麾签了一个协议,不管结果是输是赢,不能对外透露任何细节,要严格保密的。假设谷歌没有发论文,先跟樊麾比赛,能有多大学术的高度?


对于大多数人来讲,光看论文是没有感觉的。但是谷歌的团队心思之缜密,不仅是在做研究的这群人,还把事情推到特别大的高度。另外他们为什么选樊麾?如果谷歌选一个职业选手,但是没有世界冠军头衔,我们觉得挺LOW。找一个世界冠军,挺高的头衔,但对专业选手而言,仅有二段,不算高手。


所以,在这件事上,我觉得谷歌既把眼球吸引到了,又留给大家想象和争论的空间。

 

比赛之前大家是什么心态呢?

 

比如聂卫平觉得计算机一点机会都没有,这是不可克服的问题,认为机器能够下棋是没有判断力的表现。甚至还有中国队的围棋总教练俞斌,他是在围棋界里面计算机学得最好的,在80年代自己写下围棋的计算机程序,得到很多认可。他认为机器是一点机会没有的,因为我认为计算机有它不可克服的问题,人和电脑相比,根本没有胜负,100%是人赢。

 

640?wx_fmt=png&wxfrom=5&wx_lazy=1


我想在这里面能够看到人性当中脆弱的一面,每个人都有,每个人生病的时候都有自己的压迫,别人说你特蠢,东西做得烂,大家都不开心。每个人都有自尊心。这件事一定会把一部分人放在历史舞台的对立面。围棋选手今天很不幸,在下棋上有这样的问题。


计算机的问题怎么讲?


比如李开复讲认为AlphaGo比较悬,但是未来能赢,IT界的人不会说机器干不过人,否则存在感就没有了。但是通常都认为机器没有这么快,以后会赢得。在这个比赛中,大多数搞技术的人都没有感觉到这个事情发生的速度。


2月份的样子,我在知乎上发帖,说这次AlphaGo会完胜。因为它满足了张钹院士讲的三个条件:


第一、提出了问题。人工智能在下棋上是一个重大的事,好多人没有想这个方向。


第二、我看到它会赢。


第三、我知道为什么会赢。


我认真地读了论文,找了下围棋的人请教,斗胆发了这样一篇文章,是有勇气的,最后也被验证成功了。理想跟现实之间差别是很大的,对于这样一个技术趋势里面,我觉得我是有判断的,但是市场股价没办法思考。


比赛前到比赛后就是七八天时间,给AlphaGo取了一个新的名字,叫“阿老师”,我们特别希望中国有人做出这样的阿老师,把它当老师看。

 

640?wx_fmt=png&wxfrom=5&wx_lazy=1


在比赛前、比赛后,我们对机器的理解里面产生了巨大的变化,我们开始接受它,把它拟人化,而且比分很巧妙,4:1,如果赢五局可能就不好了,不是围棋选手被灭了,是人类被灭的感觉。


印刷术建立之后,我们开始探讨人和人之间的关系。就像文艺复兴是从封建社会到资本主义社的分水岭。咱们中国现在还没经历这个运动,所以有一点点问题。

 

640?wx_fmt=png&wxfrom=5&wx_lazy=1


AlphaGo之后,带来我们重新的思考,就是机器和人的关系。有专家会讲机器还不行,有人讲机器以后会颠覆人类。


我们以前认为机器就是机器,拔电源就行了。诊断报告是机器给做的,说你这个人有什么问题,看片子还得找专家。但是在今天,照完片子之后,机器的诊断效果可能比人更准。我有一个医学朋友,做CT看片子的,他说大多数医生看片子的准确率是40%,他现在到70%,已经高很多了。


我们今天接受机器的很多判断。这是我们的心理上一个巨大的变化,我把它称为“第二次人类自己的运动”。

 

关于人工智能,打击都有很多想法。做产品的时候,就是想机器怎么能在里面做决策、识别。决策就分了三个层次。


第一层,将传统方法交给机器。

第二层,将答案交给机器记忆学习。

第三层,将目标给机器自我学习。


640?wx_fmt=png&wxfrom=5&wx_lazy=1


这是我自己的理解,也跟AlphaGo脉络一致。最早的专家系统是第一个,我们把规则交给机器,把计算机世界变成一个逻辑,告诉机器,这是原来的阶段。

 

这个阶段里的重大的问题就是我们没法去教机器,不知道怎么描述的时候,机器就不灵了,而且教出来的徒弟永远是比人弱的,这是不够的地方。甚至在做一些学习系统中,我们也要尝试告诉机器怎么去描绘一个实物,比如说做人脸模型。王小川长成这样,大家都认识,但是要描述出来,比如说脸很圆,这个事情也比较不靠谱。因此我们发现我们没法告诉机器。

 

有了深度学习的方法,我们解决了一个问题,就是只告诉机器答案,给的数据越原始越好,这会使得程序员、工程师更容易应对专业的问题。因为它可以减少自己的专业背景,不用讲说我要去懂人,或者像医生一样懂得片子怎么看,是拿数据训练的。

 

在这样一个深度学习或者是人工智能发展过程中,深度学习本身带来了好处,技术人员更容易进入到专业领域破解题目,这是技术本身。

 

对公司而言,公司的领头人一定是对行业理解比较深刻,很懂行业应用,这是我们讲的第二个侧面。不用给机器方法,只给答案,机器自己找方法。

 

AlphaGo代表一个趋势,既不给规则,也不给答案,把自己变成一个判断者,就像下围棋一样。围棋之前训练的时候,前三盘棋是把人之前的走棋方法告诉机器,机器跟人处于类似的状态。之后机器人自己下,不知道哪个棋好不好,下完之后,人告诉机器这个结果好不好。人工智能又得到一个新的法门,答案都不需要知道,变得更加省事。

 

 最近有一个消息应该是比较靠谱的,AlphaGo在今年内会跟柯洁打一场比赛,我跑去看了很多评论,以前是一边倒觉得人会赢,今天一边倒觉得机器会赢。


我有一个猜想,我认为这一次跟柯洁比赛的AlphaGo是没有经过那三千万盘棋学习的,因为之前是从KGS里面拿了人六段到九段的走棋,让机器学习,这是跟李世石打比赛用到的。


但是跟柯洁比赛我认为是新的,两个从来没有学习过的机器,然后告诉你赢了、你输了,什么都不会的机器训练一个下棋的规则来以前的机器是仿人的,我们判断机器走棋走得好不好都是经验去判断。


下棋的时候,头两局机器赢了,人输了,媒体的报道是中盘逆转为什么叫中盘逆转?因为前一半里专家态度是机器走得特别臭,走到一半的时候,机器越到中局的时候越好了。这个时候就觉得机器是翻转局面了。


后来数据统计,在他们的视野里面,机器一直是领先的,只是以人的眼光觉得机器走得很差,以机器的眼光,它走得挺好的。所以我们对机器的理解是有限的。比如慕容复中原的武功学会,然后再去修炼,突然来一个西域的,或者没有跟中国比赛过的,没有学过围棋打法的,我们会遇到这样的问题。是否用这个程序参加比赛是我的猜想但是Google尝试不用人训练机器,我蛮佩服的。

 

哪些职业会被取代,倒过来讲就是哪些行业是创业的机会?

 

640?wx_fmt=png&wxfrom=5&wx_lazy=1


在下围棋的程序中,如果把程序突然间跟AlphGo说,对不起,我们改点规则,把棋盘放成21×21,放大两个,机器肯定就不会下棋了,但是李世石一定会下。所以机器能做的事情是非常有限的。


如果说题目非常清晰,就像下围棋一样,输入的信息就局限在有限的输入,有规则清晰的输出,在这种情况里,机器会把人取代。

 

任务的确定性高,输入的信息封闭有边界,输出答案是标准可评价的。像医生、司机、股票的高频交易,输入的信息有限的行业里,机器学习是有很大机会的。一些创造性的行业,像画家、作家、科研等等,思考的问题没有边界,对机器而言,完全找不到机会努力。

 

技术人员让机器更加聪明,提高机器效率,能够看到更广阔的前景。做搜索的公司,做人工智能好像更有优势,为什么?因为有很多的数据,像芮勇讲的要做数据的时候,搜索摩托车,找图片,没找到就不会点击了,用户的点击都会反过来给图片做标签。更多的是搜索引擎本身就在做初步的人工智能。输入一个关键词,随后给出十条答案。所以,人工智能就是底层的基本理念。

 

 今天我们看到Google往前走的时候,开始提更多的理念,从移动时代走向人工智能的时代。乔布斯也曾说机器能够在未来学会回答问题,或者接受指令去做事。当然,包括Google、亚马逊,都开始让人跟机器以自然语言做沟通,机器服从于人,回答问题,或者帮你做一些控制命令。这是整个大的背景。今天我们提互联网,一方面是文化创意产业,一方面是机器学习。有了数据以后,怎么选择这个连接,做判断就变得更关键。


我的演讲就到这里,谢谢。


原文发布时间为:2017-03-04

本文来自云栖社区合作伙伴“数据派THU”,了解相关信息可以关注“数据派THU”微信公众号

版权声明:本文内容由阿里云实名注册用户自发贡献,版权归原作者所有,阿里云开发者社区不拥有其著作权,亦不承担相应法律责任。具体规则请查看《阿里云开发者社区用户服务协议》和《阿里云开发者社区知识产权保护指引》。如果您发现本社区中有涉嫌抄袭的内容,填写侵权投诉表单进行举报,一经查实,本社区将立刻删除涉嫌侵权内容。

分享:
+ 订阅

官网链接