一、令人绝望的决胜局
在刚刚结束的AlphaGo对战李世石第三局中,AlphaGo战胜李世石,从而最终获得了本次挑战赛的胜利(依然要比完五局),也预示着人工智能首次在围棋领域击败了人类顶尖选手。
第三场比赛中,AlphaGo一开始就牢牢掌控着局面,李世石用时远远超过AlphaGo,中后盘李世石尽管顽强抵抗,但最终还是败下阵来。在输掉第二场比赛时,李世石在接受采访时说:「第一场比赛,我感到惊讶,但今天我无话可说。如果你看到了比赛局势是如何进展的,我承认我这方面显然处于劣势。从比赛的一开始,没有任何时刻让我觉得我占优势。」我们相信许多人的感觉会和李世石完全一致,第一场惊讶,第二场无话可说,那今天的第三场却是令人感觉到绝望。
二、人工智能按照自己的方法战胜了了人类
Facebook人工智能研究元田渊栋认为,AlphaGo主要由四部分组成:1)走棋网络(Policy Network),给定当前局面,预测/采样下一步的走棋。2)快速走子(Fast rollout),目标和1一样,但在适当牺牲走棋质量的条件下,速度要比1快1000倍。 3)估值网络(Value Network),给定当前局面,估计是白胜还是黑胜。4)蒙特卡罗树搜索(Monte Carlo Tree Search,MCTS),把以上这三个部分连起来,形成一个完整的系统。
AlphaGo正是通过这种深度神经网络形成了自己独特的「棋感」,兼顾大局观和局部的计算能力,去追求最大的获胜概念而非最优解,同时还会永不停歇的在拥有庞大计算资源的谷歌服务器端进行训练和学习。
AlphaGo依靠这种棋路战胜了人类,人类甚至还来不及对此做出反应。职业六段李喆认为,第一局所谓李世石的领先和细棋都是人类经验带来的错觉!从开局战斗到最后结束,一直是AlphaGo优势!
而第二局中的一步棋可以更好的体现出这种风格,在第二局进行到第一小时,AlphaGo将黑子放置于棋盘右手侧的一片开阔地,这种走法重新定义了围棋,所有人都被这一步震惊了。公司创始人Demis Hassabis这步棋「咄咄逼人并令人震惊」。「人类是不会下出这样的棋的。我从没有见过有人下这一步棋。」曾经0:5输给AlphaGo的欧洲围棋冠军樊麾说道,并重复了三遍「非常优美。」
AlphaGo的落子看起来与之前的棋子毫无关联,但10秒钟后,这步棋以燕尾之势与AlphaGo之前的18颗黑子相连和。基本上,这个机器在放弃棋盘的下半部分,开始在不同的区域中行动。AlphaGo将黑子放置于李世乭之前所放置的一颗白子下方。尽管这一手落子在其他情况下可能会有意义,但是这在这个特殊时刻和特殊地点它是完全出乎意料的——尽管人类已经下了超过2500年的围棋。
长久以来,由于棋盘游戏易于衡量,结果明确,一直是人工智能进步的标尺,但现在这一时代已经结束,IBM研究科学家Murray Campbell 表示,他曾参与首次打败世界象棋冠军的电脑程序深蓝(Deep Blue)的开发。
围棋之后,衡量人工智能发展的标尺和测试也不会缺乏。甚至,不同类型的人工智能不需要标尺,如情感类人工智能、语音识别机器人,或为理解语音而设计的电脑。艾伦人工智能研究所执行总裁Oren Etzioni认为,AlphaGo这类算法只知道如何走围棋。相信人工智能的下一步是可以玩任何游戏并打败世界冠军,或者,正如该研究所所做的,让人工智能通过标准化考试,如SATs、八年级科学测验等。但根据艾伦人工智能研究所刚刚公布的数据,在八年级科学考试测试中,最好的人工智能只答对了60%问题,它们失败了。
三、AlphaGo战胜人类的意义:通用人工智能的价值
AlphaGo以3:0的绝对优势战胜了李世石,人工智能所取得的进步令人震惊,而站在这个历史时点,我们不禁会对人工智能的未来、人工智能与人类之间的关系进行深入思考。
AlphaGo只是人工智能研究进展的试金石,DeepMind创始人Demis Hassabis说:「围棋是一个终极目标:它是一个游戏的巅峰,有着最丰富的智力深度。它如此迷人与美丽,令我们感到兴奋不仅在于我们掌握了这个游戏,还在于我们还用漂亮的算法完成了它。」
而对于Hassabis和DeepMind,战胜围棋冠军只是一个开始,他们将持续沿着通用人工智能的道路继续前行,并将已经展示出来的人工智能强大实力付诸实用。Hassabis在接受《卫报》采访时表示,他希望构建首个「通用学习机器」:一套能像生物系统一样学习的灵活、自适应的算法,仅使用原始数据就能从头开始掌握任何任务。在Hassabis眼中,未来超级智能机器将与人类专家合作解决一切问题。「癌症、气候变迁、能源、基因组学、宏观经济学、金融系统、物理学等,太多我们想掌握的系统知识正变得极其复杂。」Hassabis指出:「如此巨大的信息量让最聪明的人穷其一生也无法完全掌握。那么,我们如何才能从如此庞大的数据量中筛选出正确的见解呢?而一种通用人工智能思维的方式则是自动将非结构化信息转换为可使用知识的过程。我们所研究的东西可能是针对任何问题的元解决方法(meta-solution)。」
在人工智能的具体应用方面,DeepMind已经开始了行动,今年2月份,DeepMind发起了科技医疗部门DeepMind Health,并与英国国家医疗服务体系NHS建立了合作,通过提供技术服务帮助临床医生更好的进行诊断和治疗。
AlphaGo在围棋中取得的胜利将聚光灯投给了机器学习科技的强大与神秘——它们已经应用在了各项技术服务中,并重新塑造着从科学研究到机器人学等等领域。有了这些技术,AlphaGo可以通过观察数千盘人类的围棋对弈学习下围棋,然后它可以通过与自己不停下棋直至掌握围棋,也可以帮助我们更好的进行医疗诊断,也可以通过自行阅读小说来学习人类的价值观,其结果正是一个有着史无前例的美丽系统。
但同时,这种通用人工智能也会令人心生恐惧,深度学习创业公司Skymind的CEO兼创始人Chris Nicholson指出的,围棋证实的这类人工智能几乎能用于解决任何可被视为某种游戏的难题——策略会在其中扮演重要角色的任何事情。他说,这包括金融交易和战争。这两个例子都需要更多的研究工作——以及更多的数据。不过,思维本身并未得到解决。Bostrom的书言之有理,人工智能会比核武器还要危险,原因不仅在于人类会滥用人工智能,还在于我们能打造出多少无法加以控制的人工智能系统。
但在减少通用人工智能的潜在危险时,DeepMind同样走在了前列。虽然不像那种类似政府领导的阿波罗或曼哈顿之类的项目需要接受官方审查,但这家公司的操作相当透明。它更倾向于发布它的代码,而和谷歌的此次交易的协议中还附带一个条款:禁止将该技术应用于军事或情报用途。Hassabis和他的同事们在推动2015波多黎各人工智能大会召开方面发挥了重要作用,并在呼吁将此项技术应用于「善举」并在「避免潜在危害」的公开信上公开签字。他们最近联合组织了另一场在纽约的同类会议,而他们公司内部的道德董事会和咨询委员会目前也召集完毕(尽管是秘密进行的)。Murray Shanahan表示:「Hassabis完全了解人工智能的安全系数,他当然不是天真无知,更不是把头埋进沙子里的鸵鸟。」
樊麾在接受机器之心采访时曾表示,AlphaGo或许发现了一种新的围棋的美,是我们想象不到。而这场世纪大战之后,我们仿佛能够稍微感受到了一点这种美,这种美超越了围棋、也超越了未来,而是关乎于我们人类共同的未来。