AlphaGo 3:0 战胜李世石,机器与人类的共同胜利

简介: 在刚刚结束的AlphaGo对战李世石第三局中,AlphaGo战胜李世石,从而最终获得了本次挑战赛的胜利(依然要比完五局),也预示着人工智能首次在围棋领域击败了人类顶尖选手。

一、令人绝望的决胜局


在刚刚结束的AlphaGo对战李世石第三局中,AlphaGo战胜李世石,从而最终获得了本次挑战赛的胜利(依然要比完五局),也预示着人工智能首次在围棋领域击败了人类顶尖选手。


第三场比赛中,AlphaGo一开始就牢牢掌控着局面,李世石用时远远超过AlphaGo,中后盘李世石尽管顽强抵抗,但最终还是败下阵来。在输掉第二场比赛时,李世石在接受采访时说:「第一场比赛,我感到惊讶,但今天我无话可说。如果你看到了比赛局势是如何进展的,我承认我这方面显然处于劣势。从比赛的一开始,没有任何时刻让我觉得我占优势。」我们相信许多人的感觉会和李世石完全一致,第一场惊讶,第二场无话可说,那今天的第三场却是令人感觉到绝望。


二、人工智能按照自己的方法战胜了了人类


Facebook人工智能研究元田渊栋认为,AlphaGo主要由四部分组成:1)走棋网络(Policy Network),给定当前局面,预测/采样下一步的走棋。2)快速走子(Fast rollout),目标和1一样,但在适当牺牲走棋质量的条件下,速度要比1快1000倍。 3)估值网络(Value Network),给定当前局面,估计是白胜还是黑胜。4)蒙特卡罗树搜索(Monte Carlo Tree Search,MCTS),把以上这三个部分连起来,形成一个完整的系统。


AlphaGo正是通过这种深度神经网络形成了自己独特的「棋感」,兼顾大局观和局部的计算能力,去追求最大的获胜概念而非最优解,同时还会永不停歇的在拥有庞大计算资源的谷歌服务器端进行训练和学习。


AlphaGo依靠这种棋路战胜了人类,人类甚至还来不及对此做出反应。职业六段李喆认为,第一局所谓李世石的领先和细棋都是人类经验带来的错觉!从开局战斗到最后结束,一直是AlphaGo优势!


而第二局中的一步棋可以更好的体现出这种风格,在第二局进行到第一小时,AlphaGo将黑子放置于棋盘右手侧的一片开阔地,这种走法重新定义了围棋,所有人都被这一步震惊了。公司创始人Demis Hassabis这步棋「咄咄逼人并令人震惊」。「人类是不会下出这样的棋的。我从没有见过有人下这一步棋。」曾经0:5输给AlphaGo的欧洲围棋冠军樊麾说道,并重复了三遍「非常优美。」


AlphaGo的落子看起来与之前的棋子毫无关联,但10秒钟后,这步棋以燕尾之势与AlphaGo之前的18颗黑子相连和。基本上,这个机器在放弃棋盘的下半部分,开始在不同的区域中行动。AlphaGo将黑子放置于李世乭之前所放置的一颗白子下方。尽管这一手落子在其他情况下可能会有意义,但是这在这个特殊时刻和特殊地点它是完全出乎意料的——尽管人类已经下了超过2500年的围棋。


长久以来,由于棋盘游戏易于衡量,结果明确,一直是人工智能进步的标尺,但现在这一时代已经结束,IBM研究科学家Murray Campbell 表示,他曾参与首次打败世界象棋冠军的电脑程序深蓝(Deep Blue)的开发。


围棋之后,衡量人工智能发展的标尺和测试也不会缺乏。甚至,不同类型的人工智能不需要标尺,如情感类人工智能、语音识别机器人,或为理解语音而设计的电脑。艾伦人工智能研究所执行总裁Oren Etzioni认为,AlphaGo这类算法只知道如何走围棋。相信人工智能的下一步是可以玩任何游戏并打败世界冠军,或者,正如该研究所所做的,让人工智能通过标准化考试,如SATs、八年级科学测验等。但根据艾伦人工智能研究所刚刚公布的数据,在八年级科学考试测试中,最好的人工智能只答对了60%问题,它们失败了。


三、AlphaGo战胜人类的意义:通用人工智能的价值


AlphaGo以3:0的绝对优势战胜了李世石,人工智能所取得的进步令人震惊,而站在这个历史时点,我们不禁会对人工智能的未来、人工智能与人类之间的关系进行深入思考。

AlphaGo只是人工智能研究进展的试金石,DeepMind创始人Demis Hassabis说:「围棋是一个终极目标:它是一个游戏的巅峰,有着最丰富的智力深度。它如此迷人与美丽,令我们感到兴奋不仅在于我们掌握了这个游戏,还在于我们还用漂亮的算法完成了它。」


而对于Hassabis和DeepMind,战胜围棋冠军只是一个开始,他们将持续沿着通用人工智能的道路继续前行,并将已经展示出来的人工智能强大实力付诸实用。Hassabis在接受《卫报》采访时表示,他希望构建首个「通用学习机器」:一套能像生物系统一样学习的灵活、自适应的算法,仅使用原始数据就能从头开始掌握任何任务。在Hassabis眼中,未来超级智能机器将与人类专家合作解决一切问题。「癌症、气候变迁、能源、基因组学、宏观经济学、金融系统、物理学等,太多我们想掌握的系统知识正变得极其复杂。」Hassabis指出:「如此巨大的信息量让最聪明的人穷其一生也无法完全掌握。那么,我们如何才能从如此庞大的数据量中筛选出正确的见解呢?而一种通用人工智能思维的方式则是自动将非结构化信息转换为可使用知识的过程。我们所研究的东西可能是针对任何问题的元解决方法(meta-solution)。」


在人工智能的具体应用方面,DeepMind已经开始了行动,今年2月份,DeepMind发起了科技医疗部门DeepMind Health,并与英国国家医疗服务体系NHS建立了合作,通过提供技术服务帮助临床医生更好的进行诊断和治疗。


AlphaGo在围棋中取得的胜利将聚光灯投给了机器学习科技的强大与神秘——它们已经应用在了各项技术服务中,并重新塑造着从科学研究到机器人学等等领域。有了这些技术,AlphaGo可以通过观察数千盘人类的围棋对弈学习下围棋,然后它可以通过与自己不停下棋直至掌握围棋,也可以帮助我们更好的进行医疗诊断,也可以通过自行阅读小说来学习人类的价值观,其结果正是一个有着史无前例的美丽系统。


但同时,这种通用人工智能也会令人心生恐惧,深度学习创业公司Skymind的CEO兼创始人Chris Nicholson指出的,围棋证实的这类人工智能几乎能用于解决任何可被视为某种游戏的难题——策略会在其中扮演重要角色的任何事情。他说,这包括金融交易和战争。这两个例子都需要更多的研究工作——以及更多的数据。不过,思维本身并未得到解决。Bostrom的书言之有理,人工智能会比核武器还要危险,原因不仅在于人类会滥用人工智能,还在于我们能打造出多少无法加以控制的人工智能系统。


但在减少通用人工智能的潜在危险时,DeepMind同样走在了前列。虽然不像那种类似政府领导的阿波罗或曼哈顿之类的项目需要接受官方审查,但这家公司的操作相当透明。它更倾向于发布它的代码,而和谷歌的此次交易的协议中还附带一个条款:禁止将该技术应用于军事或情报用途。Hassabis和他的同事们在推动2015波多黎各人工智能大会召开方面发挥了重要作用,并在呼吁将此项技术应用于「善举」并在「避免潜在危害」的公开信上公开签字。他们最近联合组织了另一场在纽约的同类会议,而他们公司内部的道德董事会和咨询委员会目前也召集完毕(尽管是秘密进行的)。Murray Shanahan表示:「Hassabis完全了解人工智能的安全系数,他当然不是天真无知,更不是把头埋进沙子里的鸵鸟。」


樊麾在接受机器之心采访时曾表示,AlphaGo或许发现了一种新的围棋的美,是我们想象不到。而这场世纪大战之后,我们仿佛能够稍微感受到了一点这种美,这种美超越了围棋、也超越了未来,而是关乎于我们人类共同的未来。


相关文章
|
机器学习/深度学习 人工智能 算法
强化学习的起源:从老鼠走迷宫到AlphaGo战胜人类
强化学习的起源:从老鼠走迷宫到AlphaGo战胜人类
172 0
|
机器学习/深度学习 人工智能 算法
人类玩德州扑克也扑街了?Facebook开发玩德州扑克的AI,大比分击败顶尖人类选手!
最近,Facebook的研究人员开发了一个玩德州扑克的人工智能,可以轻松击败人类玩家,它跟DeepMind的AlphaZero有何不同?今天我们就来看下。
353 0
人类玩德州扑克也扑街了?Facebook开发玩德州扑克的AI,大比分击败顶尖人类选手!
|
机器学习/深度学习 人工智能 算法
1:2,李世石最后一战被AI击败,唯一战胜过AlphaGo的人退役了
退役赛的最后一局,李世石回到了自己的家乡。对战之地距离李世石的出生地飞禽岛 40 多公里,他曾在飞禽岛度过了他的童年时光,也是在这里决定成为职业围棋选手。
182 0
1:2,李世石最后一战被AI击败,唯一战胜过AlphaGo的人退役了
|
人工智能 算法 芯片
AlphaGo可能会发现另外一种围棋的美,是我们想象不到的
明天 DeepMind AlphaGo 与韩国李世石九段的比赛有着重要的历史意义——这是首次人工智能在人类最复杂的博弈游戏中挑战最高级别的人类选手。而拉开这一帷幕的是去年欧洲围棋冠军樊麾与 AlphaGo的对战。机器之心有幸采访到了樊麾老师,在与他的长谈中,樊麾老师详细回顾了他与 AlphaGo 交战的精彩故事,畅谈了他对人工智能技术的感触,以及对围棋与人生的哲学思考。樊麾老师将作为裁判长现场督战「AlphaGo VS 李世石」。这里,我们希望用樊麾老师这番丰富且深刻的思考和遐想来拉开这场「世纪大战」,而更加重要的是,我们相信樊麾老师的长篇精彩分享一定可以给大家带来超越比赛本身的启迪。
199 0
AlphaGo可能会发现另外一种围棋的美,是我们想象不到的
|
机器学习/深度学习 人工智能 算法
洞悉AlphaGo超越围棋大师的力量:机器之心邀你一起强化学习
美国计算机协会会刊(CACM)9 月发表了《强化学习的复兴》一文,深度介绍了强化学习的运用及其与深度学习的比较。强化学习是机器学习的主要三种类型之一,被应用在多种训练任务中。我们熟知的 AlphaGo 中就用到了大量的强化学习。「人工智能研学社· 强化学习组」将强化学习作为第一期学习内容,与大家分享有关深度学习的基本知识。本期教学内容推荐 Rich Suntton 教授关于强化学习的演讲视频——强化学习介绍及与函数近似结合的讨论。
311 0
洞悉AlphaGo超越围棋大师的力量:机器之心邀你一起强化学习
|
机器学习/深度学习 人工智能
人机世纪大战:机器何时能真正战胜人类? | 起来嗨
谷歌AlphaGo对世界围棋冠军李世石的挑战赛还未开打,这场世纪大战的讨论已急剧升温。 这场围棋手与机器的世纪大战焦点主要集中在两点: 1,谷歌AlphaGo赢得比赛胜利; 2,世界围棋冠军李世石击败谷歌AlphaGo。而这两种观点背后,其实是两种力量在抗争。
223 0
|
安全 算法 机器学习/深度学习
深度 | 打败围棋冠军后,机器智能下一步能战胜黑客吗?
阿里妹导读:从深蓝战胜象棋冠军到AlphaGo战胜围棋冠军,每一次机器智能在特定领域战胜人类,都会引发整个社会的广泛关注。洞察了棋类博弈真相的机器智能,接下来能洞察网络安全的真相并且在黑客博弈中战胜人类吗?在机器智能炙手可热的今天,或许我们该静下心来,去理解机器智能的本质、网络安全的困境以及未来二者结合的挑战。
12708 0
|
人工智能 安全
【巨星陨落】霍金今日去世,但人类对宇宙和AI的探索永无止境
霍金去世的消息令全世界都陷入深切哀悼。霍金曾积极关注人工智能,指出我们要对AI发展保持警惕。3月14日也是爱因斯坦诞辰139年的日子,上帝在同一天送来了一位天才,而带走了另一位。人类对宇宙和AI的探索永无止境,让我们以这样的方式祭奠这两位伟人。
15066 0