20世纪90年代后期,IBM深蓝(Deep Blue)研究了一系列的国际象棋算法,期望于打败当时的世界冠军加里•卡斯帕罗夫(Garry Kasparov)。终于,在1997年深蓝成功打败了卡斯帕罗夫,这是历史上计算机第一次在一对一的比赛中打败人类的世界冠军,此事在当时引起了众人极大的恐慌,由此也产生了许多在至今来看也不过时的科幻电影。而到了2017年,当阿尔法狗打败柯洁的消息传出来之后,众人却安心当起了吃瓜群众,并没有掀起多大的争议。我们整理了2017年在人类游戏里面被人工智能打败的游戏清单,大家一起来看一看。
20世纪50年代,提出“人工智能”概念的约翰•麦卡锡(John McCarthy)说国际象棋的角色就像是“人工智能的果蝇”,原因是前人对果蝇的研究对于基因学领域来说意义重大。所以,国际象棋成为了人工智能研究人员的眼中的一个基准。
到了21世纪早中期,科技的飞速发展使得计算机持续地在几乎所有比赛中战胜国际象棋的大师们。自然而然,人工智能的研发者们开始向其他更加复杂的游戏前进,去测试他们逐渐复杂但又十分精细的算法。在过去的十二个月里,人工智能突破了一系列的新门槛,最终成功在各种不同的游戏竞赛:从古老的围棋游戏到互动性的德州扑克,都一一战胜了人类
Going, going, gone
从尝试、进步到完成
九十年代末期,在计算机最终战胜了象棋大师后,普林斯顿大学的一位天体物理学家评论说:“计算机想要在围棋比赛中打败人类恐怕还要100年,甚至更久。”
计算机科学家们接受了这一挑战,他们将注意力转移到了这一古老的中国策略游戏,它看起来简单至极,但想要参透其中的精髓却非常复杂。
过去十年机器学习的发展培育了真正具有竞争力的人工智能围棋选手。2014年,谷歌开始研发一种叫阿法狗(AlphaGo)的深度学习神经网络。两三年后,在围棋游戏挑战接近成功时,开发小组开始尝试一些新的东西。
2016年末,一个神秘的在线围棋玩家“Master”出现在了弈城围棋网(Tygem)。接在下来短短的几天时间内,许多世界顶级选手都败给了这位神秘玩家。2017年1月4号,“神秘玩家”被正式确认,其就是DeepMind人工智能阿法狗的最新版。
2017年5月,阿法狗“Master”向围棋世界等级分第一的柯洁发起挑战。三次比赛阿法狗都完胜这位世界冠军。而且,最令人吃惊的是十月份谷歌宣布研发出比“Master”更复杂精准的AlphaGo版本。
Deepmind在《自然》(Nature)发布论文,报告了他们的最终版围棋程序AlphaGo Zero,这是一个能够完全自学围棋具有革命性意义的算法。不论何种游戏,只要告诉系统这个游戏的基本规则,它就能通过不断的自我对弈学习最终掌握游戏的核心。在21天的学习之后,AlphaGo Zero达到了大师级别。40天后它超越了之前所有的版本。
2017年12月,DeepMind又推出了一个叫AlphaZero的更新版本。这个新的人工智能可以在短短几小时内迅速学习掌握各种游戏。在仅仅八小时的自我学习后,这个更新版本系统不但能打败先前的AlphaGo Zero,还能成为国际象棋的大师和日本象棋冠军。
掌握虚张声势
虽然围棋提供了一个复杂环境的游戏,但掌握扑克游戏给了人工智能一个完全不同的命题。要想在扑克游戏中大胜,需要掌握欺骗的艺术。虚张声势和识别虚张声势在臭名昭著的纸牌游戏中是取胜的关键。
经过十多年的尝试,2017年出现的两个独立的研究证明了人工智能终于可以战胜顶尖扑克选手。艾伯塔大学的DeepStack展示了一个人工智能系统,它可以用人工智能式的“直觉”来全面战胜人类玩家。
卡内基梅隆大学的一个团队在2017年1月举行了更加公开的比赛,他们的Libratus人工智能系统花费了20天与4名专业扑克选手进行了120,000场无限下注德州扑克。虽然职业选手每晚都在讨论这套系统的弱点,但Libratus也在每天不断自我改进,在游戏中修补漏洞并改进策略。
人类大脑确实难以与机器难以抗衡。经过一个月的全天候游戏,Libratus增加了170万美元,每名专业选手却损失了数千美元的虚拟赌注。一名失利选手在比赛中途对Wired杂志说道:“与它比赛就像能看到我的手牌一样,我甚至以为自己是在和一个作弊的人比赛。”
伊隆•马斯克的人工智能实验
2015年,伊隆•马斯克和一小部分投资者成立了OpenAI组织。该项目旨在探索人工智能系统的发展,并特别关注强化学:让机器自己教自己如何针对特定任务进行改进。
2017年8月,OpenAI团队着眼于征服刀塔2(大型电子竞技锦标赛“The International”的核心游戏)。
在通过短短两周学习后,OpenAI机器人在比赛中被祭了出来,随后其击败了几个世界顶尖选手。虽然人工智能系统只是在简单的一对一版上进行了训练,但OpenAI团队正在教系统如何在五对五团队游戏中取胜。
分而治之:吃豆人挑战
几年前,谷歌的DeepMind在49个Atari 2600游戏中设置了自己的人工智能。虽然人工智能赢了很多游戏,但有的确实难以掌握,比如80年代经典的电子游戏吃豆人就让人工智能束手无策。
2017年,一家名为Maluuba的深度学习初创公司被谷歌收购,随后被并入了DeepMind。Maluuba的新机器学习方法被成为“混合奖励框架”(HRA)。将这种方法应用到吃豆人游戏的上面,发现该系统创建了超过150个单独代理,每个代理都负责具体目标:例如寻找特定的药丸或躲避鬼魂。
另外,HRA会产生一个类似于高级经理的顶级代理,这位顶级代理会在做出个人行动前,评估下级代理人的建议,这被称为“分而治之”,一个复杂的人物被分解成了更小的部分。人工智能把这一方法应用到吃豆人上面之后,很快取得了一个出人意料的结果:人工智能拿到了999990的惊人高分。
人工智能将会很快开始创造游戏
当人工智能几乎在所有游戏中打败我们之后,按照逻辑来思考,下一步将会如何发展呢?
一位来自法尔茅斯大学的研究人员最近展示了一种机器学习算法,他声称这种算法可以自己制造新的游戏让我们来玩。他给这一人工智能系统命名为Angelina,Angelina每天都在自我更新,现在它可以通过维基共享资源、网上的报纸和社交媒体等多种数据库摘取信息去制造新的游戏。
这意味着什么?
在2017年,最显著并且可怕的地方就是强化学习方面的巨大进展,因为这些系统可以高效地自我学习并去掌握新的技能。比如最新版的 AlphaZero就可以在短短几天的自我学习时间里在一些游戏竞赛中超过人类现有的水平。
对350名人工智能研究者的调查显示,用不了多久人工智能就可以打败一切。调查预测10年内人工智能会比我们做得更好,到2049年它就可以写出畅销小说了,而到了2053年,就可以代替人来做手术。而且,这份调查的结论是:到2060年,有一半的几率人工智能会把人类的全部工作做完,并且会做得更好。
2017年无疑是人工智能在越来越复杂的游戏中战胜人类的里程碑,虽然这看起来微不足道,但其影响力十分深远。甚至于这些人工智能开发公司已经着眼于现实世界的挑战,谷歌DeepMind已经将AlphaGo Zero系统从游戏转移到蛋白质折叠研究中,希望找到阿尔兹海默症和帕金森症等疾病的治疗方法。
“本质上我们希望利用这些算法上的突破去帮助解决各种紧迫的现实问题。”DeepMind联合创始人兼首席执行官杰米斯•哈萨比斯说。“如果相似的技术可以被应用于其他的结构性问题,例如蛋白质折叠,减少能源损耗或寻找革命性的新材料,研究结果可能会更新人类的认知,我们的生活也会产生积极的影响。”
原文发布时间为:2018-01-06
本文作者:文摘菌