在Master完成60胜,结束人机车轮战后,因与AlphaGo对战而成名的欧洲围棋冠军樊麾就在社交网络上发表了一篇公告。
在这篇公告中,谷歌公司明确表示Master是“阿法狗”的升级测试版,而在其中更是有个惊人的所在——Master可能完全没学过棋谱,而这也侧面印证了Master不按常理出牌的套路。
人类与人工智能共同探索围棋?
樊麾目前是谷歌DeepMind团队测试工程师,在公告中,樊麾代表DeepMind团队写道:
“我们最近很努力地开发阿尔法围棋,刚过去的几天我们在网络的对弈平台进行了一些非正式的快棋对局,目的是为了检验我们最新版本的阿尔法围棋是否如我们的预期。”
“我们需要感谢所有与我们的Magister(P) 和Master(P) 账户在弈城围棋网以及野狐围棋网对弈的棋手,也要感谢所有观战的人!最新的阿尔法围棋在对局中所富有启发性的创新,我们从中可以学到的,以及对局的结果都令我们非常激动。”
谷歌团队声明:
在这段公告中还有耐人寻味的一段:
“世界冠军古力与阿尔法围棋对弈以后写了,‘人类与人工智能共同探索围棋世界的大幕即将拉开’。我们现在结束了非正式的测试,非常期望今年能有机会与围棋组织以及专家共同探索神秘的围棋,在相互启发的气氛中共同领会围棋的奥妙。我们希望尽快发布其他公告。”
人类与人工智能共同探索围棋世界的大幕即将拉开?是的,谷歌看上去是要将围棋AI领域探索作为一个重要突破口。
要知道,DeepMind公司创始人哈萨比斯此前在一次采访中曾透露,他们的团队正在尝试训练一个没有学习过人类棋谱的人工智能,这也可能就是Master和AlphaGo不同的原因。
如果Master真的没有学习过人类棋谱,而有了突飞猛进的实力,那恰恰印证了谷歌AI技术的全新突破。
《自然》杂志封面:
它的棋力哪里是极限?
AlphaGo的棋力已经不言而喻,但更可怕的是它的学习能力。
在2015年10月,AlphaGo在与欧洲冠军樊麾的对弈中就在公平的情况下以5比0完胜。樊麾在接受媒体采访时认为,AlphaGo的可怕在于“从不犯错”。
但在樊麾与AlphaGo的五盘大战棋谱被放上网络后,就有不少围棋业余高手在网络上发表评论,其中不少人认为樊麾这次的棋下得并不出色。
但当时《自然》杂志就写道,“人类在下棋时有一个劣势,在长时间比赛后,他们会犯错,但机器不会。而且人类或许一年能玩1000局,但机器一天就能玩100万局。”
“围棋AI的学习能力非常强大,就像当初‘深蓝’第一次输给了卡斯帕罗夫,但不到一年第二次对弈就赢了比赛。”
据《自然》杂志介绍,AlphaGo的核心是两种不同的深度神经网络:“策略网络”(policy network)和 “值网络”(value network)。它们的任务在于合作“挑选”出那些比较有前途的棋步,抛弃明显的差棋。
更恐怖的是它的“进化”深度学习能力,用了2000万局的对子对弈进行训练,每一次都能提升棋力。
Via 今日头条