输了!柯洁首战告负AlphaGo,哈萨比斯:这不是人机大战

简介:
本文来自AI新媒体量子位(QbitAI)

19岁的柯洁输了。

围棋人机大战2.0版的第一场,双方交锋至第286手棋,执黑的柯洁以约四分之一子的微弱劣势,败给围棋人工智能程序AlphaGo。

全程记录

10:30,柯洁和代为AlphaGo落子的黄士杰博士落座。

10:31,两位选手猜先,柯洁执黑先行。

随后,柯洁在右上角落下第一子,耗时13秒。

AlphaGo在右下角落下第一子,耗时45秒。

柯洁的第一步也被解读为尊重对手。柯洁第二步下出“三三”。这是AlphaGo的常用下法。随后双方开始你来我往。总体而言,AlphaGo落子速度比柯洁明显要快。

第21手,柯洁提掉白棋一子。而AlphaGo第30手,则让柯洁眉头一紧。此时,现场讲评的华以刚和徐莹表示,这盘棋场面好看,而且有不少没见过的下法出现。

比赛中,柯洁有时会突然发笑,有时也会默默摇头。

AlphaGo落下第50手,此时从盘面看,白棋暂时领先18.5目(仅供参考)。而这个时候,柯洁的思考时间已经比AlphaGo多用了将近40分钟。

第54手,白棋下出一个断。现场讲解的华以刚表示,AlphaGo下棋的效率令人心烦,并认为这将是这盘棋的焦点之一。而柯洁也再次皱起眉头,小长考了很久。

柯洁用时一个小时后,常昊、张璇夫妇代替华以刚、徐莹在现场上台讲解。常昊、张璇上台之后,也再次讲解第54手的断,认为是一个出乎意料的“后中先”。

在国内棋手中,柯洁以下棋速度快著称。而今天柯洁用时约80分钟思考后,AlphaGo才用时约20分钟。双方的差距正在越拉越大。

97手!柯洁下出天马行空的一招。创新工场人工智能工程院副院长王咏刚评价说:“这分明就是两个AI在下棋!讲输赢仍然悲观,但柯洁在人类里足以封神!”

柯洁用时还剩1小时07分的时候,现场讲解的常昊和张璇判断战斗可能要进入官子阶段,而整个盘面柯洁比较辛苦。此时AlphaGo用时还剩2小时20分,大约领先14.5目(仅供参考)。

148手的出现,让观战的网友一阵惊呼,纷纷大呼不理解。

随着比赛的进行,柯洁的表情逐渐严峻了起来。或者用手撑在面部,或者抓住自己的头发,或者悄悄的摇摇头。与此同时,柯洁的耗时逐渐流逝。

柯洁时间还剩大约半个小时的时候,AlphaGo还有两个小时。行至第173手,明显双方都已经进入官子阶段。从盘面上看,如果AlphaGo不出错的话,黑棋的局势要差一点。

“这时可能要靠电力局的同志们了”,有网友笑侃。

在收官阶段,柯洁和AlphaGo相互步步紧逼,屡屡祭出强硬下法。下午2点06分,柯洁又开始一个小长考。

现场讲解的徐莹表示,收官阶段非常重要,她举例说以前的李昌镐经常依靠官子阶段的发挥,半目逆转局面。

192手之后,盘面上似乎已经没有重要的官子了。AlphaGo已经能够“心态平和”的落子了,华以刚表示这说明AI已经对盘面有了相当的自信。

华以刚判断,结果马上出来了。此时,柯洁还剩不到18分钟。

此时徐莹粗略点出白棋目数为:65+8,而华以刚点完黑棋的目数,判断黑棋贴不出7.5目。柯洁应该输棋无疑。

第247手,尽管柯洁落子有点犹豫,但他心里早已明白一切。

在最后细小的收官阶段,柯洁下棋如飞,而AlphaGo在看似不用想的时候,反而落子仍然非常谨慎。

单官阶段,柯洁一直坚持走完,没有轻易认输。

哈萨比斯:这不是人机大战

首日比赛之前,现场还举行了一个简短的开幕式。桐乡市委书记,国家体育总局棋牌中心主任、Alphabet执行董事长施密特、DeepMind创始人兼CEO哈萨比斯等先后致辞。

以下是量子位整理节选的部分发言。

 施密特

施密特:

非常高兴回到中国,中国对我来说意义非凡。这是一个珍贵的机会,可以打造一个更美的世界。去年我在韩国就说,不管胜负如何,人性终将获胜。电脑有自己擅长的事情,人类有自己的专长。

我们处在人工智能的时代,我们相信这能打造更好的生活,我们所面临的各个领域都有很多未解之谜,科学家通过人工智能,可以做到更多的事情。

这是一个伟大的围棋赛事,天才的选手和团队与AlphaGo对战,可以认为是人机合作时代的开启。

非常感谢今天你们能允许我们来到这里。

 哈萨比斯

哈萨比斯:

我对未来几天的比赛充满期待。我们非常感激中国围棋协会、体育总局、桐乡政府等帮助我们如期举行人机大战。柯洁是一个真正的艺术家,天才式的围棋选手。这场对弈将开启围棋界的下法新天地。

这次峰会的宗旨,是在世界最深奥、美丽的棋盘上,探索新的下法。可能再过一万年,我们也无法穷尽围棋的下法和定式。围棋变化繁多,非常神秘。

三年前,我们想也许人工智能有足够的能力下围棋。AlphaGo不是一个预编程的围棋程序,而是采用人类相似的方式进行学习。

一年半前,我们与樊麾进行对弈,现在樊麾也加入了我们。AlphaGo以人类无法想象的方式下围棋。一年前我们和李世乭进行了对局,我们也为之感叹。今年一月,我们给他取名“Master”,并在网上取得60连胜的成就。

这不是人机大战,而是人使用电脑发现新的奥秘和知识。和哈勃望远镜一样,探索宇宙,AlphaGo就是新的哈勃望远镜。

AlphaGo可以用在其他领域。我们相信在制药、医疗领域,都可以借由人工智能解决,帮助专家取得更大领域的突破。

希望通过未来与人类专家的合作,找到各种创新的方式。希望探索有新的创新,也希望AlphaGo在其他领域有新的突破。

最后我们想对围棋界表达深深的谢意,这已经超过我们最初的想象。希望能探索新的下法,我们最终的目的不是谁赢,因为最终的胜利属于人类。

我们希望在座的各位能一起探索围棋的真谛。我祝柯洁好运。

9时40分,柯洁上台参与活动,然后离场准备稍后的比赛。

决战前夜:柯洁不眠

昨晚23:15:44,柯洁在微博上发出《最后的对决》一文,字里行间都透露着这位少年天才的焦虑和骄傲。以下是《最后的对决》全文:

决战前夕,感慨万千…

在这个特殊的时间,我有些话想和热爱围棋、关注围棋、关注我的朋友们说:

无论输赢,这都将是我与人工智能最后的三盘对局

很多人可能会问为什么?

其实私底下我已经与朋友家人说了很多次这样的想法,现在的AI进步之快远超我们的想象。像国产的绝艺、日产的ZEN虽然和AIphago还有着较大差距,但已经表现出超强的实力了…我相信未来是属于人工智能的。

可它始终都是冷冰冰的机器,与人类相比,我感觉不到它对围棋的热情和热爱。对它而言…它的热情——也只不过是运转速度过快导致CPU发热罢了。

我会我用所有的热情去与它做最后的对决,不管面对再强大的对手——我也绝不会后退!至少这…最后一次…

拼尽全力后,无论结果…管他口中是是非非,来一首《沧海一声笑》..岂不美哉、快意?我淡然笑到…

不眠夜,且看且珍惜,请大家欣赏我最后的三盘人机大战。

相比于柯洁的心情复杂,阿法狗这边似乎显得颇为轻松。

DeepMind创始人兼CEO哈萨比斯,昨晚才抵达乌镇。而对于第二天一早就要打响的比赛,他的态度是:“我都等不及了”。

AlphaGo简介

如何进行训练?

一直以来,围棋就被认为是传统游戏中对人工智能最具挑战性的项目。这不仅仅是因为围棋包含了庞大的搜索空间,更是因为对于落子位置的评估难度已远远超过了简单的启发式算法。

为了应对围棋的巨大复杂性,AlphaGo采用了一种新颖的机器学习技术,结合了监督学习和强化学习的优势。通过训练形成一个策略网络(policy network),将棋盘上的局势作为输入信息,并对所有可行的落子位置生成一个概率分布。

然后,训练出一个价值网络(value network)对自我对弈进行预测,以 -1(对手的绝对胜利)到1(AlphaGo的绝对胜利)的标准,预测所有可行落子位置的结果。

这两个网络自身都十分强大,而 AlphaGo将这两种网络整合进基于概率的蒙特卡罗树搜索(MCTS)中,实现了它真正的优势。最后,新版的AlphaGo产生大量自我对弈棋局,为下一代版本提供了训练数据,此过程循环往复。

如何决定落子?

在获取棋局信息后,AlphaGo会根据策略网络探索哪个位置同时具备高潜在价值和高可能性,进而决定最佳落子位置。

在分配的搜索时间结束时,模拟过程中被系统最频繁考察的位置将成为AlphaGo的最终选择。在经过先期的全盘探索和过程中对最佳落子的不断揣摩后,AlphaGo的搜索算法就能在其计算能力之上加入近似人类的直觉判断。

【完】

本文作者:唐旭 若朴
原文发布时间: 2017-05-23
相关文章
|
5月前
|
物联网 容器
基于llama-factory的昇腾实战
基于llama-factory的昇腾全流程实践,包括环境的安装、推理部署、微调、动态Lora和对话。
基于llama-factory的昇腾实战
|
6月前
|
弹性计算 Kubernetes API
Kubernetes 驱动的 IaC,Crossplane 快速入门
Crossplane 是一个开源的 Kubernetes 扩展工具,允许用户通过声明式配置直接在 Kubernetes 中管理云资源。对于阿里云开发者,借助 Crossplane 和官方提供的 provider-upjet-alibabacloud,可以像管理 Pod 一样轻松操作 ECS 实例、VPC 和 OSS Bucket 等资源。本文介绍了 Crossplane 的核心概念,并通过快速入门指南演示了如何安装 Crossplane、配置阿里云认证并创建第一个 VPC 资源。
689 37
|
开发工具 git
git实操gitee
本文介绍了使用Git进行实际操作的步骤,包括连接远程Gitee仓库、拉取项目、修改项目后提交以及将更改推送到Gitee的命令和过程。
270 4
git实操gitee
|
数据安全/隐私保护
超级弱口令检查工具
超级弱口令工具在检测系统漏洞中的作用,包括如何使用和自定义设置。
2374 2
|
11月前
|
运维 网络安全 网络架构
IEPL与IPLC国际专线的区别介绍
IPLC(国际私有租用线路)和IEPL(国际以太网专线)均为企业提供跨国端到端的通信线路服务。IPLC基于SDH/DDN技术,提供专有带宽连接,支持多种业务传输,具备高可靠性和灵活性。IEPL则基于MSTP平台,采用GFP封装,提供以太网接口的增强型专线服务,具有更高的灵活性、安全性及成本效益,适合需要高带宽和低延迟的业务场景。两者主要区别在于技术基础、接口类型及成本结构。
2139 70
|
8月前
|
机器学习/深度学习 API
有效的思考:模型思考效率评测
随着大语言模型的迅速发展,模型的推理能力得到了显著提升。特别是长推理模型(Long Reasoning Models),如OpenAI的o1、DeepSeek-R1、QwQ-32B和Kimi K1.5等,因其展现出类似人类的深度思考能力而备受关注。这些模型通过长时间推理(Inference-Time Scaling),能够在解码阶段不断思考并尝试新的思路来得到正确的答案。
293 0
|
Linux 虚拟化 网络架构
Linux命令`arch`详解
`arch`命令在Linux中用于显示系统CPU架构,如x86_64、ARM等。它在跨平台编程、软件包管理和系统故障排除时很有用。通过`arch`,用户能得知系统运行的架构,但注意这可能与物理CPU架构不同,尤其是在虚拟环境中。在某些系统中,`arch`可能是`uname`命令的别名。了解CPU架构对有效管理系统至关重要。
|
12月前
|
设计模式 安全 Java
Java 多线程并发编程
Java多线程并发编程是指在Java程序中使用多个线程同时执行,以提高程序的运行效率和响应速度。通过合理管理和调度线程,可以充分利用多核处理器资源,实现高效的任务处理。本内容将介绍Java多线程的基础概念、实现方式及常见问题解决方法。
382 1
|
传感器 监控 物联网
PWM在物联网中的应用
PWM(脉冲宽度调制)在物联网中广泛应用,通过控制信号的占空比来调节设备的工作状态,如LED亮度、电机速度等,实现高效、精确的控制,常用于智能家居、工业自动化等领域。