围棋人机大战一周年:被AlphaGo改变的世界

简介:
本文来自AI新媒体量子位(QbitAI)

去年今日,三连败的李世乭扳回一局。

然而这一针兴奋剂很快失效,随后李世乭再折一阵,最终以1:4输给AlphaGo。在围棋的人机大战中,顶级人类选手完败给人工智能。

人工智能一战成名,李世乭留下落寞侧影。为AlphaGo落子的黄士杰一年后回忆说:“当时我代表AlphaGo下棋,必须保持冷静”。

从那时起到现在,人类始终生活在一个被AlphaGo改变的世界。

一年回望

站在围棋人机大战一周年的节点上,该如何回顾过去、展望未来呢?量子位先把几个问题抛给创新工场AI工程院副院长王咏刚。

量子位:一年后再看AlphaGo有何改变?有什么记忆犹新的片段?

王咏刚:AlphaGo出世一年,其实进入大家视野的是三个版本:5:0击败樊麾的内测版本,4:1击败李世石的版本,以Master网名60:0快棋挑落中日韩高手的版本。三个版本演进脉络明显,每次迭代都有重大升级。

最震撼的是计算机在人类传统认为极其玄妙的、电脑无法掌握的“大局观”上突飞猛进,远远将人类选手甩在身后。电脑计算“大局观”的方式,和人类培养“大局观”的思路,有根本的差别。人类没可能在这方面赶上电脑。

和樊麾对局的棋谱基本上还看不出AlphaGo的大局观有多强,和李世石对局就下出了聂卫平赞不绝口的五路肩冲,到了Master的60局,大局观体现在两个地方:

1)从始至终对局势的把握,比如第60局古力用AlphaGo的思路对付AlphaGo,把中央撑得很满,但AlphaGo不紧不慢,总是恰到好处地保持胜势。

2)已经深刻影响人类对布局的思考,大飞守角之类的变化迅速被人类棋手模仿,这和当年深蓝问世后,国际象棋的布局革命是一样的。

量子位:过去一年,有什么具体产品或研究,是基于AlphaGo的么?

王咏刚:AlphaGo用的是AI领域应用非常普遍的算法:深度学习、蒙特卡洛算法、增强学习等。

从概念上可以说,机器视觉相关的深度学习技术,包含环境-决策-反馈的智能系统,里面都有AlphaGo的影子。当然,直接的代码实现层面,肯定没有复制、粘贴这样直接借用的关系,因为AlphaGo的深度学习模型毕竟是围绕围棋的特征建立的。

DeepMind去年发布的读唇术LipNet,与英国国家医疗服务体系NHS合作推出的医疗辅助应用Streams,与眼科医院合作帮助眼部疾病诊断等等,可以说都是与AlphaGo同源的技术。

量子位:AlphaGo是否已经攻克围棋?未来可提升的空间还有哪些?

王咏刚:“攻克围棋”,如果说战胜人类选手的话,AlphaGo已经实现了,而且现在“绝艺”,DeepZen之类的程序对人类胜率也很高了。

未来最多三年必将发生的是,手机上的本地APP就可以战胜人类职业高手,现在热闹的网上围棋对弈平台都会死掉(因为对手可以轻易用手机作弊),人类围棋将回归现场竞赛,围棋培训讲师将更重视普及教育,因为中高级的提高训练完全可以用机器代练。

不过,如果说“攻克围棋”是像计算机可以穷举西洋跳棋的所有变化那样,让电脑成为围棋“上帝”,这个应该还不大可能。现在AI大部分的招数,还在人类高手可以理解的范畴内。AI也有一些可疑的“弱点”,比如官子水平到底如何等等。

以后AI和AI之间的竞赛,应该会不断促进AI提高(但这种没有太多商业利益的事情,有没有持续投入是个问题)。人类应该望尘莫及,但可以不断从AI中学习新的思想。

不止下棋

“AlphaGo给大家最大启发,不是赢棋,而是如何构建一个智商超过300的机器”,HTC负责研发及医疗的总裁、原Google中国工程院副院长张智威说。

构建的方法有两个:一是训练、二是数据。张智威最近在清华的一次分享(传送门)中说,“如果能做好这件事,各位都是亿万富翁。最近两年,我们每天都在想,哪些领域可以拿到无限的数据”。


而在AAAI Fellow、IEEE Fellow、香港科技大学杨强教授看来,DeepMind在创造AlphaGo的过程中,引入一个新的概念:利用深度学习+强化学习,来判断现状和预测未来。这与未来的商业模式有着明确的关联:

通过对大数据的分析,对现实的判断和对商业未来走向进行预估。

杨强还试图基于AlphaGo归纳出一套人工智能的应用流程:算法的目标是什么?有没有数据?数据在哪里?问题的边界是否清晰?什么叫合理的走法、什么叫犯规的走法?你的特征在哪里?又如何得到这些特征?是否可以得到一个持续的反馈?

但也有人沿着另一条路前进。

围棋也好、国际象棋也好、国际跳棋也好,所有这些都是完美信息博弈。现实世界中,不完美信息才是常态,各种看不见的隐藏信息产生了大量的不确定性,而德州扑克代表的就是这种类型的博弈。

今年初,在德州扑克的人机大战中,人工智能Libratus击败了四位顶级人类玩家。创造了这个AI的卡内基梅隆大学Sandholm教授说,能够处理不完美信息的AI,未来可以用于商业谈判、网络安全、医疗方案制定等领域。

人工智能发展的终极目标,是通用人工智能(AGI)。通用人工智能可以解决任何一个问题。想要实现AGI就得让人工智能学会解决不确定性问题,这也是德州扑克人机大战的重大意义之一。

对于已届不惑的Demis Hassabis来说,创立DeepMind的目标绝不仅限于创造AlphaGo。过去的一年里,DeepMind还搞出了很多有意思的创新。

比方说可以模拟任意一种人类声音的WaveNet;以及与英国国家医疗服务体系合作,使用人工智能来改善医疗行业等。

继续战斗

过去的一年里,仅仅在围棋界,出彩的人工智能就不止AlphaGo一家。比方说量子位此前报道过的首个围棋十段:腾讯绝艺(传送门),就是一个AI。

而对于AlphaGo来说,挑战也还没结束。

现在的围棋江湖里,中日韩三强中,无疑中国军团占据了绝对的优势。刚刚结束的第18届农心杯三国围棋擂台赛上,中国队仅上场两位选手,就将日韩两队悉数全灭。连笑、柁嘉熹、柯洁等重量级棋手尚未登场,就已经拿下冠军。

不在正式场合对阵世界排名第一的柯洁,对于AlphaGo来说始终不够完美。去年AlphaGo挑战李世乭前,各方还就谁赢谁输打赌。

当时《连线》记者在报道中描述道:

一位名叫周峰的中国记者在观战室拦下了我,开心地和我这种将AlphaGo视为科技奇迹而非围棋杀手的人进行对话。

但是当我询问看见李世石输了比赛他作何感想时,他指着心口说:“我很难过。”

四月,新的人机大战又要启幕了。

量子位很想问问,如果柯洁这次也输给AlphaGo,周峰还会特别难过么?

这一次,在人工智能和人类顶级高手之间,你觉得谁会赢呢?

“我们不关心输赢。输赢其实不用看的,AI想赢它就肯定能赢”,云从CEO周曦说,“关键问题是AlphaGo会不会有些新的想法”。

好戏又要上演,而未来的人机大战,势必不止于围棋。

插播广告

还有个大新闻:《马云爸爸神秘计划曝光,组建新团队研发人工智能》

详情见量子位微信公众号(ID:QbitAI)今日推送的二条。

本文作者:舒石、若朴 
原文发布时间:2017-03-13
相关文章
|
3月前
|
文字识别 数据可视化 算法
基于 YOLOv8 的智能车牌定位检测系统设计与实现—从模型训练到 PyQt 可视化落地的完整实战方案
本项目基于YOLOv8实现智能车牌定位检测,涵盖数据处理、模型训练、评估优化及PyQt5可视化界面开发,支持图片、视频、摄像头实时检测。系统精度高、响应快,提供完整代码与预训练模型,适合毕设、课程设计及二次开发,助力智慧交通应用落地。(238字)
296 7
基于 YOLOv8 的智能车牌定位检测系统设计与实现—从模型训练到 PyQt 可视化落地的完整实战方案
|
3月前
|
存储 人工智能 关系型数据库
告别数据库“膨胀”:Dify x SLS 构建高可用生产级 AI 架构
告别数据库“膨胀”!借助SLS打造高可用生产级的Dify日志场景,通过将工作流日志从PostgreSQL迁移至SLS,实现存储压力降低95%+、成本下降近10倍,并支持实时分析、监控告警与数据闭环,彻底解决高并发下的连接池打满、慢查询频发等痛点,助力AI应用高效稳定运行!
|
3月前
|
人工智能 自然语言处理 供应链
2025盘点:8类RPA机器人,从值守型到智能型全解析
RPA机器人正重塑企业数字化转型,作为“数字员工”广泛应用于财务、政务、医疗、电商等领域。从有人值守的桌面助手到AI增强型智能体,RPA通过自动化重复任务,提升效率、降低错误率。2024年中国市场规模达67.9亿元,同比增长35.8%。未来,RPA将融合AI技术,迈向智能决策,成为企业提效降本的核心工具。
673 1
|
JSON JavaScript 小程序
关于HBuilderX的简单介绍
关于HBuilderX的简单介绍
4119 0
|
3月前
|
监控 Java Serverless
1TB数据,ES却收到了2TB?揪出那个客户端中的“隐形复读机”
揭秘日志服务中的“隐形复读机”:客户端因非抢先认证导致数据重复发送,带宽消耗翻倍。通过优化鉴权配置或使用Serverless监控,可轻松定位并节省50%流量成本。
351 4
|
6月前
|
消息中间件 存储 运维
嘉银科技基于阿里云 Kafka Serverless 提升业务弹性能力,节省成本超过 20%
云消息队列 Kafka 版 Serverless 系列凭借其秒级弹性扩展、按需付费、轻运维的优势,助力嘉银科技业务系统实现灵活扩缩容,在业务效率和成本优化上持续取得突破,保证服务的敏捷性和稳定性,并节省超过 20% 的成本。
405 43
|
9月前
|
JSON 前端开发 API
deepseek0528发布
DeepSeek-R1-0528 是 DeepSeek 团队于 2025 年发布的 R1 推理大模型升级版,虽定位为“小版本试升级”,但表现远超预期。其在数学推理(AIME 测试准确率提升至 87.5%)、编程能力(接近 OpenAI o3 水平,可生成 1000+ 行无 bug 代码)、长文本处理(支持 128K tokens)及写作质量等方面均有显著提升。此外,新增 Function Calling 和 JSON 输出功能,便于开发者集成。用户可通过 Ollama 本地部署或访问 https://chat.deepseek.com/ 在线体验满血版。
|
机器学习/深度学习 传感器 自动驾驶
基于深度学习的图像识别技术及其在自动驾驶中的应用####
本文深入探讨了深度学习驱动下的图像识别技术,特别是在自动驾驶领域的革新应用。不同于传统摘要的概述方式,本节将直接以“深度学习”与“图像识别”的技术融合为起点,简述其在提升自动驾驶系统环境感知能力方面的核心作用,随后快速过渡到自动驾驶的具体应用场景,强调这一技术组合如何成为推动自动驾驶从实验室走向市场的关键力量。 ####
412 24
|
Web App开发 前端开发 安全
语音交友app系统源码功能及技术研发流程剖析
语音交友App核心功能包括语音聊天(一对一、群聊、语音消息)、语音房间(直播、主题房、管理)、社交互动(好友、关注、打赏)、内容发现、音效美化、通知提醒及安全隐私等。开发流程涵盖需求分析、技术选型(前端、后端、数据库、实时通信)、UI/UX设计、前后端开发、实时通信集成、音效处理、测试优化、部署上线及运营维护,确保稳定高效运行并持续优化用户体验。
|
运维 负载均衡 监控
深入探索微服务架构下的服务治理
深入探索微服务架构下的服务治理
234 1