人工智能新算法DeepStack挑战扑克 完美“碾压”人类智商

简介:

被称为DeepStack的、会玩扑克的人工智能系统,其背后研究人员表示,这是第一个在单挑无限模式下战胜人类职业扑克玩家的算法。这个说法如果属实,将标志着人工智能系统发展的一个重要里程碑。

 人工智能是否通过了新的里程碑?研究人员表示它击败了人类扑克玩家

击败人类职业扑克玩家不同于人工智能过去在智力竞赛节目Jeopardy或者围棋等游戏中战胜人类对手的成功,因为每个玩家都只能掌握游戏状态不完整的一部分,并需要一个导航战术程序,例如基于不对称的信息虚张声势。

DeepStack是University of Alberta和两所捷克大学的研究人员合作的成果,他们在一份新的非同行评审的论文中表示,这是“第一个在单挑无限模式下战胜人类职业扑克玩家的计算机程序。”

新的一页已经展开,卡内基梅隆大学竞技性人工智能扑克团队的研究人员宣布将进行一场由他们的系统和四位职业人类扑克玩家——Jason Les、Dong Kim、Daniel McAulay和Jimmy Chou的对抗赛,这四个人类职业玩家加在一起将在20天内和Libratus玩120,000手单挑无限德州扑克。

Libratus是卡内基梅隆大学开发的Claudico的继任者,它在2015年和同样四位玩家对抗,在超过8万手牌后失利。微软研究院为这场比赛捐赠了10万美元的奖池。

虽然Claudico和DeepStack使用一种称为“反事实遗憾最小化”的技术通过卡片游戏策略进行推理,但DeepStack的制造商说,它的系统“采用了一种完全不同的方法”来处理信息不对称,包括在决定保留哪张牌的时候模拟“直觉”。

Libratus和DeepStack都被描述为使用新奇的方法来实现纳什均衡,卡内基梅隆大学将其定义为“一对战略,每个玩家,只要一个玩家的策略保持不变,就不会有玩家因为改变战略受益。”

DeepStack的研究人员写道,“DeepStack算法试图在这个游戏中计算和使用游戏的低利用率策略,即求解一个近似的Nash均衡。只有在游戏中实际出现的公共树的状态时,DeepStack在游戏过程中计算这个策略。本地计算的能力限制了DeepStack在游戏中推理能力,如果不将游戏中的10项权力抽象的160个决策点减少为14项权力,计算的量对于现有的算法来说就太大了。”

DeepStack接受了来自国际扑克联盟(International Federation of Poker)的33名职业扑克玩家的评估。每个参与者被要求在一个月内参加3000场比赛。

DeepStack研究人员写道,“33位职业玩家总共参加了44,852场比赛,11位玩家完成了所要求的3000场比赛。在所有的比赛中,DeepStack赢得了492 mbb / g(每场比赛的超大盲注)。从零开始有四个标准背离,因此非常引人注目。”

卡内基梅隆大学表示,Libratus采用更快的方法来找到纳什均衡,以及开发更好的终结策略,这是由匹兹堡超级计算中心的Bridges超级计算机支撑实现的。

Sandholm表示,“我们正在疯狂推动超级计算机。”Sandholm表示,Libratus使用了1500万个核心小时的计算,而Claudico只有300万个。

卡内基梅隆大学的比赛今天上午11点在Pittsburgh Rivers Casino开始,将在晚上7点左右结束


原文发布时间为: 2017年1月12日

本文作者:孙博 

本文来自云栖社区合作伙伴至顶网,了解相关信息可以关注至顶网。

相关文章
|
微服务
微服务迁移模式之Martin Flower绞杀者模式
绞杀者模式(Strangler Pattern)是一种非常流行的从单体系统向微服务迁移的策略,其主张通过用新服务替换特定功能来将单体系统逐步转换为微服务,一旦新服务已经能够代替原有旧有功能,就将原有功能组件绞杀(即彻底停用)。
2865 1
微服务迁移模式之Martin Flower绞杀者模式
|
10月前
|
敏捷开发 开发框架 小程序
微信纯血鸿蒙版正式发布,295天走完微信14年技术之路!
不管外界如何评价和鞭策,这款产品本身,依然需要研发团队一个键一个键敲出来,从内核,到架构,到内测,到公测,再到一轮一轮的 debug,他们要在不到一年的时间里,走完微信14 年的路。 回顾鹅厂所做过的产品里,也许从未有过一款,被如此放在放大镜下凝视。每一次上架,每一个 bug,乃至于每一个里程碑,几乎都预定当天热搜。
499 6
微信纯血鸿蒙版正式发布,295天走完微信14年技术之路!
|
编解码 移动开发 人工智能
android游戏源码
android游戏源码
389 0
|
存储 缓存 监控
【嵌入式SD NAND】基于FATFS/Littlefs文件系统的日志框架实现
综上所述,构建一个基于FATFS/Littlefs文件系统的日志框架需要对文件系统的操作有深入理解,并以此为基础设计一套完整的日志处理机制。这样的框架不仅能够确保日志数据的完整性和系统的鲁棒性,同时还能够满足嵌入式系统对于性能和资源使用的严格要求。
611 4
|
前端开发 JavaScript 机器人
体验服务器搭建青龙面板实操报告
5813人阅读 目录 1、准备工作 2、青龙面板搭建及拉库 3、安装go等环境 4、安装XDD-PLUS及配置 5、其他
|
弹性计算 Shell 数据安全/隐私保护
动态管理Docker容器的自动扩展与缩减
【4月更文挑战第30天】
258 0
|
人工智能 机器人
【好玩AI】【Prompt】情人节了,用GPT写个【骂醒恋爱脑】的机器人跟自己对话吧
【好玩AI】【Prompt】情人节了,用GPT写个【骂醒恋爱脑】的机器人跟自己对话吧
681 0
|
Web App开发 应用服务中间件 Linux
Nginx的深思:如何优雅告知用户,网站正在升级维护?
对的,我升级Lv3了,这是对自己坚持写作1年多的认可与鼓励,难掩心中的开心,我就去发了个掘金沸点,纪念下这个时刻,然后就继续工作了。 中午12点出去吃完饭回到座位后,再次打开掘金首页,哎呀,访问不了了,提示如下:
|
设计模式 算法 Java
设计模式最佳实践探索—策略模式
根据不同的应用场景与意图,设计模式主要分为创建型模式、结构型模式和行为型模式三类。本文主要探索行为型模式中的策略模式如何更好地应用于实践中。
698 0
设计模式最佳实践探索—策略模式