开发者社区> 问答> 正文

AI 的强化学习技术最常被引用的例子是什么?

已解决

AI 的强化学习技术最常被引用的例子是什么?

展开
收起
游客zvexcvxjsyxmm 2022-04-14 23:11:00 382 0
1 条回答
写回答
取消 提交回答
  • 推荐回答

    强化学习最常被引用的例子是 DeepMind 的 AlphaGo 系统。DeepMind 是 Alphabet(谷歌母公司)的子公司,创建了AlphaGo去玩中国古老的游戏—围棋。 赢棋策略非常不透明,就连大师也总是不能说清楚他们为什么选择所做出的移 子—他们说这些移子只是“觉得对”。围棋棋盘上棋子配置的可能性多过宇宙 中的原子数量。要创建出能够理解这种复杂游戏中细微差别和微妙策略的机器, 是一项巨大挑战。 AlphaGo 并没学习过游戏策略,它通过对很多场人类对人类的游戏开发出自 己的策略。在 2016 年 3 月,AlphaGo 与得过 18 次世界冠军,也是世界上最好的 (人类)围棋手李世石下棋。AlphaGo 以四比一打败了李世石。为了赢棋,AlphaGo 开发了几种新策略,这些策略与几百年来专业围棋手公认的智慧相悖。通 过观察 AlphaGo 的策略,人类围棋手也完善了他们的棋法。

    以上信息摘自《创新之巅:未来十年重构商业的六大战略性技术》,这本电子书收录于开发者藏经阁,下载地址:https://developer.aliyun.com/ebook/download/7469

    2022-04-15 09:54:16
    赞同 展开评论 打赏
来源圈子
更多
收录在圈子:
阿里云开发者社区官方技术圈,用户产品功能发布、用户反馈收集等。
问答排行榜
最热
最新

相关电子书

更多
Lindorm AI 能力介绍 立即下载
2023云栖大会:PolarDB for AI 立即下载
2023云栖大会:Lindorm一站式AI数据平台实战 立即下载