备案控制台

开发者社区问答正文

AI 的强化学习技术最常被引用的例子是什么？

已解决

AI 的强化学习技术最常被引用的例子是什么？

展开

收起

游客zvexcvxjsyxmm 2022-04-14 23:11:00 425 版权

来自：开发者社区官方技术圈

版权声明：本文内容由阿里云实名注册用户自发贡献，版权归原作者所有，阿里云开发者社区不拥有其著作权，亦不承担相应法律责任。具体规则请查看《阿里云开发者社区用户服务协议》和《阿里云开发者社区知识产权保护指引》。如果您发现本社区中有涉嫌抄袭的内容，填写侵权投诉表单进行举报，一经查实，本社区将立刻删除涉嫌侵权内容。

1 条回答

写回答

取消提交回答

答题百晓生

推荐回答

强化学习最常被引用的例子是 DeepMind 的 AlphaGo 系统。DeepMind 是 Alphabet（谷歌母公司）的子公司，创建了AlphaGo去玩中国古老的游戏—围棋。赢棋策略非常不透明，就连大师也总是不能说清楚他们为什么选择所做出的移子—他们说这些移子只是“觉得对”。围棋棋盘上棋子配置的可能性多过宇宙中的原子数量。要创建出能够理解这种复杂游戏中细微差别和微妙策略的机器，是一项巨大挑战。 AlphaGo 并没学习过游戏策略，它通过对很多场人类对人类的游戏开发出自己的策略。在 2016 年 3 月，AlphaGo 与得过 18 次世界冠军，也是世界上最好的（人类）围棋手李世石下棋。AlphaGo 以四比一打败了李世石。为了赢棋，AlphaGo 开发了几种新策略，这些策略与几百年来专业围棋手公认的智慧相悖。通过观察 AlphaGo 的策略，人类围棋手也完善了他们的棋法。

以上信息摘自《创新之巅：未来十年重构商业的六大战略性技术》，这本电子书收录于开发者藏经阁，下载地址：https://developer.aliyun.com/ebook/download/7469

2022-04-15 09:54:16

赞同展开评论

问答分类：

机器学习/深度学习人工智能

问答标签：

AI技术 AI引用 AI强化学习 AI强化学习技术

问答地址：

开发者社区 > 开发者社区官方技术圈 > 问答

相关问答

现代技术下的成都作为AI品茶一大强项，否具有自带工作室经验？

86

0

0

AI视频技术的发展是否会影响原创内容的价值？

3142

107

0

FFA 2024 大会门票免费送！AI时代下大数据技术未来路在何方？

2993

60

0

该平台如何体现AI技术在客服领域的应用？

124

1

0

语音AI技术在未来可能解锁的下一个场景是什么？

112

1

0

达摩院语音AI技术创新全景主要涵盖了哪些方面的研究和应用进展？

144

1

0

语音AI技术在未来可能解锁的下一个场景是什么？

80

1

0

达摩院语音AI技术创新全景主要涵盖了哪些方面的研究和应用进展？

85

1

0

AI加持的阿里云飞天大数据平台在技术上有哪些创新？

159

1

0

如何借助AI技术为NAS注入新活力？

1869

75

0

收录在圈子:

开发者社区官方技术圈

70113

+ 订阅

阿里云开发者社区官方技术圈，用户产品功能发布、用户反馈收集等。

问答排行榜

最热

最新

【大咖问答】对话PostgreSQL 中国社区发起人之一，阿里云数据库高级专家德哥

据说在家办公的程序员是这样写代码的？

阿里云开放端口权限

如何升级配置

【藏经阁一起读（27）】本周推荐《Apache Flink案例集（2022版）》，你有哪些心得？

阿里云4核8G云服务器多少钱？一年、1个月或1小时收费价格查询

如何用"乐高式开发"实现前后端分离？

阿里云今年有双十一优惠活动吗？2025年

阿里云短信服务工程师连我方发送记录只会收阿里云错误码都不知道吗？

普通人如何快速搭建个人网站呢？

相关文章

PHP从0到1实现 AI 智能体系统并且训练知识库资料

PHP 程序员如何为 AI 浏览器（如 ChatGPT Atlas）优化网站

【微笑讲堂】深度解析：Geo优化中的Schema标签，如何让你的内容在AI时代脱颖而出？

凌晨三点，你的眼睛还撑得住吗？——聊聊程序员「夜战」的真实成本！

2025数字人短视频工具TOP5榜单：从入门到进阶的必备神器

还有其他疑问?