文档备案控制台

开发者社区问答正文

机器学习的强化学习是什么？

机器学习的强化学习是什么？

展开

收起

鲁花花生油 2021-10-22 15:14:33 599 版权

来自：华章出版社

版权声明：本文内容由阿里云实名注册用户自发贡献，版权归原作者所有，阿里云开发者社区不拥有其著作权，亦不承担相应法律责任。具体规则请查看《阿里云开发者社区用户服务协议》和《阿里云开发者社区知识产权保护指引》。如果您发现本社区中有涉嫌抄袭的内容，填写侵权投诉表单进行举报，一经查实，本社区将立刻删除涉嫌侵权内容。

1 条回答

写回答

取消提交回答

松岛菜菜

在强化学习模式下，输入数据作为对模型的反馈，不像监督模型那样，输入数据仅仅是作为一个检查模型对错的方式，在强化学习下，输入数据直接反馈到模型，模型必须对此立刻做出调整。常见的应用场景包括动态系统以及机器人控制等。常见算法包括Q-Learning以及时间差学习（Temporal Difference Learning）。

2021-10-22 16:00:42

赞同展开评论

问答分类：

机器学习/深度学习

问答标签：

人工智能平台 PAI强化学习机器学习平台 PAI强化学习

问答地址：

开发者社区 > 华章出版社 > 问答

相关问答

机器学习PAI的 split和hitrate 怎么使用？

306

4

0

机器学习PAI 新用户有免费试用额度，过了就收费,没看到有教育版?

417

3

0

机器学习PAI测试集跟验证集怎么划分的？

498

3

0

请教一个机器学习PAI问题，我最近在看云小蜜faq的东西，easynlp里面是否有相关的算法呢？

232

2

0

机器学习PAI这是直接贴在maxcompute上就可以吗？

226

3

0

机器学习PAI的EasyRec主流支持的算法有哪些类别，每个类别下分别有哪些？

217

3

0

想问下机器学习PAI我几个worker的events最后没有合并到一起～这是什么原因导致的啊？

183

3

0

我遇到了一个机器学习PAI错误～但是怎么都没找到哪里的问题～可以麻烦帮忙看下吗？

178

1

0

机器学习PAI这个 filePath 如何写？

192

1

0

机器学习PAI的alink 有 web 管理界面的源码包吗？

279

1

0

收录在圈子:

华章出版社

709

+ 订阅

问答排行榜

最热

最新

【大咖问答】对话PostgreSQL 中国社区发起人之一，阿里云数据库高级专家德哥

据说在家办公的程序员是这样写代码的？

如何升级配置

【藏经阁一起读（27）】本周推荐《Apache Flink案例集（2022版）》，你有哪些心得？

【精品问答】python技术1000问(1)

QoderWork的Credit是如何计算的？固定Token量吗？如何查看我消耗了多少Token？

我用qoder 和 codex+deepseek 及claude + qwen 3.7同时解题目

阿里云服务器多少钱一年？支持40个连接的配置

阿里云服务器多少钱一年企业用？公司用什么配置？

阿里云服务器多少钱一年？企业用的配置费用价格

相关文章

为什么别人用 Jupyter 一天搞定数据分析，而你却越写越乱？

零工配送从业者定向网络钓鱼攻击机理与多层智能防御体系研究

面向对抗规避攻击的轻量化鲁棒钓鱼 URL 检测模型研究

4D Gaussian Splatting 是怎么工作的：从规范 Gaussian 到形变场的原理拆解

可回收垃圾目标检测数据集：5类别、13,000张图像 | 目标检测

还有其他疑问?