全球名校AI课程库(17)| Stanford斯坦福 · 强化学习课程『Reinforcement Learning』

简介: 课程为强化学习领域提供了坚实的介绍。通过讲座、书面和编码作业的结合,学生将精通强化学习的关键思想和技术。
CS234; Reinforcement Learning; 强化学习
🏆 课程学习中心 | 🚧 强化学习课程合辑 | 🌍 课程主页 | 📺 中英字幕视频 | 🚀 项目代码解析


课程介绍

要实现人工智能的梦想和影响,需要学会做出正确决策的自主系统。强化学习是这样做的一个强大范例,它与大量任务相关,包括机器人技术、游戏、消费者建模和医疗保健。

CS234; Reinforcement Learning; 强化学习

CS234是顶级院校斯坦福出品的强化学习方向专业课程,为强化学习领域提供坚实的介绍。学生将学习核心挑战和方法,包括概括和探索。

通过讲座、书面和编码作业的结合,学生将精通RL的关键思想和技术。作业将包括强化学习的基础知识以及深度强化学习——这是一个将深度学习技术与强化学习相结合的非常有前途的新领域。

CS234; Reinforcement Learning; 强化学习

课程讲师 Emma Brunskill,斯坦福计算机科学系副教授,卡内基梅隆大学的助理教授。专注于创建人工智能系统——从少量样本中学习,在医疗保健和教育领域稳健地做出良好决策。

CS234; Reinforcement Learning; 强化学习

根据视频内容整理的这份『CS234 课程结构图解』,展示了内容要点及其逻辑关系,超级直观!相信对构建 Whole Picture 特别有帮助~


课程主题

CS234 对于强化学习初步到构建全局认知有很大帮助。

  • Introduction to Reinforcement Learning(强化学习介绍
  • Tabular MDP planning(表格型马尔科夫决策
  • Tabular RL policy evaluation(表格型强化学习策略评估
  • Q-learning(Q学习
  • RL with function approximation(基于函数估计的强化学习
  • Policy search(策略搜索
  • Fast Learning(快速学习
  • Batch Reinforcement Learning(批强化学习
  • Monte Carlo Tree Search(蒙特卡洛树搜索


课程资料 | 下载

CS234; Reinforcement Learning; 强化学习

扫描上方图片二维码,关注公众号并回复关键字 🎯『CS234』,就可以获取整理完整的资料合辑啦!当然也可以点击 🎯 这里 查看更多课程的资料获取方式!

CS234; Reinforcement Learning; 强化学习
CS234; Reinforcement Learning; 强化学习

ShowMeAI 对课程资料进行了梳理,整理成这份完备且清晰的资料包:

  • 📚 课件(PDF)。Lecture 1~16(官方未发布第14章的视频和课件)。
  • 📚 笔记(PDF)。Note 1~14(部分笔记对应2章内容)。
  • 📚 作业及参考解答(PDF)。Assignment 1~3 作业、代码和答案。


课程视频 | B站

🌍 B站 | 【双语字幕+资料下载】斯坦福CS234 | 强化学习(2019·全16讲)

ShowMeAI 将视频上传至B站,并增加了中英双语字幕,以提供更加友好的学习体验。点击页面视频,可以进行预览。推荐前往 👆 B站 观看完整课程视频哦!


全球名校AI课程合辑

作者ShowMeAI内容团队
阅读原文https://www.showmeai.tech/article-detail/347

e9190f41b8de4af38c8a1a0c96f0513b~tplv-k3u1fbpfcp-zoom-1.image

目录
打赏
0
0
1
0
2388
分享
相关文章
QwQ-32B为襄阳职业技术学院拥抱强化学习的AI力量
信息技术学院大数据专业学生团队与UNHub平台合作,利用QwQ-32B模型开启AI教育新范式。通过强化学习驱动,构建职业教育智能化实践平台,支持从算法开发到应用的全链路教学。QwQ-32B具备320亿参数,优化数学、编程及复杂逻辑任务处理能力,提供智能教学助手、科研加速器和产教融合桥梁等应用场景,推动职业教育模式创新。项目已进入关键训练阶段,计划于2025年夏季上线公测。
33 10
QwQ-32B为襄阳职业技术学院拥抱强化学习的AI力量
Smolagents:三行代码就能开发 AI 智能体,Hugging Face 开源轻量级 Agent 构建库
Smolagents 是 Hugging Face 推出的轻量级开源库,旨在简化智能代理的构建过程,支持多种大语言模型集成和代码执行代理功能。
351 69
Smolagents:三行代码就能开发 AI 智能体,Hugging Face 开源轻量级 Agent 构建库
OctoTools:斯坦福开源AI推理神器!16项测试准确率碾压GPT-4o,一键搞定复杂任务
OctoTools 是斯坦福大学推出的开源智能体框架,通过标准化工具卡片和自动化工具集优化算法,显著提升复杂推理任务的解决效率,支持多领域应用。
61 3
OctoTools:斯坦福开源AI推理神器!16项测试准确率碾压GPT-4o,一键搞定复杂任务
Collaborative Gym:斯坦福人机协作框架开源!异步交互+三方感知,让你的AI学会主动补位
介绍Collaborative Gym,一个专注于人机协作的框架,支持异步交互和多种任务环境。
67 14
Collaborative Gym:斯坦福人机协作框架开源!异步交互+三方感知,让你的AI学会主动补位
使用通义灵码AI高效学习muduo网络库开发指南
Muduo 是一个基于 C++11 的高性能网络库,支持多线程和事件驱动,适用于构建高效的服务器和应用程序。它提供 TCP/IP 协议支持、异步非阻塞 I/O、定时器、异步日志等功能,并具备跨平台特性。通过 Git 克隆 muduo 仓库并切换至 C++17 分支可开始使用。借助 AI 工具如 Deepseak-v3,用户可以更便捷地学习和理解 Muduo 的核心模块及编写测试用例,提升开发效率。
斯坦福伯克利重磅发现DNA Scaling Law,Evo荣登Science封面!AI设计DNA/RNA/蛋白质再突破
近日,斯坦福大学和加州大学伯克利分校在《科学》杂志发表重要成果,发现DNA Scaling Law规律,揭示了DNA、RNA和蛋白质分子长度与碱基对数量之间的比例关系。该研究为AI设计生物分子带来突破,通过数据收集、模型训练和优化设计等步骤,显著提高设计效率和准确性,降低成本,并拓展应用范围。论文地址:https://www.science.org/doi/10.1126/science.ado9336。
73 26
微软开源课程!21节课程教你开发生成式 AI 应用所需了解的一切
微软推出的生成式 AI 入门课程,涵盖 21 节课程,帮助开发者快速掌握生成式 AI 应用开发,支持 Python 和 TypeScript 代码示例。
386 15
AI Dev Gallery:微软开源 Windows AI 模型本地运行工具包和示例库,助理开发者快速集成 AI 功能
微软推出的AI Dev Gallery,为Windows开发者提供开源AI工具包和示例库,支持本地运行AI模型,提升开发效率。
125 13
PolarDB-PG AI最佳实践 2 :PolarDB AI X EAS实现自定义库内模型推理最佳实践
PolarDB通过POLAR_AI插件支持使用SQL调用AI/ML模型,无需专业AI知识或额外部署环境。结合阿里云EAS在线模型服务,可轻松部署自定义模型,在SQL中实现如文本翻译等功能。
新年课程开启:手把手教学,0基础5次课程学会搭建无限拓展的AI应用
你是否想过自己也能动手搭建一个AI应用?现在,这个目标触手可及!
134 9

热门文章

最新文章