产品
解决方案
文档与社区
权益中心
定价
云市场
合作伙伴
支持与服务
了解阿里云
备案
控制台
开发者社区
首页
探索云世界
探索云世界
云上快速入门,热门云上应用快速查找
了解更多
问产品
动手实践
考认证
TIANCHI大赛
活动广场
活动广场
丰富的线上&线下活动,深入探索云世界
任务中心
做任务,得社区积分和周边
高校计划
让每位学生受益于普惠算力
训练营
资深技术专家手把手带教
话题
畅聊无限,分享你的技术见解
开发者评测
最真实的开发者用云体验
乘风者计划
让创作激发创新
阿里云MVP
遇见技术追梦人
直播
技术交流,直击现场
下载
下载
海量开发者使用工具、手册,免费下载
镜像站
极速、全面、稳定、安全的开源镜像
技术资料
开发手册、白皮书、案例集等实战精华
插件
为开发者定制的Chrome浏览器插件
探索云世界
新手上云
云上应用构建
云上数据管理
云上探索人工智能
云计算
弹性计算
无影
存储
网络
倚天
云原生
容器
serverless
中间件
微服务
可观测
消息队列
数据库
关系型数据库
NoSQL数据库
数据仓库
数据管理工具
PolarDB开源
向量数据库
热门
Modelscope模型即服务
弹性计算
云原生
数据库
物联网
云效DevOps
龙蜥操作系统
平头哥
钉钉开放平台
大数据
大数据计算
实时数仓Hologres
实时计算Flink
E-MapReduce
DataWorks
Elasticsearch
机器学习平台PAI
智能搜索推荐
人工智能
机器学习平台PAI
视觉智能开放平台
智能语音交互
自然语言处理
多模态模型
pythonsdk
通用模型
开发与运维
云效DevOps
钉钉宜搭
支持服务
镜像站
码上公益
开发者社区
云计算
文章
正文
Eternal Sunshine of the spotless mind
2016-02-09
910
版权
版权声明:
本文内容由阿里云实名注册用户自发贡献,版权归原作者所有,阿里云开发者社区不拥有其著作权,亦不承担相应法律责任。具体规则请查看《
阿里云开发者社区用户服务协议
》和 《
阿里云开发者社区知识产权保护指引
》。如果您发现本社区中有涉嫌抄袭的内容,填写
侵权投诉表单
进行举报,一经查实,本社区将立刻删除涉嫌侵权内容。
简介:
美丽心灵的永恒阳光
美丽心灵的永恒阳光
胡昜
目录
相关文章
爱敲代码的小黄
|
5天前
|
Dart
B - MaratonIME challenges USPGameDev
B - MaratonIME challenges USPGameDev
爱敲代码的小黄
17
0
0
Libra爱吃鱼
|
机器学习/深度学习
算法
流计算
【读书笔记】Algorithms for Decision Making(6)
对于较大状态空间的问题,计算精确解需要极大的内存量,因而考虑近似解的方法。常使用approximate dynamic programming的方法去寻求近似解,进而使用在线方法实现实时计算。
Libra爱吃鱼
121
0
0
Libra爱吃鱼
|
机器学习/深度学习
API
【读书笔记】Algorithms for Decision Making(8)
解决存在模型不确定性的此类问题是强化学习领域的主题,这是这部分的重点。解决模型不确定性的几个挑战:首先,智能体必须仔细平衡环境探索和利用通过经验获得的知识。第二,在做出重要决策后很长时间内,可能会收到奖励,因此必须将以后奖励的学分分配给以前的决策。第三,智能体必须从有限的经验中进行概括。
Libra爱吃鱼
170
0
0
Libra爱吃鱼
|
机器学习/深度学习
算法
vr&ar
【读书笔记】Algorithms for Decision Making(9)
与基于模型的方法相比,无模型方法不需要构建转移函数和奖励函数的显性表示,而是直接作用于值函数建模。进一步地,考虑模拟学习来重建奖励函数。
Libra爱吃鱼
62
0
0
Libra爱吃鱼
|
vr&ar
【读书笔记】Algorithms for Decision Making(5)
此前讲述了在某个时间点做一个单一的决定的问题,但许多重要的问题需要做出一系列的决定。序列环境中的最佳决策需要对未来行动和观察序列进行推理。
Libra爱吃鱼
80
0
0
Libra爱吃鱼
|
人工智能
vr&ar
决策智能
【读书笔记】Algorithms for Decision Making(12)
现将单智能体的核心概念扩展到多智能体系统的问题。在该系统中,可将其他智能体建模为潜在的盟友或对手,并随着时间的推移进行相应的调整。
Libra爱吃鱼
98
0
0
Libra爱吃鱼
|
Python
【读书笔记】Algorithms for Decision Making(2)
理性决策需要对不确定性和目标进行推理。不确定性源于预测未来事件能力的实际及理论限制。为了实现其目标,一个强有力的决策系统必须考虑到当前世界状况和未来事件中的各种不确定性来源。
Libra爱吃鱼
99
0
0
Libra爱吃鱼
|
算法
机器人
【读书笔记】Algorithms for Decision Making(10)
在这一部分将不确定性扩展到状态。具体讲,接收到的观测值与状态只有概率关系,而不是精确地观察状态。此类问题可以建模为部分可观察的马尔可夫决策过程(POMDP),但POMDP很难以最佳方式解决所有问题,因而需要引入更多的近似策略。
Libra爱吃鱼
141
0
0
Libra爱吃鱼
|
算法
关系型数据库
数据建模
【读书笔记】Algorithms for Decision Making(4)
本部分讨论从数据学习或拟合模型参数的问题,进一步讨论了从数据中学习模型结构的方法,最后对决策理论进行了简单的概述。
Libra爱吃鱼
64
0
0
Libra爱吃鱼
|
机器学习/深度学习
人工智能
算法
【读书笔记】Algorithms for Decision Making(1)
我自己的粗浅看法:机器学习要不是拟合逼近(经常提及的machine learning),要不就是决策过程(reinforcement learning),这本书主要讲述后者的前世今生。
Libra爱吃鱼
277
0
0
热门文章
最新文章
1
袋鼠云数据中台专栏(五):数栈,企业级一站式数据中台PaaS
2
利用Serverless Kubernetes和Kaniko快速自动化构建容器镜像
3
阿里云oss收费标准
4
SpringBoot开发案例之整合Kafka实现消息队列
5
LINQ 图解
6
keepalived高可用LVS与Nginx
7
beyondhedefang的意义
8
v-on 指令
9
Java 8的一些常见用法
10
LLVM每日谈之十六 LLVM的学习感悟
1
构建高效可靠的微服务架构:后端开发的新趋势
20
2
Kubernetes 集群的监控与日志管理最佳实践
28
3
苹果app开发apple-app-site-association文件配置
17
4
阿里云MaxCompute携手华大基因打造精准医疗应用云平台,十万基因组计算成本降低至1000美金以内
37
5
构建高效自动化运维系统:DevOps与AI的融合
22
6
深入理解PHP中的命名空间
13
7
深度学习在图像识别中的应用及其挑战
17
8
提升软件测试效率:智能化测试工具的应用与展望
17
9
阿里云容器服务
28
10
为什么是容器编排技术
17
相关电子书
更多
7 Techniques to Handlr Imbalan
The 10 Statistical Techniques
Problem Solving Recipes Learne
下一篇
2024年阿里云免费云服务器及学生云服务器申请教程参考