博弈论 斯坦福game theory stanford week 4.1_

简介: title: 博弈论 斯坦福game theory stanford week 4-1tags: notenotebook: 6- 英文课程-15-game theory---博弈论 斯坦福game theory stanford week 4-1最后通牒式议价他的形式是这样的,一个博弈者向另外一个博弈者提供一个价格,另一个决策者选择是否接受,如果不接受那么两个人将会什么都得不到。

title: 博弈论 斯坦福game theory stanford week 4-1
tags: note
notebook: 6- 英文课程-15-game theory
---

博弈论 斯坦福game theory stanford week 4-1

最后通牒式议价

他的形式是这样的,一个博弈者向另外一个博弈者提供一个价格,另一个决策者选择是否接受,如果不接受那么两个人将会什么都得不到。

如果接受,那么1得到10-x,2得到x

img_14f4576865f5e8a623f19f0ed016be9d.png

在上述条件下,我们可以推论玩家2可能会接受所有的可能的x,如果玩家1让x=0,他都有可能会接受。在这样的条件下,玩家1会不会接受0主要取决于玩家2会不会接受0.

但是在实际的博弈中并非是这样的,更多的人愿意选择和接受5

子游戏的完美性也许有时候并不适应整个的现实,但是他会帮助我们深入的理解博弈的本质。

有些的情况是十分难以解决的:比如下棋。并且我们很难相信人类是完全通过逻辑来解决下期问题的。这需要经验和灵感。

不完全信息博弈

我们考虑扑克游戏,在玩扑克游戏的时候,人们相互之间进行博弈,但是他们每个人都不能掌握完整的信息。

在扑克中:

我们有很多不同的手牌

有很多不同的策略

并且我们很难通过画出树状图的形式来描述这个游戏,我们对于这种游戏可以学习很多。

不完整信息形式--定义和策略

我们之前分析的情况是每个人都知道其他人的选择,我们使用树形结构来对这些情况进行描写。但是在我们之前讨论的棋牌游戏中,我们无法知道别人可以进行的选择。所以我们定义不完整信息博弈的情况如下。

img_0a912589a12f471be7dd2d2586ca8263.png

可以看到,定义和之前的很像。

我们举个例子:

img_9027a83f49c21fef78c618f8496010c0.png

在这样的博弈中,我们看到博弈者1有两个选择节点。由于他的信息并不能提前得到,因此他在第二次选择的时候只能选择一种情况。l 和 r。

因此博弈者一只有四种选择的可能分别是:

Ll,Lr,Rl,Rr

同样的我们可以用这种形式描述任何的一般形式的博弈。

比如我们之前用过的TCP问题。

不完整信息问题的纯策略

和之前的方法相同,我们可以为所有的博弈找到他们的纯策略。

混合策略和纯策略都可以用原来的定义进行描述,

在这样的情况下,我们可以定义将一个深度很高的树,转化为一个很宽的树,同样的我们可以将一个很宽的树转化成一个深度很高的树。

混合的和行为性的策略

我们在解决不完整信息博弈问题中有两种主要的策略,一种是混合策略,一种是行为策略。

混合策略是随机使用所有的纯策略

行为策略,还是用这个博弈作为例子,我们来看下行为策略是什么样的。

行为策略这样描述,选择A的概率是0.5,选择G的概率是0.3。

混合策略是这样的:0.6选择(AG),0.4选择GH。

看起来这两种策略的形式十分的相似,可以进行相互的转化,

回顾

img_541fa0c84d936f3581f253ec7372e765.png

在这样的一个博弈中,我们有以下几点可以得到:

  1. 博弈者2的D是一个占优策略
  2. LR这个博弈是一个十分的有优势的博弈,但是在混合策略中不能得到。

那么在行为策略中的均衡在哪里呢?

同样的,我们可以知道,D是占优的。如果我们使用行为策略,我们可以使用列方程的形式进行衡量。

img_a5e7f05347157f781b33357dbb1d3961.png

可以接触

非完整信息博弈的解决

在不完整信息博弈中可能没有合适的子问题,不过我们可以进行推理。

img_3c558f9e73db6cdb6b93bc2e2e8ca99b.png

在这样的问题中,我们带入如下的情景:

  • 有一家公司想要进入某一领域和另外一家公司竞争。
  • 第一个N节点代表他是否强于另外一家公司。
  • 第一家公司会选择是否进入这个领域,接下来原来这个领域的公司会选择是否会与之竞争。

我们分析,无论公司是强是弱,他选择进入领域,如果他的对手与之争斗他都会遭到损失,在这样的情况下,他不会选择进入这个领域,所以在这个情景内。公司不会进入这个领域。

因此均衡出现在:

img_bf3519962fbdf93dc6671d007cbc4b64.png

这个条件下。

但是如果我们这样考虑,考虑公司2的选择,他选择与之竞争一定会造成损失。那么他如果选择接受呢?

如果新的公司是强大的,那么他会选择进入,因为这有更大的收益,如果不强大,那么他会选择不进入。

这是另外一个纳什均衡。

序列均衡和完美贝叶斯均衡

人们在很多情况是根据他们的估计和信念进行选择的。就像前面的博弈,有两个纳什均衡,但是具体会走向那个纳什均衡,要看他么之间的估计和信念。

相关文章
|
11天前
|
人工智能 自然语言处理 监控
OpenClaw skills重构量化交易逻辑:部署+AI全自动炒股指南(2026终极版)
2026年,AI Agent领域最震撼的突破来自OpenClaw(原Clawdbot)——这个能自主规划、执行任务的智能体,用50美元启动资金创造了48小时滚雪球至2980美元的奇迹,收益率高达5860%。其核心逻辑堪称教科书级:每10分钟扫描Polymarket近千个预测市场,借助Claude API深度推理,交叉验证NOAA天气数据、体育伤病报告、加密货币链上情绪等多维度信息,捕捉8%以上的定价偏差,再通过凯利准则将单仓位严格控制在总资金6%以内,实现低风险高频套利。
5535 49
|
29天前
|
人工智能 自然语言处理 Shell
🦞 如何在 OpenClaw (Clawdbot/Moltbot) 配置阿里云百炼 API
本教程指导用户在开源AI助手Clawdbot中集成阿里云百炼API,涵盖安装Clawdbot、获取百炼API Key、配置环境变量与模型参数、验证调用等完整流程,支持Qwen3-max thinking (Qwen3-Max-2026-01-23)/Qwen - Plus等主流模型,助力本地化智能自动化。
40208 156
🦞 如何在 OpenClaw (Clawdbot/Moltbot) 配置阿里云百炼 API
|
7天前
|
存储 人工智能 负载均衡
阿里云OpenClaw多Agent实战宝典:从极速部署到AI团队搭建,一个人=一支高效军团
在AI自动化时代,单一Agent的“全能模式”早已无法满足复杂任务需求——记忆臃肿导致响应迟缓、上下文污染引发逻辑冲突、无关信息加载造成Token浪费,这些痛点让OpenClaw的潜力大打折扣。而多Agent架构的出现,彻底改变了这一现状:通过“单Gateway+多分身”模式,让一个Bot在不同场景下切换独立“大脑”,如同组建一支分工明确的AI团队,实现创意、写作、编码、数据分析等任务的高效协同。
2111 25
|
3天前
|
人工智能 JavaScript API
2026年Windows系统本地部署OpenClaw指南:附阿里云简易部署OpenClaw方案,零技术基础也能玩转AI助手
在AI办公自动化全面普及的2026年,OpenClaw(原Clawdbot、Moltbot)凭借“自然语言指令操控、多任务自动化执行、多工具无缝集成”的核心优势,成为个人与轻量办公群体打造专属AI助手的首选。它彻底打破了传统AI“只会对话不会执行”的局限——“手”可读写本地文件、执行代码、操控命令行,“脚”能联网搜索、访问网页并分析内容,“大脑”则可灵活接入通义千问、OpenAI等云端API,或利用本地GPU运行模型,真正实现“聊天框里办大事”。
803 1
|
6天前
|
人工智能 自然语言处理 安全
2026年OpenClaw Skills安装指南:Top20必装清单+阿里云上部署实操(附代码命令)
OpenClaw(原Clawdbot)的强大之处,不仅在于其开源免费的AI执行引擎核心,更在于其庞大的Skills生态——截至2026年2月,官方技能市场ClawHub已收录1700+各类技能插件,覆盖办公自动化、智能交互、生活服务等全场景。但对新手而言,面对海量技能往往无从下手,盲目安装不仅导致功能冗余,还可能引发权限冲突与安全风险。
1053 8
|
24天前
|
人工智能 安全 机器人
OpenClaw(原 Clawdbot)钉钉对接保姆级教程 手把手教你打造自己的 AI 助手
OpenClaw(原Clawdbot)是一款开源本地AI助手,支持钉钉、飞书等多平台接入。本教程手把手指导Linux下部署与钉钉机器人对接,涵盖环境配置、模型选择(如Qwen)、权限设置及调试,助你快速打造私有、安全、高权限的专属AI助理。(239字)
9295 25
OpenClaw(原 Clawdbot)钉钉对接保姆级教程 手把手教你打造自己的 AI 助手
|
6天前
|
人工智能 自然语言处理 安全
2026年OpenClaw(Clawdbot)效率翻倍指南:部署+10个必备Skills,解锁AI生产力
很多用户部署OpenClaw(Clawdbot)后都会陷入“看似强大却不好用”的困境,核心原因在于没有搭配合适的Skills(技能插件)。OpenClaw本体就像一台高性能电脑,而Skills如同各类专业软件,只有装上必备技能,才能真正发挥其自动化办公、开发辅助、内容创作等全场景能力。
1034 6