博弈论 斯坦福game theory stanford week 4.0_

简介: title: 博弈论 斯坦福game theory stanford week 4-0tags: notenotebook: 6- 英文课程-15-game theory---博弈论 斯坦福game theory stanford week 4-0perfect information ...

title: 博弈论 斯坦福game theory stanford week 4-0
tags: note
notebook: 6- 英文课程-15-game theory
---

博弈论 斯坦福game theory stanford week 4-0

perfect information extensive form: taste 完美的信息广泛的形式:品味

包含时间的博弈形式

一般的博弈的形式中并不包括序列的变量,比如时间变量,或者博弈者的动作序列

所以现在我们可以引入拓展形式来描述上述这些问题

这种形式分为两种:

  • 完美信息形式
  • 不完美信息形式

完美信息博弈

我们这样定义通过一个结构:

img_dac4f6966357afb117e988555b5d74dd.gif

  • N 代表博弈者的集合
  • A 代表行为的集合
  • 剩下的部份是选择点和这些点的标签
    • H 代表无终端的选择点
    • x 所有的可能的行为的集合
    • img_8aa636a76efc2c0812d22043c87481fb.gif行为的选择
  • Z 终端点,终结点,与无终端点相排斥的点
  • 收益函数,img_fc801b9d1a43be2254cd41fe97444942.gif

完美信息博弈的例子

img_b7289d9315be75c049fc03ccfb90fbcd.png

这是一个关于分钱的博弈,两个人分两块钱

第一个博弈者有三个选项,2-0,1-1,0-2这三种分钱的方式。

对于这三个选择,博弈者二都有两个选择。

同意和不同意

例子中的纯策略

这个例子中有多少的纯策略呢?

1 有一个选择点,但是这个点有三个分支。

2 有三个选择点,每个选择点有两个分支。

但是我们的纯策略有八种,这是img_05e24d28f5a81dcebbfb751885a7f0f1.gif所以是8.也就是说节点二不是选择一个决策,而是应对1 的每一个决策选择一个决策。

img_7cc5320d6faba89f1c0fb60f39a9f4ac.png

我们定义: 在一个完美信息拓展决策中,一个人的纯策略的个数通过上述公式确定。

一个更加复杂的例子是这样的

img_38bef587694aab613994136923595aad.png

玩家2 的选择有多少种呢?

答案是4种:img_c9878bad64e032cd0a1925e58b979d0b.png

玩家一的呢?

同样是四种,因为即使有的时候他的第二次决策是并没有实际效果的,但是在决策开始前他也必须做出。img_20221594faa2812004ae0516459213ef.png

在我们定义了纯策略的定义后,我们就可以轻易的得到下面定义:

混合策略

最优响应

纳什均衡

标准的形式和拓展的形式

对于有些的拓展形式是可以转化成一般形式的,比如例子1.

img_569a7e5e8a7f0a8e90ab797fed0f5edb.png

如下图所示。

我们可以发现,这种形式会产生冗余,比如左上角和右上角

定理:每一个完美信息博弈都有一个纳什均衡

那么这个博弈的纯策略纳什均衡是多少呢?

img_9637f88601f5d2b228b03cca300b0a29.png

答案是我圈出的那个,具体的方法可以使用前面学到的方法进行求解。

subgame perfection 子博弈完美性

在这个博弈中

img_8e0f9ec3b4af536e55b50b19a4da61f6.png

有一个纳什均衡是(BH)(CE)

我们看到如果 1 有机会进行第二次选择,对他来说,他一定不会选择H,而是会选择G

不过他这样做是在威胁2,从而让他选择F

在这样的情境下,我们进行这样的两个定义

img_af4d7d39bc7b12a31ad8cd0fc82a3a2b.png

在h的根下的子游戏G

这个问题就表明了,有的时候子博弈的纳什均衡有的时候并不是完整博弈的完整性。

下面的那个纳什均衡是子博弈完美的呢?

img_29ea6528531fe89701895d732d15e463.png

(AG)(CF)是子博弈完美的

因为他的子博弈的纳什均衡和完整博弈的纳什均衡是一致的。

其他的博弈都是不可信的

Backward induction 后向诱导

在这种的情况下,我们怎么计算子博弈的完美均衡呢?

思路就是,先从最低端开始寻找,然后一点点的向上寻找。

img_8b0280af852dae27458d80a9d7b42e5c.png

对于这个问题,我们可以使用上面的算法来求解。

不过对于零和问题,我们可以将问题进行简化。我们可以很轻易的衡量每一个节点的得失,因为是零和博弈,你的获得就是我的失去。

相关文章
|
3月前
|
机器学习/深度学习 传感器 人工智能
【博士每天一篇论文-综述】Brain Inspired Computing : A Systematic Survey and Future Trends
本文提供了对脑启发计算(BIC)领域的系统性综述,深入探讨了BIC的理论模型、硬件架构、软件工具、基准数据集,并分析了该领域在人工智能中的重要性、最新进展、主要挑战和未来发展趋势。
76 2
【博士每天一篇论文-综述】Brain Inspired Computing : A Systematic Survey and Future Trends
|
机器学习/深度学习 人工智能 运维
7 Papers & Radios | IJCAI 2022杰出论文;苹果2D GAN转3D
7 Papers & Radios | IJCAI 2022杰出论文;苹果2D GAN转3D
107 0
|
人工智能
Tianchi x MSU Hackathon - IJCAI 2018 Alimama International Advertising Algorithm Competition
Alibaba Cloud Tianchi will be hosting the IJCAI 2018 Alimama International Advertising Algorithm Competition at Moscow State University in April.
1953 0
Tianchi x MSU Hackathon - IJCAI 2018 Alimama International Advertising Algorithm Competition
|
机器学习/深度学习 BI 决策智能
博弈论 斯坦福game theory stanford week 7.1_
title: 博弈论 斯坦福game theory stanford week 7-1 tags: note notebook: 6- 英文课程-15-game theory --- 博弈论 斯坦福game theory stanford week 7-1 1。
1319 0
|
决策智能
博弈论 斯坦福game theory stanford week 7.0_
title: 博弈论 斯坦福game theory stanford week 7-0 tags: note notebook: 6- 英文课程-15-game theory --- 博弈论 斯坦福game theory stanford week 7-0 coalitional game theory taste 联盟博弈论 我们在联盟博弈论中讨论的并不是一个个人的博弈了 而变成了一个联盟的博弈。
1114 0
|
决策智能
博弈论 斯坦福game theory stanford week 7.1
title: 博弈论 斯坦福game theory stanford week 7-0 tags: note notebook: 6- 英文课程-15-game theory --- 博弈论 斯坦福game theory stanford week 7-0 coalitional game theory taste 联盟博弈论 我们在联盟博弈论中讨论的并不是一个个人的博弈了 而变成了一个联盟的博弈。
1008 0
|
决策智能
博弈论 斯坦福game theory stanford week 6.2_
title: 博弈论 斯坦福game theory stanford week 6-2 tags: note notebook: 6- 英文课程-15-game theory --- 博弈论 斯坦福game theory stanford week 6- 1 In the following tw...
980 0
|
决策智能
博弈论 斯坦福game theory stanford week 6.0_
title: 博弈论 斯坦福game theory stanford week 6-0 tags: note notebook: 6- 英文课程-15-game theory --- 博弈论 斯坦福game theory stanford week 6-0 Bayesian Games: Tast...
1018 0
|
决策智能
博弈论 斯坦福game theory stanford week 6.1_
title: 博弈论 斯坦福game theory stanford week 6-1 tags: note notebook: 6- 英文课程-15-game theory --- 博弈论 斯坦福game theory stanford week 6-1 Bayesian Games: Tast...
1001 0
|
决策智能
博弈论 斯坦福game theory stanford week 5.1_
title: 博弈论 斯坦福game theory stanford week 5-1 tags: note notebook: 6- 英文课程-15-game theory --- 博弈论 斯坦福game theory stanford week 5-1 练习 1.
1037 0