博弈论 斯坦福game theory stanford week 2.0_

简介: title: 博弈论 斯坦福game theory stanford week 2-0tags: notenotebook: 6- 英文课程-15-game theory---博弈论 斯坦福game theory stanford week 2-0混合策略和纳什均衡一个例子我们从一个例子说起,我们说美国人为了保护自己的利益,在索马里设卡安检,我们不妨考虑这样的博弈问题,说在索马里有很多的路段,安检者和恐怖袭击者是博弈者。

title: 博弈论 斯坦福game theory stanford week 2-0
tags: note
notebook: 6- 英文课程-15-game theory
---

博弈论 斯坦福game theory stanford week 2-0

混合策略和纳什均衡

一个例子

我们从一个例子说起,我们说美国人为了保护自己的利益,在索马里设卡安检,我们不妨考虑这样的博弈问题,说在索马里有很多的路段,安检者和恐怖袭击者是博弈者。如果袭击和安检发生在同一地点,那么袭击者会受到损失,如果不是,袭击者会得到好处。对于检查者问题正好相反。

但是由于没有相应的情报支持,两者的决策只能依靠随机进行,并不会产生固定的决策,这样的策略称为混合策略。

混合策略,

Kv
就像上面的例子一样,我们考虑这个决策问题:

img_0e79c64ceb2105805d1830fc96d350c9.png

两个人的利益看起来并不能通过固定的选择方式进行分割,只能通过随机的选择,这样就是混合策略。

下面我们定义下这种决策,

  • 决策:img_e16f270d9f776506408149eee201a511.gif,决策是行动img_a27cc8f7870c7962e3b1a1758e425af2.gif的一个随机变量
  • 纯策略: 在概率中只有一个行为可以采用。
  • 混合策略: 在我们的策略中,可以采用多种策略。
    在这些策略中,所有的行为称为策略的支撑。

我们还要定义所有的策略img_e16f270d9f776506408149eee201a511.gif
我们还要定义所有策略的收益img_c97fa07f7d39c795d3be6dc50c8e5d89.gif

在上述的情况下,我们可以对我们的收益和支出进行概率性的讨论。

我们可以定义期望的收益如下:

img_94f62be26c9a101fe46814a571efaf90.png

第一行的公式是说,当前的收益是所有的行为带来的利益的加权平均值,第二行说我们可以使用贝叶斯公式来计算每一个的可能性。

最优响应和纳什均衡

img_b3b2ab90808b85ce7b5f353937b82a69.png

借助最优相应的概率,我们将上述的概率化思想融入进来,
得到一个定理:

每一个完整的博弈都有一个纳什均衡

完整的博弈的定义是什么:只要一个博弈,拥有一定的数量的博弈者,有着一定的行为,有着完整的收益矩阵,那么就是一个完整的博弈。

做一个说明:我们之前说的没有纳什均衡是说没有纯粹的纳什均衡,但是它可以有混合的纳什均衡。

比如我们前面提到的例子,如下图:

img_8e8a39741ba9ddf4e0d1059cecda2114.png

我们的混合的纳什均衡就是:
img_b54d5779386c7faa9ab702efb606285b.png
这个样子的

要强调混合的概率是随着不同的问题决定的,那么混合的概率是如何决定的呢,我们可以认为当所有的博弈者都不愿意再改变他们的概率的时候,就陷入了纳什均衡。

纳什均衡的计算

一个例子

通过这样的一个示例我们讨论纳什均衡的计算方法:
img_33a53367ce672f3db7f731edeff7abff.png
我们不得不说再一般的条件下,纳什均衡是十分难以计算的,不过如果你合一对支持进行猜测的情况下,我们可以相对容易的计算纳什均衡。

再上图情况下,我们假设让一个人选b的概率为img_4b28c13d5f5d658adb7478fbc9efc923.gif,选F的概率就是img_6330e9a407e8f8df8d39bdaa3c57bc48.gif
再这个情况下,另外一个决策者用混合策略来考虑这个问题,他需要保证对方这两种博弈行为对自己来说是一种平衡的收益,因为只有这样,另外一个博弈者的收益才不会因为对方的选择而发生改变。因此我们采用如下的策略列出方程:

img_a4b71f10af620c29d3f9780d413fe34e.png

使用混合策略的原因

  • 通过随机性来迷惑你的对手
  • 通过随机性来应对不确定性

多方博弈问题

两个例子

线性补充问题(linear complementarity problem)

支持计数方法(support enumeration method)

PPAD问题

美国加州大学伯克利分校的克里斯托斯·帕帕迪米特里欧(Christos Papadimitriou) 教授定义了PPAD(polynomial parity arguments on directed graphs,有向图的多项式校验参数)计算复杂类来描述经济学中的计算问题。并与其合作者一起证明了在4 人及以上的博弈中,纳什均衡的计算是属于PPAD-Complete 的。

img_173c1788cc6b39c81f95a63abbc013f0.png

通过上述的图片可以看到,PPAD问题是一类NP问题。

简要的发展历史

  1. 1928:von 提出两个人的零和博弈的均衡问题
  2. 1950:nash 再所有博弈种类提出多人博弈的均衡问题

lemke-howson 算法

LCP问题,线性补充方程问题

img_5b6af10407aee7e6c7be262b30482c00.png

其中img_73be58e719704f91e0bb1ebde0646fe9.gif代表了第i个人使用方案k的概率。
Ai代表了每一个博弈者的行为,那么img_6d19b607f6855e61030c61dd8e18d22f.png就表达当博弈者1采用j策略的平均获得。
img_c0209f521cd9aade5a8aca745f196542.gif代表了纳什均衡中的获得,从而img_466f6a9bddf27f4c4ffc171bef3403a0.gif代表了两者的差距

好吧这里我们先跳过去。
~~

纳什均衡的用例

点球问题

我们可以将点球问题当作是一个博弈的问题,对于一个点球来说,守门员扑球的方向和球员踢球的方向是一种博弈,如果两者方向相同,那么球有更大的几率被扑出。

img_495ecad20c60aece1723d2d678740e03.png

问题简化成上述图片

上述问题是我们已经讨论过的了,概率是0.5 0.5,不过如果问题编程了这个样子呢,如图:
img_bec6147c9fe19286b484bb1f3267a828.png

我们将其中一个,也就是我们认为踢球者的右脚水平比较差,可能不会百分百进球,那么博弈的纳什均衡会发生什么呢?
我,我们发现纳什均衡点发生了移动,守门员倾向于扑向右边。而球员倾向于扑向左边。

分别是3/7 4/7 和4/7 3/7

相关文章
|
3月前
|
机器学习/深度学习 传感器 人工智能
【博士每天一篇论文-综述】Brain Inspired Computing : A Systematic Survey and Future Trends
本文提供了对脑启发计算(BIC)领域的系统性综述,深入探讨了BIC的理论模型、硬件架构、软件工具、基准数据集,并分析了该领域在人工智能中的重要性、最新进展、主要挑战和未来发展趋势。
76 2
【博士每天一篇论文-综述】Brain Inspired Computing : A Systematic Survey and Future Trends
|
机器学习/深度学习 人工智能 运维
7 Papers & Radios | IJCAI 2022杰出论文;苹果2D GAN转3D
7 Papers & Radios | IJCAI 2022杰出论文;苹果2D GAN转3D
107 0
|
人工智能
Tianchi x MSU Hackathon - IJCAI 2018 Alimama International Advertising Algorithm Competition
Alibaba Cloud Tianchi will be hosting the IJCAI 2018 Alimama International Advertising Algorithm Competition at Moscow State University in April.
1953 0
Tianchi x MSU Hackathon - IJCAI 2018 Alimama International Advertising Algorithm Competition
|
决策智能
博弈论 斯坦福game theory stanford week 7.0_
title: 博弈论 斯坦福game theory stanford week 7-0 tags: note notebook: 6- 英文课程-15-game theory --- 博弈论 斯坦福game theory stanford week 7-0 coalitional game theory taste 联盟博弈论 我们在联盟博弈论中讨论的并不是一个个人的博弈了 而变成了一个联盟的博弈。
1114 0
|
决策智能
博弈论 斯坦福game theory stanford week 7.1
title: 博弈论 斯坦福game theory stanford week 7-0 tags: note notebook: 6- 英文课程-15-game theory --- 博弈论 斯坦福game theory stanford week 7-0 coalitional game theory taste 联盟博弈论 我们在联盟博弈论中讨论的并不是一个个人的博弈了 而变成了一个联盟的博弈。
1008 0
|
机器学习/深度学习 BI 决策智能
博弈论 斯坦福game theory stanford week 7.1_
title: 博弈论 斯坦福game theory stanford week 7-1 tags: note notebook: 6- 英文课程-15-game theory --- 博弈论 斯坦福game theory stanford week 7-1 1。
1319 0
|
决策智能
博弈论 斯坦福game theory stanford week 6.0_
title: 博弈论 斯坦福game theory stanford week 6-0 tags: note notebook: 6- 英文课程-15-game theory --- 博弈论 斯坦福game theory stanford week 6-0 Bayesian Games: Tast...
1018 0
|
决策智能
博弈论 斯坦福game theory stanford week 6.1_
title: 博弈论 斯坦福game theory stanford week 6-1 tags: note notebook: 6- 英文课程-15-game theory --- 博弈论 斯坦福game theory stanford week 6-1 Bayesian Games: Tast...
1001 0
|
决策智能
博弈论 斯坦福game theory stanford week 6.2_
title: 博弈论 斯坦福game theory stanford week 6-2 tags: note notebook: 6- 英文课程-15-game theory --- 博弈论 斯坦福game theory stanford week 6- 1 In the following tw...
980 0
|
决策智能
博弈论 斯坦福game theory stanford week 5.1_
title: 博弈论 斯坦福game theory stanford week 5-1 tags: note notebook: 6- 英文课程-15-game theory --- 博弈论 斯坦福game theory stanford week 5-1 练习 1.
1037 0