假设要在AB
两点建立一个超市,假设AB
两点中间的顾客都是均匀分布的,那如何选定两个超市地址呢?假设AB
两点的中点为C
点。
如果由政府来建,那么会建立在AC
的中点D
点,和CB
的中点E
点。如果二者自由竞争,那么两家超时都会建在C
点(因为大家都想抢占多一点位置),出现扎堆的情况。博弈论就是在这里做的就是有竞争的情况下,预测合理的结果。
囚徒困境
坦白 | 不坦白 | |
坦白 | (-5,-5) | (0,-8) |
不坦白 | (-8,0) | (-1,-1) |
博弈论的目的就是找纳什均衡,纳什均衡就是一个合理的解。但是纳什均衡的假设是决策双方是理性的,但是在实际情况下是会有些许偏差的。
如果考虑同盟,那么此时集体利益也会被考虑进来,并且需要考虑同盟内部的利益分配。
双寡头削价竞争
高价 | 低价 | |
高价 | (100,100) | (10,150) |
低价 | (150,20) | (70,70) |
上述结果就是两个寡头都定低价。
博弈
一些个人、 队伍或者组织,面对一定的环境条件在一定的规则下,同时或先后,一次或者多次,从个允许选择的行为或者策略中进行选择并加以实施,各自取得相应结果的过程。
从上述可以抽取概念:
- 参与人 n 个,n ≥ 2
- 策略S ,以囚徒困境为例。囚徒1的策略s 1 坦白,抵赖};囚徒2的策略s 2 坦白,抵赖}。有四种结果(s 1,s 2 )。
如果策略是有限的,我们称之为有限博弈。如果策略有无穷多个,称之为无穷博弈。上文所说的超市选地点就是一个无穷博弈。
- 收益(
payoff
):u i ( s 1 , ⋯ , s n ) ,i = 1 , ⋯ , n,收益是结果的函数,不同的结果能够得到不同的收益。若u 1 + u 2 + ⋯ , + u n = 0 ,我们称其为零和博弈。若u 1 + u 2 + ⋯ , + u n = a,其中a aa为一个常数,我们称其为常和博弈。零和是常和的特殊情况,还有一种是变和,即个策略下的收益不一样,如囚徒困境就是变和博弈。
博弈过程
根据博弈过程方面的差异,博弈问题可分为静态博弈、动态博弈、重复博弈。囚徒困境就是序贯同步决策,同步的决策也称之为静态的。但是下象棋就是动态的决策。重复博弈中每次决策都是静态的,但是重复很多次,但是知道之前的博弈结果,所以其实际上是静态和动态的结合。
博弈信息结构
比如股票市场,有散户、机构、游资等,每一方掌握的信息多少都不一样,因此这是一种信息不对称的博弈。描述信息不确定性可以用熵表示,熵越大,信息越大。
但并不说缺乏信息就不能做决策,也不是说信息越多利益就能越大。但是信息之间的差异,通常会早成决策和博弈结果的不同。
- 完全信息博弈:“完全信息只是博弈开始时参与人没有不确定性,相当于博弈树为共同知识;
- 而完美信息博弈则是在任一决策时点上,每个参与人决策时博弈的历史是共同知识。