博弈论第十二集总结(“社会公约、侵略和周期 ”观后感)

简介: 博弈论第十二集总结(“社会公约、侵略和周期 ”观后感)

游戏:两性战争,约会博弈

1.找到对称博弈中的纳什均衡?

在这个博弈里没有纯对称纳什均衡,在这个博弈中只有顺从或者反抗,a,b代表顺从和反抗,这里没有进化稳定,所以这里要采用混合策略

2.进化稳定纯策略和进化稳定相似,我们称为单态,也就是说只有一种进化形态或一种类型,而稳定的混合态叫做多态,也就是说有单型种群也有单型种群

3.进化稳定性的定义3(混合策略):在一个双参与人的博弈中,混合策略S是稳定策略必须满足以下两个条件:

4.(P,P)是对称纳什均衡,对称纳什均衡意味着payoff(P,P)>=payoff(P',P)

5.如果payoff(P,P)=payoff(P',P),那么payoff(P,P')>payoff(P',P')

这里与定义2没有区别只是允许了混合的出现

6.在一个混合策略中,所有的纯策略的收益都是一致的

7.如果只有一种种群存在时,可以看出突变的个体会逐渐增加,最终多会达到混合纳什均衡

游戏:鹰-鸽子游戏

鹰被认为是进攻型,鸽子被认为是防守型

1.在斗争中奖励是V,V>0,斗争的代价是C,C>0

2.D是否是进化稳定策略?

3.(D,D)不是纳什均衡?

4.H是否是进化稳定策略?

5.(H,H)是否是纳什均衡? 如果(V-C)/2>0,那么是严格纳什均衡,如果是等号则是弱纳什均衡

6.即便C>V,也不会出现只有D存在的情况,而是会出现一种混合情况

7.怎样找到一个混合纳什均衡?

鸽子采用两种策略下的收益相等,达到混合策略纳什均衡,p=V/C

<span style="color:#2e3033"><span style="background-color:#ffffff"><code class="language-math">u(H,p)=p*(V-C)/2+(1-p)V
u(D,p)=p*0+(1-p)*V/2</code></span></span>

1.结论1:如果V<C,那么进化稳定的种群中鹰派数量是V/C,随着V增加,那么鹰派会增加,当C增加,我们会看到更多鸽派

2.结论2:在进化稳定策略下,鹰和鸽子都可能更多。双方的收益是(1-V/C)(V/2),和我们想象中不同的是,随着C增加,收益没有下降反而上升

游戏:抓咬踩(1<V<2)

1.唯一的混合策略均衡是(1/3,1/3,1/3),但不是进化稳定的

验证:而混合策略是唯一可能的稳定状态,但是由于小于,所以不存在进化稳定

相关文章
|
1月前
|
人工智能 自然语言处理 算法
当prompt策略遇上分治算法,南加大、微软让大模型炼成“火眼金睛”
【2月更文挑战第24天】当prompt策略遇上分治算法,南加大、微软让大模型炼成“火眼金睛”
24 2
当prompt策略遇上分治算法,南加大、微软让大模型炼成“火眼金睛”
|
7月前
|
算法 数据挖掘
群体遗传学研究荐读丨应知应会(下)
群体遗传学研究荐读丨应知应会(下)
|
1月前
|
机器学习/深度学习 人工智能 自然语言处理
前谷歌科学家离职后创业一年,发文自述算力是训练大模型的难点
【2月更文挑战第20天】前谷歌科学家离职后创业一年,发文自述算力是训练大模型的难点
18 2
前谷歌科学家离职后创业一年,发文自述算力是训练大模型的难点
|
7月前
|
算法 Python
群体遗传学研究荐读丨应知应会(上)
群体遗传学研究荐读丨应知应会
|
7月前
|
Java
张益唐111页论文攻克朗道-西格尔零点猜想
张益唐111页论文攻克朗道-西格尔零点猜想
|
9月前
|
决策智能
博弈论第十一集总结(进化稳定—合作,突变,与平衡 “ 观后感)
博弈论第十一集总结(进化稳定—合作,突变,与平衡 “ 观后感)
50 0
|
9月前
|
决策智能
博弈论第十四集总结(道德风险、奖励和担保“ 的观后感)
博弈论第十四集总结(道德风险、奖励和担保“ 的观后感)
43 0
|
11月前
四年研究浓缩为几分钟实验,已故教授所提理论在太空得到证明
四年研究浓缩为几分钟实验,已故教授所提理论在太空得到证明
|
存储 测试技术 BI
|
调度
团体程序设计天梯赛-练习集 - L2-014 列车调度(25 分)
团体程序设计天梯赛-练习集 - L2-014 列车调度(25 分)
104 0