博弈论(一)基本概念

简介: 博弈论(一)基本概念

假设要在AB两点建立一个超市,假设AB两点中间的顾客都是均匀分布的,那如何选定两个超市地址呢?假设AB两点的中点为C点。

  如果由政府来建,那么会建立在AC的中点D点,和CB的中点E点。如果二者自由竞争,那么两家超时都会建在C点(因为大家都想抢占多一点位置),出现扎堆的情况。博弈论就是在这里做的就是有竞争的情况下,预测合理的结果


囚徒困境


坦白 不坦白
坦白 (-5,-5) (0,-8)
不坦白 (-8,0) (-1,-1)

  博弈论的目的就是找纳什均衡,纳什均衡就是一个合理的解。但是纳什均衡的假设是决策双方是理性的,但是在实际情况下是会有些许偏差的。

  如果考虑同盟,那么此时集体利益也会被考虑进来,并且需要考虑同盟内部的利益分配。

双寡头削价竞争


高价 低价
高价 (100,100) (10,150)
低价 (150,20) (70,70)

  上述结果就是两个寡头都定低价。


博弈


  一些个人、 队伍或者组织,面对一定的环境条件在一定的规则下,同时或先后,一次或者多次,从个允许选择的行为或者策略中进行选择并加以实施,各自取得相应结果的过程。

  从上述可以抽取概念:

  1. 参与人 n 个,n ≥ 2
  2. 策略S ,以囚徒困境为例。囚徒1的策略s 1 坦白,抵赖};囚徒2的策略s 2 坦白,抵赖}。有四种结果(s 1,s 2 )。

  如果策略是有限的,我们称之为有限博弈。如果策略有无穷多个,称之为无穷博弈。上文所说的超市选地点就是一个无穷博弈。

  1. 收益(payoff):u i ( s 1 , ⋯   , s n ) i = 1 , ⋯   , n,收益是结果的函数,不同的结果能够得到不同的收益。若u 1 + u 2 + ⋯   , + u n = 0 ,我们称其为零和博弈。若u 1 + u 2 + ⋯   , + u n = a,其中a aa为一个常数,我们称其为常和博弈。零和是常和的特殊情况,还有一种是变和,即个策略下的收益不一样,如囚徒困境就是变和博弈


博弈过程


  根据博弈过程方面的差异,博弈问题可分为静态博弈动态博弈重复博弈。囚徒困境就是序贯同步决策,同步的决策也称之为静态的。但是下象棋就是动态的决策。重复博弈中每次决策都是静态的,但是重复很多次,但是知道之前的博弈结果,所以其实际上是静态和动态的结合


博弈信息结构


  比如股票市场,有散户、机构、游资等,每一方掌握的信息多少都不一样,因此这是一种信息不对称的博弈。描述信息不确定性可以用表示,熵越大,信息越大。

  但并不说缺乏信息就不能做决策,也不是说信息越多利益就能越大。但是信息之间的差异,通常会早成决策和博弈结果的不同。

  • 完全信息博弈:“完全信息只是博弈开始时参与人没有不确定性,相当于博弈树为共同知识;
  • 完美信息博弈则是在任一决策时点上,每个参与人决策时博弈的历史是共同知识
相关文章
|
7月前
|
存储 编解码 数据可视化
计算机图形学的基本概念与应用
计算机图形学的基本概念与应用
|
Serverless 索引 Python
统计学中基础概念说明(二)
统计学中基础概念说明(二)
统计学中基础概念说明(二)
|
6月前
|
算法 数据挖掘 定位技术
算法必备数学基础:图论方法由浅入深实践与应用
算法必备数学基础:图论方法由浅入深实践与应用
|
机器学习/深度学习 决策智能
什么是贝叶斯网络?原理入门
什么是贝叶斯网络?原理入门
334 0
什么是贝叶斯网络?原理入门
|
量子技术
量子力学的起源和基本概念
量子力学的起源可以追溯到20世纪初,当时的科学家们遇到了一些古典物理无法解释的问题。其中最突出的两个问题是黑体辐射问题和光电效应问题。
162 0
量子力学的起源和基本概念
|
7月前
|
机器学习/深度学习 自然语言处理 算法
探索机器学习的奥秘:从基础概念到算法解析
探索机器学习的奥秘:从基础概念到算法解析
91 0
|
机器学习/深度学习 传感器 人工智能
强化学习相关的主要概念和术语简介
强化学习相关的主要概念和术语简介
227 0
|
机器学习/深度学习 存储
强化学习的最基本概念马尔可夫决策过程简介
强化学习的最基本概念马尔可夫决策过程简介
262 0
强化学习的最基本概念马尔可夫决策过程简介
|
机器学习/深度学习 人工智能 自然语言处理
机器学习入门:概念原理及常用算法
机器学习入门:概念原理及常用算法
189 0
机器学习入门:概念原理及常用算法
统计学中基础概念说明(一)
统计学中基础概念说明(一)
统计学中基础概念说明(一)