博弈论(二)完全信息静态博弈

简介: 博弈论(二)完全信息静态博弈

 完全信息静态博弈(static games of complete information)。其中假设参与人是理性的(Rationality),也就是参与人的目的是使得自己收益最大化,参与人是完美的计算者。并且参与人知道其它参与人是理性的。

Prisoners’ Dilemma

  上述例子就是完全信息静态博弈的例子。同时行动(simultaneous move)指的是每个参与人在选择他的策略时不知道其他参与人的选择。完全信息(complete information)指的是每个参与人的策略和收益函数都是所有参与人的共同知识(common konwledge)。


Normal-form (or strategic-form) representation


  一个博弈G GG的标准式(或策略式)包括:

image.png

2-player game

  如只有两个player,且每个player的策略有限,则可以用双变量矩阵来表示这个博弈:

  行和列表示策略可选策略,矩阵中的单元格表示策略组合

Prisoners’ Dilemma

  在囚徒困境这个例子中参与人集合可表示为:{ P r i s o n e r 1 , P r i s o n e r 2 } ,策略集合S 1 = S 2 = { M u m , C o n f e s s } 收益函数可表示为:

  那么其双变量矩阵可表示为:

Iterated elimination of strictly dominated strategies

Nash equilibrium

  纳什均衡是一个策略组合。其中,每个参与人选择的策略都是针对其他参与人选择策略的最优反应。

  更一般地考虑2-player game with strategiesS 1 = { s 11 , s 12 , s 13 } S 2 = { s 21 , s 22 },如果u 1 ( s 11 , s 21 ) ≥ u 1 ( s 12 , s 21 ) ,且u 1 ( s 11 , s 21 ) ≥ u 1 ( s 13 , s 21 )。那么player1的策略s 11 是他对player2策略s 21 的最优反应。

  在一个两个参与人的博弈中,当且仅当两个参与人所选策略都为对方所选策略的最优反应时,那么这个策略是一个纳什均衡。

  在一个纳什均衡的策略组合上,每个参与人给定对方策略选择时最大化自己的收益了,不会有任何动机偏离当前的策略选择。

  再看一个纳什均衡解的问题:

Best Response Function


  最优反应(Best Response Function)定义:在标准式博弈(normal-form game) { S 1 , S 2 , ⋯   , S n , u 1 , u 2 , ⋯   , u n } 中,如果其它玩家1 , 2 , ⋯   , i − 1 , i + 1 , ⋯   , n 选择策略s 1 , ⋯   , s i − 1 , s i + 1 , ⋯   , s n ,对于参与人i 来说,如果策略s i s_{i}si带给他的收益不小于他在任何其它策略带给他的收益,那么这个策略s i 就是对于其他参与人所选策略的最优反应:

image.png

或者定义为一个最大化问题:

image.png


依据最优反应定义纳什均衡

Applications of Nash equilibrium

最优反应求解纯策略纳什均衡

严格剔除劣策略纳什均衡

Mixed strategy Nash equilibrium

  混合策略是指定一个实际行动,它是从纯策略集中以某些指定的概率被随机选择出来的。伴随着策略选择的随机化是参与人收益的随机化。因此需要引入期望收益(expected payoff)

相关文章
|
3月前
|
关系型数据库 MySQL Java
《理解MySQL数据库》执行计划EXPLAIN深度解析
本文系统讲解MySQL执行计划(EXPLAIN)在Java开发中的应用,涵盖基础语法、各列深度解析及实战优化案例。通过分析type、key、Extra等关键字段,帮助开发者诊断慢查询、优化索引、提升SQL性能,并结合Spring AOP与JDBC实现执行计划的自动化监控与优化建议,构建高效稳定的数据库访问体系。(239字)
|
存储 Java API
写给大忙人看的 - Java中从MinIO服务器中下载文件(3)
前面两章介绍了 MinIO 文件服务器的环境搭建,以及在 Java 中上传文件至 MinIO 文件服务器中,现在,一起来看下如何从 MinIO 文件服务器中下载文件吧
2737 0
|
8月前
|
存储 编解码 移动开发
空间转录组:数据格式介绍
空间转录组:数据格式介绍
空间转录组:数据格式介绍
|
AI芯片
AIGC视频生成/编辑技术调研报告
随着图像生成领域的研究飞速发展,基于diffusion的生成式模型取得效果上的大突破。在图像生成/编辑产品大爆发的今天,视频生成/编辑技术也引起了学术界和产业界的高度关注。该分享主要介绍视频生成/编辑的研究现状,包括不同技术路线的优劣势,以及该领域当下面临的核心问题与挑战。
2102 3
AIGC视频生成/编辑技术调研报告
|
机器学习/深度学习 自然语言处理 搜索推荐
预训练的词嵌入(Word Embedding)
【10月更文挑战第5天】预训练的词嵌入(Word Embedding)
246 2
|
编解码 并行计算 JavaScript
Nodejs 第十六章(ffmpeg)
Nodejs 第十六章(ffmpeg)
475 0
|
机器学习/深度学习 人工智能
《模型压缩与量化:提升性能与降低成本的关键策略》
在人工智能领域,模型压缩和量化是优化模型大小与性能的关键技术。模型压缩包括剪枝(去除不重要连接)、低秩近似(矩阵分解)和模型融合(合并多个模型),减少冗余并提高效率。量化则通过将参数从连续值转为离散值(如8位、16位),减小存储空间。这些方法能在不降低性能的前提下显著减小模型大小,适用于不同应用场景。未来研究将更注重性能与效率的平衡。
585 10
|
JavaScript 前端开发 API
JavaScript动态渲染页爬取——Playwright的使用(二)
JavaScript动态渲染页爬取——Playwright的使用(二)
839 1
|
机器学习/深度学习 算法 Java
机器学习、基础算法、python常见面试题必知必答系列大全:(面试问题持续更新)
机器学习、基础算法、python常见面试题必知必答系列大全:(面试问题持续更新)
|
缓存 负载均衡 架构师
优化大型数据处理系统的性能:从设计到实施
在数据驱动的世界中,大型数据处理系统的性能对企业运营至关重要。本文将探讨如何通过优化设计、选择合适的技术栈以及实施高效的策略来提升数据处理系统的性能。我们将深入分析数据库设计优化、并发处理、数据缓存策略、和数据流管理等关键领域,提供实际案例和技术建议,以帮助开发人员和系统架构师构建高效、可扩展的数据处理系统。