中国人工智能学会通讯——金融博弈下的价值学习 1.3 贝叶斯最优拍卖-阿里云开发者社区

开发者社区> 人工智能> 正文

中国人工智能学会通讯——金融博弈下的价值学习 1.3 贝叶斯最优拍卖

简介:

1.3 贝叶斯最优拍卖

image

这是一个著名的Myerson最优拍卖的例子。第一步,Myerson的建议是,我们知道它的分布,怎么知道没有说,我们把它加进来,因为我们是学习这个价值分布。

大多数情况,在互联网的环境下,这个事情都是我们自己做的。在这里我们有一个报价,然后运用一个机制设计来决定卖给你什么,收多少钱。这里,虚拟报价是根据真实报价算出来的一个值。

这样的话,在Myerson拍卖里面它确定赢家在虚拟报价最高的一列,计算费用就等价于第二虚拟报价的赢家报价,这是一个非常简明扼要的方案。但是在互联网中,卖给你很多次以后,我知道你有一个底价,即虚拟报价等于0的那个就是底价。在贝叶斯最优拍卖里面也有这样一个值。

image

我们看看Myerson拍卖时怎么卖。

它的分布函数空间为[0,a] 1>a>0。

我们回去参考一下,或者是你相信我的话,虚拟报价是2x-a,当2x-a=0即x=a/2当只有一个人时,你的报价大于a/2就赢得报价,你的付费就是a/2。

image

这样我们可以算出来你的付费是多少,你的期望收益是多少。你的期望收益在这里算出来的是一个常数减去a/4。你的最优策略是什么?你把a设为0,最优策略的收益是3/8。但是你诚实报价时a=1,你的诚实收益是1/8,这样的话,拍卖者就被你欺骗了。

在一般的情况下,我们有这么两个阶段。第一个阶段呢,在经济学理论分析中,它强调逻辑原则,也就是刚才我们讲的Myerson拍卖,它是假设知道你的分布。但是今天我们看到,数据范式里非常强调数据,那么我们把这两个衔接起来就能发现以前的理论的弱点在哪里。

image

我们在这样一个均衡的情况下,刚才只讲了一个人的情况,如果是多个买家的情况,我们也可以得到一个最佳欺骗的分布。n趋向于无穷大时,a=1。也就是说,参与买卖东西的人很多时,我们会收敛到Myerson拍卖,卖家收入是得到真实报价的最优收入。这里有一点,卖家是对的,卖家要学习,学习以后能够得到最优拍卖,而买家要做strategy,结果得到自己2倍的真实报价最优收益。

今天我想讲的是最后一段,卖家要反复学习,买家要做strategy。

(本报告根据速记整理)

版权声明:本文内容由阿里云实名注册用户自发贡献,版权归原作者所有,阿里云开发者社区不拥有其著作权,亦不承担相应法律责任。具体规则请查看《阿里云开发者社区用户服务协议》和《阿里云开发者社区知识产权保护指引》。如果您发现本社区中有涉嫌抄袭的内容,填写侵权投诉表单进行举报,一经查实,本社区将立刻删除涉嫌侵权内容。

分享:
人工智能
使用钉钉扫一扫加入圈子
+ 订阅

了解行业+人工智能最先进的技术和实践,参与行业+人工智能实践项目

其他文章