波斯公主选驸马: 关于算法和重大决策

简介:

大学时的一道数学题

我大学的专业是数学。有一次,教授给出了《波斯公主选驸马》题「1」,如下:


波斯公主到了适婚年龄,要选驸马。候选男子100名,都是公主没有见过的。百人以随机顺序,从公主面前逐一经过。每当一位男子在公主面前经过时,公主要么选他为驸马,要么不选。如果选他,其余那些还没有登场的男子就都遣散回家,选驸马的活动也 over 了。如果不选,当下这名男子就离开,也就是 pass 掉此人,下一人登场。被pass 掉的,公主不可以反悔再从选。规则是,公主必须在这百人中选出一人做驸马,也就是说,如果前99人公主都看不中的话,她必须选择第100名男子为驸马,不管他有多么丑陋。


任务是,给公主设计选择方法,让她有最高概率选到百人中最英俊的男子为驸马。


说明一点是,没有任何选择方法能够保证公主一定选择到最帅的帅哥。对于任何选择方法,总存在某些出场的顺序,让公主与帅哥错过。所以,题目所问的,不是必胜的选法(因为不存在),而是概率最高的选法。


因为并不是要讨论数学,我这里就直接给出答案了:最佳选法是 pass 掉最开始的 100/e 名男子(e = 2.718… 是自然对数,即 100/e 约等于 37)。但是记录下这 37 名男子中最英俊者。之后鱼贯而来的男子中,出现的第一位英俊程度超越所有前 37 人者,即为驸马。如果人都走光了,也没出现这么一位 Mr. Right,那么就只好选择第 100 位男子。


这个最佳选法,后面有很有意思的数学推导。感兴趣的话,可见注「2」。



正解后面的思考方法

数学的推论且不论,这个答案背后是一个可为广泛应用的思考方法。公主选择的难处在于她不知道这百人的英俊程度是怎样分布的,是在怎样一个范围内。所以她最佳的策略是,pass 掉最初 37 位男子,但是把他们看成一个有代表性的 sample,从而了解这百人相貌的大致分布。然后在这个认知的基础上进行选择。


真实的谈情说爱当然不是一个简单的选美。普通人也不能像波斯贵族那样要谁有谁。但是思维方法共通。假如你是一位女生,第一次恋爱的时候,也许你觉得男朋友不够细腻,不解风情。但你无法判断的是,是否天下男生大多如此,还是你特别倒霉碰到这样的极品「3」。你唯有试过三个五个后,才能够对男性这个物种有个全局的判断。所以,当你和第一任男朋友分手后,大可不必悲天悯人,亦或对天下男人失望。正确的态度是:okay,我现在有一个 data point, 现在我来找些更多的 data points「4」。


花多长时间学习?

找到多少 data points 才够呢?换句话说我们学习到什么时候才能够信任自己对世界的判断?以下这个小故事中,我们可以看出大自然是怎么解决这个问题的。


1944年冬天,二战进入尾声。德国人封锁了荷兰德占区的补给。1944-1945年的冬天,被称为”hunger winter”(饥饿的冬天)。有四百五十万荷兰人遭受饥饿,一万八千人饿死。1945年,德国战败,封锁也随之解除。


但这个饥饿冬天所带来的影响却一直留存到几十年后。那些封锁期间怀着孩子的妇女,她们肚子里发育中的胚胎,虽无知觉,也经历了这场灾难。几十年后,当这些孩子成为50岁的中年人,科学家们发现他们会比之前,或者之后出生的荷兰孩子都更肥胖,更容易有心血管疾病「5」。


对此的一种解释是,还在妈妈肚子里的时候,我们的身体就在学习这是怎样一个世界:是个食物充足,衣食无忧的世界?还是一个有上顿没下顿的世界?这些荷兰饥荒那年出生的婴儿,他们的身体学习到:“这是一个食物匮乏的世界”。哪怕他们成年之后,荷兰已经是一个富余的发达国家,他们的身体还是不忘早年饥饿的经历,会尽力存储脂肪,准备着下一个饥饿冬天的到来。结果就是这个人群更容易肥胖,并且更容易患有与肥胖相关的心血管疾病。


有意思的是,对食物丰富与否的学习,在10月怀胎中完成,居然之后几十年也无法扭转。这个学习的窗口,是我们的身体,我们的基因所决定的。孩子学东西快,是因为他们的身体和大脑就是 specialized 学习机器。有研究说,人脑中负责抽象思维的前额叶在25岁才定型「6」。换句话说,25岁以前,我们的思维,特别是那些高级的认知能力,还在不断变化着。而这其中很多的变化,就来自我们的环境。这种变化,就是我们在学习我们所在的,到底是怎样一个世界;怎样的思维和行为,是在这个世界上行得通的。


从人脑的发育看来,过了25岁,至少从生理上来说,这种学习就停止了。这个 deadline 取决于基因,而基因来源于千百万年的进化。千百万年中,人类的平均寿命是徘徊在20-30岁。这可能就是为什么我们的学习,从我们身体的设计上看来,是在25岁就截止了。


我们无法影响自己生理、身体上的学习,但是有些事情的学习,却是我们可以影响的,而且应该去影响的。选择怎样的工作?居住在哪个城市?找什么样的伴侣?这些似乎不是应该匆匆忙忙,赶着一个deadline (特别是25岁的 deadline)去决定的事情。你会进行很多比较,才决定购买一辆汽车或者房子。而工作、伴侣,这些更重要的决定,你当然要更多比较比较,了解一下你是在怎样的一个世界里,才做决定。


也许你30岁了,没有婚配的对象,不喜欢正在做的工作,但有种种压力期待你“别折腾,安顿下来”。这压力可能来自于一个一直不给个人选择的社会传统,或者来自于一个预期寿命只有30岁的进化压力。但是这一切都变了:社会已经有越来越多的选择余地,我们也可以预料之中的活到80,90岁。


也许你要认真考虑一下波斯公主的问题:我是否应该继续收集 data points?还是已经到了要做终生决定的时候?



回到波斯公主的题目

波斯公主的题目至少还教了我们另一点,就是哪怕你的方法是最优,你也永远不可能是每次都得到最英俊的驸马。在最优化的选择方法下,公主也只有 40% 左右的可能性选择到最帅的男人「7」。就是说,如果这样选择十次,每次这百名男子以随机顺序出现,其中有6次,公主都会选到不是最帅的驸马。


生活就是有风险的,不可测的。这似乎是个打击,但也是一种释怀。尽人事,安天命。如果你按照一个正确的方法去做了,哪怕结果差强人意,这也并不是你的错。


我学会的另一点是,如果我是作为被选的一方(就像那100名男子),timing 是至关重要的。以下是一个简单的多的题目:

如果你是这百名男子中的一名,并且你能够决定自己出场的名次,你会选择在什么时候出场,以最大提高自己被选的概率?


答案是第 38 名。你不会选择在 38 名之前,因为你被选的概率是零(假设我们的公主学过高等数学,知道最佳选法)。你也不会选择后于38,因为你前面每多一个人,就意味着多了一分公主选上他的机会「8」。


如果你有一位意中人,你当然要努力去追求幸福,但你可能也要想一下,这是否是最好的 timing?


37% 法则“实测”!

37% 法则的效果究竟如何呢?我们在计算机上编写程序模拟了当 n = 30 时利用 37% 法则进行选择的过程(如果 MM 始终未接受求爱者,则自动选择最后一名求爱者)。编号越小的男生越次,编号为 30 的男生则表示最佳选择。程序运行 10000 次之后,竟然有大约 4000 次选中最佳男生,可见 37% 法则确实有效啊。

b55e99c2474512de2d7d2c9ad6d13cdb4a49d05b

计算机模拟 10000 次后得到的结果

这个问题由数学家 Merrill M. Flood 在 1949 首次提出,这个问题被他取名为“未婚妻问题”。这个问题的精妙之处在于,在微积分界叱咤风云的自然底数 e,竟也出人意料地出现在了这个看似与它毫不相关的问题中。不知道此问题发表后,Geek 男女间会不会多了一种分手的理由:不好意思,你是那 37% 的人⋯⋯


注:

「1」原题是波斯王子选妃。

「2」这个题目在科学的松鼠会上。

「3」我现在就可以做个解答:天下男生的确大多如此,但是经过训练,可以有所改进。

「4」这种方法,也就是 Bayesien 统计学的核心:根据信息的不断丰富而修正对世界的认知。

「5」“Effects of prenatal exposure to the Dutch famine on adult disease in later life: an overview”, T.J. Roseboom et al., Molecular and Celular Endocrinology, vol 185 20 Dec 2001, Pages 93-98

「6」“Why do they act that way?: a survival guide to the adolescent brain for you and your teen”, David Walsh. New York: Free Press, 2004.

「7」这个40% 左右的数字,是可以推导出来的。但也可以通过模拟估算。详见科学松鼠会文:http://songshuhui.net/archives/57722

「8」谢谢楼下 zhongyu wang 的提醒。第100名也是好位置,即如果最帅的锅出现在前37名中,那么公主必定会选第100名。所以,第100的位置至少是会有37%的概率被选中。这可能是比第38还好的位置!转换成对异性的追求,不知是否意味着,你要等到你的爱慕对象穷途末路的时候再现身:)


如何求出最优的 k 值?

大数学家欧拉对一个神秘的数学常数 e ≈ 2.718 深有研究,这个数字和“拒人问题”竟然有着直接的联系。


对于某个固定的 k,如果最适合的人出现在了第 i 个位置(k < i ≤ n),要想让他有幸正好被 MM 选中,就必须得满足前 i-1 个人中的最好的人在前 k 个人里,这有 k/(i-1) 的可能。考虑所有可能的 i,我们便得到了试探前 k 个男生之后能选中最佳男生的总概率 P(k):

5773896197266347270.png?wx_lazy=1
用 x 来表示 k/n 的值,并且假设 n 充分大,则上述公式可以写成:

5773896197266347271.png?wx_lazy=1
对 -x · ln x 求导,并令这个导数为 0,可以解出 x 的最优值,它就是欧拉研究的神秘常数的倒数—— 1/e !


也就是说,如果你预计求爱者有 n 个人,你应该先拒绝掉前 n/e 个人,静候下一个比这些人都好的人。假设你一共会遇到大概 30 个求爱者,就应该拒绝掉前 30/e ≈ 30/2.718 ≈ 11 个求爱者,然后从第 12 个求爱者开始,一旦发现比前面 11 个求爱者都好的人,就果断接受他。由于 1/e 大约等于 37%,因此这条爱情大法也叫做 37% 法则。


不过,37% 法则有一个小问题:如果最佳人选本来就在这 37% 的人里面,错过这 37% 的人之后,她就再也碰不上更好的了。但在游戏过程中,她并不知道最佳人选已经被拒,因此她会一直痴痴地等待。也就是说,MM 将会有 37% 的概率“失败退场”,或者以被迫选择最后一名求爱者的结局而告终。

本文来源于"中国人工智能学会",原文发表时间"2014-09-03"

相关文章
|
2月前
|
算法
算法人生(3):从“贪心算法”看“战胜拖延”(完美主义版)
本文探讨了拖延症的一个常见原因——完美主义,并从贪心算法的角度提供启示。贪心算法通过局部最优决策逼近全局最优解,不保证全局最优,但寻求满意解。完美主义者的拖延源于高标准、过度关注细节、压力和时间管理困难。为解决这个问题,建议接受不完美,设定合理目标,追求良好效果,以及培养时间管理技巧。通过实例说明,调整心态和策略,可以提高工作效率并克服拖延。
|
2月前
|
数据库
文献速读|毕设不愁了,中科院二区5分非肿瘤双疾病分析思路
研究摘要:一项发表于2023年《Molecular Neurobiology》(IF=5.1)的论文探讨了帕金森病(PD)与重度抑郁症(MDD)的共病基因。研究通过分析基因表达谱数据识别出PD和MDD的共同基因,特别是AQP9、SPI1和RPH3A三个关键基因。这些基因在两种疾病中均表现出显著差异表达,且与中性粒细胞和单核细胞的功能有关。研究使用生物信息学方法进行基因功能注释和蛋白质相互作用网络分析,并通过实验验证了基因在模型系统中的作用,强调了这些基因在疾病病理生理中的潜在角色。
31 0
|
10月前
|
关系型数据库 Serverless 文件存储
向量加成,向亚运出发!
云数据库RDS PostgreSQL 版 文件存储NAS 函数计算FC
29 378
|
12月前
运筹学学习笔记关键点纪要
运筹学学习笔记关键点纪要
42 0
|
2月前
|
Java C++ Python
试题 基础练习 龟兔赛跑预测
试题 基础练习 龟兔赛跑预测
18 0
|
12月前
|
决策智能
博弈论第十一集总结(进化稳定—合作,突变,与平衡 “ 观后感)
博弈论第十一集总结(进化稳定—合作,突变,与平衡 “ 观后感)
58 0
|
12月前
|
决策智能 计算机视觉
博弈论第十二集总结(“社会公约、侵略和周期 ”观后感)
博弈论第十二集总结(“社会公约、侵略和周期 ”观后感)
71 0
|
算法
陶哲轩攻克60年几何学难题!发现「周期性密铺猜想」在高维空间反例
陶哲轩攻克60年几何学难题!发现「周期性密铺猜想」在高维空间反例
135 0
|
算法 索引
随机取样已死,蓄水池抽样称王
随机取样已死,蓄水池抽样称王
随机取样已死,蓄水池抽样称王
|
数据挖掘
2022国赛C题古代玻璃制品的成分分析与鉴别思路分析
2022国赛C题古代玻璃制品的成分分析与鉴别思路分析
15091 9

热门文章

最新文章

  • 1
    流量控制系统,用正则表达式提取汉字
    26
  • 2
    Redis09-----List类型,有序,元素可以重复,插入和删除快,查询速度一般,一般保存一些有顺序的数据,如朋友圈点赞列表,评论列表等,LPUSH user 1 2 3可以一个一个推
    26
  • 3
    Redis08命令-Hash类型,也叫散列,其中value是一个无序字典,类似于java的HashMap结构,Hash结构可以将对象中的每个字段独立存储,可以针对每字段做CRUD
    27
  • 4
    Redis07命令-String类型字符串,不管是哪种格式,底层都是字节数组形式存储的,最大空间不超过512m,SET添加,MSET批量添加,INCRBY age 2可以,MSET,INCRSETEX
    28
  • 5
    S外部函数可以访问函数内部的变量的闭包-闭包最简单的用不了,闭包是内层函数+外层函数的变量,简称为函数套函数,外部函数可以访问函数内部的变量,存在函数套函数
    24
  • 6
    Redis06-Redis常用的命令,模糊的搜索查询往往会对服务器产生很大的压力,MSET k1 v1 k2 v2 k3 v3 添加,DEL是删除的意思,EXISTS age 可以用来查询是否有存在1
    31
  • 7
    Redis05数据结构介绍,数据结构介绍,官方网站中看到
    22
  • 8
    JS字符串数据类型转换,字符串如何转成变量,+号只要有一个是字符串,就会把另外一个转成字符串,- * / 都会把数据转成数字类型,数字型控制台是蓝色,字符型控制台是黑色,
    20
  • 9
    JS数组操作---删除,arr.pop()方法从数组中删除最后一个元素,并返回该元素的值,arr.shift() 删除第一个值,arr.splice()方法,删除指定元素,arr.splice,从第一
    21
  • 10
    定义好变量,${age}模版字符串,对象可以放null,检验数据类型console.log(typeof str)
    19