七夕,诺奖得主用算法教你如何脱单

简介:

七夕来袭,又到了情侣们大秀恩爱,单身狗们咬牙切齿的季节。本着人道主义关怀,先给大家唱一曲单身狗之歌——


雌雄双兔傍地走,你还是条单身狗;

两个黄鹂鸣翠柳,你还是条单身狗;

路见不平一声吼,你还是条单身狗;

问君能有几多愁,你还是条单身狗。


听完是不是很想组个复仇者联盟,早上去卖花,晚上去卖套,凌晨去卖药?


还是你认为社会资源就这么多,拆散一对是一对,于是整晚都在大街上溜达,看哪一对不顺眼就冲上去扇姑娘一巴掌然后问她“不是说你爱我吗?”


还是你打算宅在家里重播非诚勿扰,幻想自己站在台上和24位姑娘演皇上选后妃的戏码?


如果你还在琢磨这些事情,恭喜你,弱爆了。


因为获得稳定的感情不仅仅是单身狗的个人问题,更是一个数学问题和经济问题——稳定匹配问题 (stable matching problem)。针对这个问题,早在1962年的时候,两位美国数学家和经济学家 David Gale 和 Lloyd Shapley(2012年诺贝尔经济学奖得主)给出了著名的 Gale-Shapley 算法。


什么是稳定匹配?

1962年,Gale 和 Shapley 发表了一篇名为大学招生与婚姻的稳定性 (College Admissions and the Stability of Marriage) 的论文,首次提出了稳定婚姻问题,研究在一夫一妻制度下并且每个男士最终都要和一个女士结婚时,男士和女士的配对关系。这个问题后来成为研究稳定匹配的典型例子。


他们所研究的问题是要促成 n 个男士和 n 个女士之间的 n 对婚姻(所有人都是异性恋)。为了使这些婚姻稳定,我们要求所有人都把n 个异性按照自己喜欢的程度排列出来,然后根据对异性的偏好顺序来安排婚姻,最终希望找到一个稳定的匹配方案。所谓稳定匹配,满足两个条件:首先,它是一个完美匹配(所有男士都娶到了唯一的老婆,所有女士都找到了唯一的老公);其次,它不含有任何不稳定因素(没人会离婚,没人会私奔)。


举个例子。如果我们要撮合许仙、法海、白素贞和小青四位组成两对夫妻,并且他们各自的偏好列表如下

因为只有两男两女,所以只可能有两种方案。

1.(许仙,小青),(法海,白素贞)

2.(许仙,白素贞),(法海,小青)


不管从任何角度出发,把许仙和白素贞分开都是一件残忍的事,法海他老人家因为当年干了这事,还被后人指责为不懂爱,数学当然也不会为拆散有情人提供理论依据。根据定义,第一个方案是不稳定的,原因是许仙和白素贞把彼此视为第一选择,如果强加给他们不同的配偶,在他们心里,依然把对方放在第一位,从而大大增加了出轨的可能性,所以第一个方案是不稳定的。


第二个方案是稳定的。稳定方案并不意味着每一个人都会和自己最爱的心上人在一起,在这个例子里,白素贞和小青都更加青睐许仙,但是许仙只有一个,这个时候起决定性因素的是她们各自在许仙心目中的地位。两对婚姻关系确定后,就算小青对许仙念念不忘,也只能是单相思,最多也就是在家拿法海出出气,逼他还俗、逼他吃肉、逼他减肥等等,如果小青不想单身就只能接受这段姻缘。这是婚姻关系在现实社会里的一个真实写照,并不是每个人都能和最爱的人在一起,这时候,人们的选择是自己所能追求到的最佳伴侣。


Gale-Shapley算法

根据Gale和Shapley,任何一个稳定婚姻问题都有解的,也就说至少一个方案是稳定的。具体算法如下:


(1) 确定每一位男士和每一位女士都是单身。


(2) 让每一位单身男士 m 向他名单里排位最靠前并且还没有发出过交往请求的女士 w 发出交往请求:


  • 如果这位女士 w 单身,就接受交往请求,并把他们的状态都改为交往中;

  • 如果这位女士已经是在交往中了,那么比较 m 和正在与 w 交往的男士m',如果 m 比 m' 在 w 的名单里更靠前,那么 w 就会和 m 开始交往,m' 恢复单身;

  • 如果 m' 比 m 更靠前,那么 w 就继续和 m' 交往,而 m 继续向他名单里的下一位女士发出交往请求。


(3) 当所有人都在交往中的时候,就让他们结婚吧!


如果算法读起来有点绕,那就看代码。假设 n 个未婚男士的集合 M 和 n 个未婚女士的集合 W。


再举个例子

这次出场的是唐僧师徒四人加上龙王三太子(白龙马)和中国古代四大美女西施、貂蝉、王昭君、杨玉环再加上才女蔡文姬。他们对各位异性的心仪顺序如下:


欢迎读者自行应用 G-S 算法,最后的结果是方案1:


(唐僧,西施),(悟空,昭君),(八戒,文姬),(沙僧,玉环),(三太子,貂蝉)


在这个例子中,无论是从那一个男士开始配对,或是在算法进行中改变配对顺序,得到的结果将是一样的。也就是说男士们的行动顺序对最终结果没有丝毫影响。能够影响结果的只有每个人心中的那一份排序。因此对每个男士而言,除了祈祷自己的竞争对手不要太强以外,最重要的就是提升自己在心仪姑娘心目中的地位。与其抢着出手,不如多花点时间提高自身的实力,以博得心仪姑娘更多的好感。


此外,如果有一男一女,都将对方视作第一人选,那么有情人必成眷属,比如例子中的文姬与八戒。在这种情况下,只要不把他们放在一起,就会引起方案的不稳定。所以只要我最爱的人最爱我,足矣。


在放心使用 G-S 算法之前我们还需要证明它给出的方案是稳定的。第一,这个算法是有限的,不会出现死循环或是没有结果的状况,原因是每个男士最多向 n 个女士求交往,所以最多 n*n 次请求后,算法结束。1997年,这个上界被美国数学家 Knuth 降低到 n*n - n +1。第二,证明稳定性。假设在 Gale-Shapley 算法产生的方案中有一位男士 m 向一位女士 w 求交往被拒绝,那么 w 必定正在和一位她更喜欢的男士 m' 交往,因此不可能出现 m 与 w 对彼此好感度都大于自己伴侣的可能性。


男士优先还是女士优先?

俗语有云,“男追女,隔层山;女追男,隔层纱。” 如果我们让女士们采取主动,而让男士们静候佳音,Gale-Shapley算法会不会更容易一点呢?会不会带给我们不同的结果呢?用上面的例子,这次让女士们选择男士交往,得到结果方案2:


(唐僧,昭君),(悟空,玉环),(八戒,文姬),(沙僧,貂蝉),(三太子,西施)


和男生先选的方案1进行比较 (括号里是心仪顺序)


虽然这两个方案都是稳定的,但是是不同的。除了八戒,其他男生在两种方案中的配偶都不相同。那么哪一种方案更好呢?


  • 对唐僧而言,方案1更好,因为西施是4号人选而昭君是最差选择。

  • 对悟空来说,方案1更好,因为昭君是3号人选而玉环是4号人选。

  • 对沙僧来说,方案1更好,因为玉环是2号人选而貂蝉是3号人选。

  • 对三太子来说,方案1要好的多,因为貂蝉是最佳人选,而西施只排在第3位。


总体来说,男士们都倾向于第一方案。再来看看女士们的意见。为了方便,我们将两个方案的组合重新排列。


  • 对西施而言,方案2更好,三太子是2号人选,而唐僧是3号人选。

  • 对貂蝉来说,方案2是最佳方案,沙僧是第1人选,而三太子只排在第3位。

  • 对昭君来说,方案2更好,唐僧是2号人选,而悟空是4号人选。

  • 对玉环来说,方案2要好的多,悟空是最佳人选,而沙僧是3号人选。


所以全体女士都应该强烈倾向于第二方案。


于是我们得到了一个重要的推理:Gale-Shapley 算法产生的稳定方案对于主动一方是最优方案,而对被动一方是最差方案。


小结

在这个喜大普奔的节日,看过了数学家和诺贝尔经济学奖得主的经典算法,诸位单身狗是不是已经找到过节的正确姿势了?


  1. 合理前提下,所有人都能找到伴侣;

  2. 只有主动出击才能最大化幸福,被动等来的往往是最差结果;

  3. 竞争激烈时,与其抢着出手,不如多花点时间提高自身的实力,以博得心上人更多的好感;

  4. 最爱的人爱我,此生足矣;

  5. 并不是每个人都能和最爱的人在一起,如果不能,选择你所能追求到的最佳伴侣。


原文发布时间为:2015-08-20

本文来自云栖社区合作伙伴“大数据文摘”,了解相关信息可以关注“BigDataDigest”微信公众号

相关文章
|
机器学习/深度学习 算法 程序员
【关于一个单身狗在七夕向大家分享的简单必会算法题】
七夕来袭!是时候展现专属于程序员的浪漫了!单身狗的我选择了刷题hhh
95 0
|
5天前
|
机器学习/深度学习 算法
基于改进遗传优化的BP神经网络金融序列预测算法matlab仿真
本项目基于改进遗传优化的BP神经网络进行金融序列预测,使用MATLAB2022A实现。通过对比BP神经网络、遗传优化BP神经网络及改进遗传优化BP神经网络,展示了三者的误差和预测曲线差异。核心程序结合遗传算法(GA)与BP神经网络,利用GA优化BP网络的初始权重和阈值,提高预测精度。GA通过选择、交叉、变异操作迭代优化,防止局部收敛,增强模型对金融市场复杂性和不确定性的适应能力。
124 80
|
1天前
|
机器学习/深度学习 数据采集 算法
基于PSO粒子群优化的CNN-GRU-SAM网络时间序列回归预测算法matlab仿真
本项目展示了基于PSO优化的CNN-GRU-SAM网络在时间序列预测中的应用。算法通过卷积层、GRU层、自注意力机制层提取特征,结合粒子群优化提升预测准确性。完整程序运行效果无水印,提供Matlab2022a版本代码,含详细中文注释和操作视频。适用于金融市场、气象预报等领域,有效处理非线性数据,提高预测稳定性和效率。
|
2天前
|
机器学习/深度学习 算法 索引
单目标问题的烟花优化算法求解matlab仿真,对比PSO和GA
本项目使用FW烟花优化算法求解单目标问题,并在MATLAB2022A中实现仿真,对比PSO和GA的性能。核心代码展示了适应度计算、火花生成及位置约束等关键步骤。最终通过收敛曲线对比三种算法的优化效果。烟花优化算法模拟烟花爆炸过程,探索搜索空间,寻找全局最优解,适用于复杂非线性问题。PSO和GA则分别适合快速收敛和大解空间的问题。参数调整和算法特性分析显示了各自的优势与局限。
|
24天前
|
算法
基于WOA算法的SVDD参数寻优matlab仿真
该程序利用鲸鱼优化算法(WOA)对支持向量数据描述(SVDD)模型的参数进行优化,以提高数据分类的准确性。通过MATLAB2022A实现,展示了不同信噪比(SNR)下模型的分类误差。WOA通过模拟鲸鱼捕食行为,动态调整SVDD参数,如惩罚因子C和核函数参数γ,以寻找最优参数组合,增强模型的鲁棒性和泛化能力。
|
1月前
|
机器学习/深度学习 算法 Serverless
基于WOA-SVM的乳腺癌数据分类识别算法matlab仿真,对比BP神经网络和SVM
本项目利用鲸鱼优化算法(WOA)优化支持向量机(SVM)参数,针对乳腺癌早期诊断问题,通过MATLAB 2022a实现。核心代码包括参数初始化、目标函数计算、位置更新等步骤,并附有详细中文注释及操作视频。实验结果显示,WOA-SVM在提高分类精度和泛化能力方面表现出色,为乳腺癌的早期诊断提供了有效的技术支持。
|
10天前
|
供应链 算法 调度
排队算法的matlab仿真,带GUI界面
该程序使用MATLAB 2022A版本实现排队算法的仿真,并带有GUI界面。程序支持单队列单服务台、单队列多服务台和多队列多服务台三种排队方式。核心函数`func_mms2`通过模拟到达时间和服务时间,计算阻塞率和利用率。排队论研究系统中顾客和服务台的交互行为,广泛应用于通信网络、生产调度和服务行业等领域,旨在优化系统性能,减少等待时间,提高资源利用率。
|
18天前
|
存储 算法
基于HMM隐马尔可夫模型的金融数据预测算法matlab仿真
本项目基于HMM模型实现金融数据预测,包括模型训练与预测两部分。在MATLAB2022A上运行,通过计算状态转移和观测概率预测未来值,并绘制了预测值、真实值及预测误差的对比图。HMM模型适用于金融市场的时间序列分析,能够有效捕捉隐藏状态及其转换规律,为金融预测提供有力工具。
|
26天前
|
算法
基于GA遗传算法的PID控制器参数优化matlab建模与仿真
本项目基于遗传算法(GA)优化PID控制器参数,通过空间状态方程构建控制对象,自定义GA的选择、交叉、变异过程,以提高PID控制性能。与使用通用GA工具箱相比,此方法更灵活、针对性强。MATLAB2022A环境下测试,展示了GA优化前后PID控制效果的显著差异。核心代码实现了遗传算法的迭代优化过程,最终通过适应度函数评估并选择了最优PID参数,显著提升了系统响应速度和稳定性。
115 15
|
18天前
|
机器学习/深度学习 算法 信息无障碍
基于GoogleNet深度学习网络的手语识别算法matlab仿真
本项目展示了基于GoogleNet的深度学习手语识别算法,使用Matlab2022a实现。通过卷积神经网络(CNN)识别手语手势,如"How are you"、"I am fine"、"I love you"等。核心在于Inception模块,通过多尺度处理和1x1卷积减少计算量,提高效率。项目附带完整代码及操作视频。

热门文章

最新文章