Reading Club | 算法和人生抉择:午饭到底吃什么?

本文涉及的产品
云原生大数据计算服务MaxCompute,500CU*H 100GB 3个月
云原生大数据计算服务 MaxCompute,5000CU*H 100GB 3个月
简介:

午饭吃什么?去拔草楼下新开的餐厅,还是去对面那家常去的小馆子?

这可能是很多人每天面临的亘古选择题,也是我们每一天都在做一类特定的选择:选择已知的最爱还是未知的可能?

如何平衡这个选择不仅是我们纠结的日常,也是计算机学家半个世纪以来的研究对象。

春节前,大数据文摘启动了最新音频栏目——Data Reading Club,我们为大家推荐的书籍是Algorithm to Live by(生活中的算法),上一期我们跟大家探讨了算法与人生伴侣的选择——神奇的37%法则。

本周,我们继续聊聊【选择】这个人生中的重大话题。由来自杜克大学美女主播段天霖与大家分享:在选择时,如何衡量“坚守已知(exploit)”或者“探索未知(explore)”。

就像读书会小蒋所说:对于计算机来说,explore代表收集信息,而exploit是运用这些信息来达到一个确定的理想结果;在生活中,explore是我们对未知世界的探索,而exploit是享受已知的美好。

从这个意义上讲,认识一个新朋友、听一首新歌是explore,与家人团聚、听一首循环无数次的老歌就是exploit。仔细想想,生活中这两者总是共存的,但他们之间的平衡却是因人而异的。那么从算法的角度,这个命题是否存在一种最佳解法呢?

要回答这个问题,我们还是要从它的起源说起。

虽然,计算机科学家对于午饭吃什么有种有啥吃啥的佛系心态,但是,他们对于幻想怎么在赌场赚最多的银子倒是有极大的热情。

假设赌场中有一排未知预期收益的老虎机,只能靠投钱来以身试法,你要花多久时间来收集信息,又该在什么时候锁定目标发家致富呢,这就是Explore-Exploit的最经典案例,multi-armed bandit,多臂老虎机问题。

让我们从这个经典案例说起,看看历史上,不同科学家是如何选择的。

36fbc05fa388d7b6d8d72b5b0e6b309db1d2cc56

Win-Stay逻辑

也许你可以随机挑选一台老虎机,只要你在赢就一直盯住它,一旦输了就转投另一台,以此循环。

这是由哥伦比亚大学的数学家Herbert Robbins针对多臂老虎机问题提出的第一个解法: Win-Stay Lose-Shift。

这个解法中Win-Stay的逻辑很直观:如果你已经选择一台机器,那么如果它让你赢了,那只会让你更有可能继续选择这台机器;但Lose-Shift就有待推敲了:试想你认准的机器让你连赢10次,但在第11次输了,你真的会因为这一次的结果而彻底改换一个尝试对象吗?

就像你最爱的那家餐厅,你真的会因为某一次的某道菜没有那么好吃就不再去了吗?

抓住时机

假设我们考虑的时间是一个有限的区间,探索的价值是逐日递减的,且不说你新发现的选项到底是不是比你目前的最爱更好,就算你找到了新的最爱,已经用来explore的时间也意味着起码这一次留给你exploit的时间没有多少了。

反过来,有限时间里exploit的价值却是递增的。你截止这个月为止最爱的餐厅by definition就一定和你上个月之前所尝试过的餐厅一样好或更好。

所以时间的维度决定了我们的策略应当根据剩余时间而定:如果你还有大把的时间去explore或者exploit,那么尽情探索吧。

基廷斯系数

现在我们知道了interval是平衡explore/exploit的关键,同时它并不一定是一个具象甚至有界的期限,那么我们该如何将这种对于interval的认知融合到算法中呢?

Gittins Index回答了这个问题。

要理解Gittins Index 基廷斯系数,我们要先介绍一个经济学中常见的概念:time discounting,Gittins认为这种单位回报是呈几何递减的。

以选择餐厅为例,如果你认为你有1%的可能性某天会离开这座城市,那么一顿第二天晚餐的价值就应该是今天晚餐价值的0.99,依次递推。基于目前所收集的信息,Gittins Index为每一种情况都赋予了一个系数。

因此,你的众多选择瞬间变成一个明确的定量比较——谁系数高就选谁。

后悔值和最优值

1985年,提出Win-Stay Lose-Shift的那位哥大数学家Robbins时隔多年又带着加强版解法归来了。

这一次他提供了另一个看待这类问题的思路:在你做一个选择时,你不必纠结任何一个选项会给你带来什么,而是扪心自问,如果不做某个决定,你会有多后悔?

Robbins的新算法所做的将后悔量化,定义为实施某一特定策略所得到的回报与最大可能的回报之间的差值,就是选择那个将你的后悔值最小化的策略。

如何平衡?

不过人和机器终究还是不同的,我们并不会、也不需要总按照最佳策略生活。

6bc81d87eac4a3b60c2d76a2fc40599430a6dbae

面对这变幻不息的世界,我们能从这些算法中学到的,或许并不只是某一种策略,而更是一种新的看待选择与变化的方式:

人生的旅程中,刚刚启程的孩子正该尽情探索属于他们的无限可能,而年纪渐长的父母老人在我们眼里的固执己见,又何尝不是一种看过更多人生风景后的积累与沉淀。

二月已过、三月将来,新春伊始,不如就从今天起将这些新的体会付诸实践:探索一家新的餐厅,也挑战踏出你的舒适圈,或许渐渐你会发现,生活真的一天比一天更美好。

以上就是Algorithm to Live by第二章的内容主要内容,点击阅读原文收听大数据文摘喜马拉雅专栏音频《生活中的算法》

在这个崭新的专栏中,我们将陆续探讨这些你在生活中将要用到的算法。这些算法和观点将主要来自一本算法书籍Algorithm to Live by(生活中的算法),这本书被称为“the computer science of human decisions(人生抉择中的计算机科学)”。主播段天霖告诉我们,在杜克大学和斯坦福大学等学府的统计学和计算机系,这本书几乎人手一本,是一本难得引人深思的好书。

45336204b8aac4865a8100daad3141da9064600f

在这个新的栏目里,我们将从这本书出发,探讨算法和人生的关系。当然,其中所涉及的并不只是计算机科学,它与数学、工程学、认知科学、心理学、经济学都通通相关。

本书的两位作者除了本专业,也都在这些方面各有建树:Brian Christian是位布朗大学计算机与哲学双学位毕业的作家和诗人,Tom Griffith则是斯坦福统计与心理学毕业的加州伯克利教授,专攻computational cognitive science,计算认知科学。

ca211af3a18b8d48402837ce563ee9e13cef766b

不仅如此,这两位大神还专门找到当初设计这些计算机算法的科学家们,了解这些算法背后的故事。接下来的一段时间,我们将在这个新栏目中,跟随他们的脚步,探讨一些人类和计算机所共同面临的难题:

如何分配有限的空间、时间、注意力;如何应对不完整的信息和无限的未知......我们将了解到计算机是如何尝试优化这些问题的,而我们作为人类可以如何借鉴,又面临着哪些独特的挑战。

最后,希望这本书的旅程能让你我都能有所收获,并带着一种新的视角来审视取舍与抉择,这个人生中永恒的主题。 

当然,我们也欢迎对这本书和我们的栏目感兴趣的读者,加入我们的reading club,和我们一同阅读本书,发表你的评论,探讨相关话题。


原文发布时间为:2018-02-28

本文作者:文摘菌

本文来自云栖社区合作伙伴“大数据文摘”,了解相关信息可以关注“大数据文摘”微信公众号

相关实践学习
基于MaxCompute的热门话题分析
本实验围绕社交用户发布的文章做了详尽的分析,通过分析能得到用户群体年龄分布,性别分布,地理位置分布,以及热门话题的热度。
SaaS 模式云数据仓库必修课
本课程由阿里云开发者社区和阿里云大数据团队共同出品,是SaaS模式云原生数据仓库领导者MaxCompute核心课程。本课程由阿里云资深产品和技术专家们从概念到方法,从场景到实践,体系化的将阿里巴巴飞天大数据平台10多年的经过验证的方法与实践深入浅出的讲给开发者们。帮助大数据开发者快速了解并掌握SaaS模式的云原生的数据仓库,助力开发者学习了解先进的技术栈,并能在实际业务中敏捷的进行大数据分析,赋能企业业务。 通过本课程可以了解SaaS模式云原生数据仓库领导者MaxCompute核心功能及典型适用场景,可应用MaxCompute实现数仓搭建,快速进行大数据分析。适合大数据工程师、大数据分析师 大量数据需要处理、存储和管理,需要搭建数据仓库?学它! 没有足够人员和经验来运维大数据平台,不想自建IDC买机器,需要免运维的大数据平台?会SQL就等于会大数据?学它! 想知道大数据用得对不对,想用更少的钱得到持续演进的数仓能力?获得极致弹性的计算资源和更好的性能,以及持续保护数据安全的生产环境?学它! 想要获得灵活的分析能力,快速洞察数据规律特征?想要兼得数据湖的灵活性与数据仓库的成长性?学它! 出品人:阿里云大数据产品及研发团队专家 产品 MaxCompute 官网 https://www.aliyun.com/product/odps 
目录
打赏
0
0
0
0
73532
分享
相关文章
告别低效编程!Python算法设计与分析中,时间复杂度与空间复杂度的智慧抉择!
【7月更文挑战第22天】在编程中,时间复杂度和空间复杂度是评估算法效率的关键。时间复杂度衡量执行时间随数据量增加的趋势,空间复杂度关注算法所需的内存。在实际应用中,开发者需权衡两者,根据场景选择合适算法,如快速排序(平均O(n log n),最坏O(n^2),空间复杂度O(log n)至O(n))适合大规模数据,而归并排序(稳定O(n log n),空间复杂度O(n))在内存受限或稳定性要求高时更有利。通过优化,如改进基准选择或减少复制,可平衡这两者。理解并智慧地选择算法是提升代码效率的关键。
109 1
基于和声搜索优化算法的机器工作调度matlab仿真,输出甘特图
本程序基于和声搜索优化算法(Harmony Search, HS),实现机器工作调度的MATLAB仿真,输出甘特图展示调度结果。算法通过模拟音乐家即兴演奏寻找最佳和声的过程,优化任务在不同机器上的执行顺序,以最小化完成时间和最大化资源利用率为目标。程序适用于MATLAB 2022A版本,运行后无水印。核心参数包括和声记忆大小(HMS)等,适应度函数用于建模优化目标。附带完整代码与运行结果展示。
基于AES的遥感图像加密算法matlab仿真
本程序基于MATLAB 2022a实现,采用AES算法对遥感图像进行加密与解密。主要步骤包括:将彩色图像灰度化并重置大小为256×256像素,通过AES的字节替换、行移位、列混合及轮密钥加等操作完成加密,随后进行解密并验证图像质量(如PSNR值)。实验结果展示了原图、加密图和解密图,分析了图像直方图、相关性及熵的变化,确保加密安全性与解密后图像质量。该方法适用于保护遥感图像中的敏感信息,在军事、环境监测等领域具有重要应用价值。
基于免疫算法的最优物流仓储点选址方案MATLAB仿真
本程序基于免疫算法实现物流仓储点选址优化,并通过MATLAB 2022A仿真展示结果。核心代码包括收敛曲线绘制、最优派送路线规划及可视化。算法模拟生物免疫系统,通过多样性生成、亲和力评价、选择、克隆、变异和抑制机制,高效搜索最优解。解决了物流仓储点选址这一复杂多目标优化问题,显著提升物流效率与服务质量。附完整无水印运行结果图示。
基于免疫算法的最优物流仓储点选址方案MATLAB仿真
基于GA遗传优化TCN-GRU时间卷积神经网络时间序列预测算法matlab仿真
本项目基于MATLAB2022a开发,提供无水印算法运行效果预览及核心程序(含详细中文注释与操作视频)。通过结合时间卷积神经网络(TCN)和遗传算法(GA),实现复杂非线性时间序列的高精度预测。TCN利用因果卷积层与残差连接提取时间特征,GA优化超参数(如卷积核大小、层数等),显著提升模型性能。项目涵盖理论概述、程序代码及完整实现流程,适用于金融、气象、工业等领域的时间序列预测任务。
基于遗传优化算法的多AGV栅格地图路径规划matlab仿真
本程序基于遗传优化算法实现多AGV栅格地图路径规划的MATLAB仿真(测试版本:MATLAB2022A)。支持单个及多个AGV路径规划,输出路径结果与收敛曲线。核心程序代码完整,无水印。算法适用于现代工业与物流场景,通过模拟自然进化机制(选择、交叉、变异)解决复杂环境下的路径优化问题,有效提升效率并避免碰撞。适合学习研究多AGV系统路径规划技术。
基于GA遗传算法的斜拉桥静载试验车辆最优布载matlab仿真
本程序基于遗传算法(GA)实现斜拉桥静载试验车辆最优布载的MATLAB仿真,旨在自动化确定车辆位置以满足加载效率ηq(0.95≤ηq≤1.05)的要求,目标是使ηq尽量接近1,同时减少加载车辆数量和布载耗时。程序通过迭代优化计算车辆位置、方向、类型及占用车道等参数,并展示适应度值收敛过程。测试版本为MATLAB2022A,包含核心代码与运行结果展示。优化模型综合考虑车辆总重量、间距及桥梁允许载荷密度等约束条件,确保布载方案科学合理。
基于ECC簇内分组密钥管理算法的无线传感器网络matlab性能仿真
本程序基于ECC(椭圆曲线密码学)簇内分组密钥管理算法,对无线传感器网络(WSN)进行MATLAB性能仿真。通过对比网络通信开销、存活节点数量、网络能耗及数据通信量四个关键指标,验证算法的高效性和安全性。程序在MATLAB 2022A版本下运行,结果无水印展示。算法通过将WSN划分为多个簇,利用ECC生成和分发密钥,降低计算与通信成本,适用于资源受限的传感器网络场景,确保数据保密性和完整性。

热门文章

最新文章