大咖 | 美国工程院院士Glynn:基于数据的决策,仿真与库存管理(附PPT下载)

简介:

今天我主要是基于相关的研究问题,给大家分享一个观点——基于数据的决策。为解决各类问题,给大家展示一个由机器学习、人工智能和其他工具共同搭建的平台。

我们讨论利用仿真来进行决策,尤其是在库存管理的背景下。机器学习和人工智能正对世界产生着巨大影响,近几年的影响可能比过去几十年的总和还要突出,但这并不意味它们能解决所有的决策问题。而仿真也正在解决令人兴奋的决策问题,在决策中同样举足轻重。

当今的商业环境给予我们许多机遇和挑战。一是,更多的数据被收集,如各类数据在店铺层面、顾客层面和供应链层面被收集;二是,数据更加复杂,更多公司参与了零售环节,线上销售占据了更大比例,让人深思未来产业链的分配模式和新兴科技例如自动驾驶带来的影响。三是,很多决策过程甚至不需要人类的参与而是自动进行的。四是,对实时决策的需求突出。

5951945140a019bf0c9bd4769c27440e78aad266

最核心的问题是如何利用数据做更好的决策。当然我们都知道,机器学习和人工智能被广泛且有效地在这一领域得以应用。

7c9126992cbf9886566caa790ac7a9b24b62fe6c

机器学习和人工智能并不是仅有的途径,对于特定情境下的问题,机器学习并不适用,尤其是回答一些“what if”的问题时。当过去已发生过类似的例子并收集到大量的数据时,机器学习可以被应用,但很多时候我们没有足够的数据,或者无法获取这些历史数据,这时候机器学习就没有那么有效。

比如,第一个例子,一个零售商想要新建一个自动化的配送中心,来取代现在的人力配送。这是一项花费巨大的工程,所以管理层会想要关心这个中心能帮助提高多少配送时间和顾客满意度。这不是一个机器学习或者人工智能可以大放异彩的问题,因为我们正在面临一个崭新的决策,并没有相关的历史数据能告诉我们这个新技术给公司层面带来的利益如何

第二个例子,近年来线上销售大红大紫,在零售商利润中占据了的很大比例,传统零售业更多地参与到线上销售的过程中,他们需要更多地了解线上销售来定位自己在线上销售中的位置。有一个自然的问题是,线上订单会给线下商店带来什么影响。显然会有更多的到店订单,但与此同时货架上的商品也会减少。这其中也有许多“what if”问题会显著影响到公司的成功与否。

第三个例子是供应链管理中的大危机,例如日本地震时主要的供应链被中断了几个月,很多工厂、零售商必须连夜之间重新配置供应链。这些危机也许在未来会更普遍,因为我们的供应链趋向于全球化,因而也更有可能被潜在的危机影响。但是,对于这些问题严重缺乏历史数据,所以机器学习和人工智能难以适用。

但这些都是仿真可以代替机器学习起到作用的情景。仿真通过利用计算机和计算机实验来进行决策,主要的想法是建立供应链或者库存管理模型,迅速进行大量计算机实验来寻找主要会发生的典型情景,寻找出系统发生大变化时产生的主要影响。仿真的作用就是在问题真实发生和决策被实施之前了解到它们并及早采取措施。

c9e3ac3e18db1ea9dcaef153c4954eae7debbbdb

在现实世界中,大多重要的管理启发并不是量化的,但在机器学习中我们得到的经验和启示都是量化的。对于一个大规模的系统,机器学习的量化信息可能无法帮助我们理解系统的本身的工作原理,但是仿真也许能让我们追溯到模型的源头,了解一个供应链优于另一个的原因。


想要把一个系统的机理完全用量化的方式来衡量并不是一件容易的事。另外,在制定重大决策或者进行大笔金额投资时,我们倾向于看到各种可能结果的分布,而不是仅仅一个可能的结果。因为这一结果与随机发生的事件有关,是一个有特定原因的结果,而我们如何理解这一结果对于如何决策至关重要。

4b0709c48a71d636d2370a3f65a6f891d3cc19a3

仿真不仅仅能够补充机器学习完成其不能,同时适用于优化领域。因为优化方法在处理现实问题时,倾向于抽象并简化很多现实世界中的特点与条件,而运行仿真系统,可以包括更多的细节来验证优化问题的结论或观点对于真实世界是否适用。

a364d7a5fb1d47149a5de0785243beba51a2f485

所有的仿真模型需要数据,我们通过服从指定的分布生成随机变量的方式形成数据。例如在分配中心问题中,我们需要运送时间的数据,线下商店需要实现当地客户需求所花费的时间

其核心问题是如何建立概率模型来进而建立仿真模型。我们想要知道对于一个特定的投资组合的决策有多大的风险,利用计算机来进行仿真是预测风险的一个经典方法。例如模拟并计算未来30天内有巨大财产损失的概率,仿真对于极端事件非常敏感,所以我们想要关注的其实是极端的价格变化,常用的数据统计方法把所有数据视为同等重要来考虑,然而我们考虑的并不是分布的中间,而是分布的两边(尾部)。

同样在库存管理中,我们并不是非常担心典型的供应链行为,而更关注5%的极高顾客需求或系统负荷反常行为带来的影响。这和我们传统的数据处理和仿真模拟的想法完全不同,蕴含了很多具体有趣的研究问题,正在被我们关注。

另一个研究问题是数据仿真,这个概念在天气预测中最容易得到解释。我们得到各种各样的测量工具和数据,如何通过这些数据更好地预测天气就是一个核心问题,事实上人们做的事情正是一个初始化的仿真系统,求解一个基于前向时间的微分方程来理解大规模的天气系统,例如对未来二十四小时某地天气的预测。这类问题也越来越多的产生于零售业中,同样有大量不同来源种类的数据,具有不同的可靠程度和稳定性等,如何整合这些数据并做出更好的决策是一个即将变得愈发重要的数据仿真问题。

075e8c30fe22f799317dbd0ff5700438ac192624

总的来说,机器学习和人工智能将会是变革世界的重要科技,但仿真可以作为评估和补充它们的有效工具。

cde94fad376f256f07f240932a80662bdce1c5bf


原文发布时间为:2018-08-15
本文作者:金羽佳
本文来自云栖社区合作伙伴“ 大数据文摘”,了解相关信息可以关注“ 大数据文摘”。
相关文章
|
人工智能 自然语言处理 自动驾驶
阿里云入选Gartner® AI代码助手魔力象限挑战者象限
Gartner发布业界首个AI代码助手魔力象限,全球共12家企业入围,阿里云,成为唯一进入挑战者象限的中国科技公司。对阿里云而言,此次入选代表了其通义灵码在产品功能和市场应用等方面的优秀表现。
|
存储 SQL 大数据
用实时计算释放当下企业大数据潜能
本文整理自阿里云高级产品解决方案架构师王启华(敖北)老师在 Flink Forward Asia 2023 中闭门会的分享。
849 8
用实时计算释放当下企业大数据潜能
|
索引 Python
【Python篇】NumPy完整指南(上篇):掌握数组、矩阵与高效计算的核心技巧1
【Python篇】NumPy完整指南(上篇):掌握数组、矩阵与高效计算的核心技巧
527 4
|
Kubernetes 网络虚拟化 容器
在K8S中,cailico的ipip模型和ciliume的vxlan模型除了在具体的实现不同,在原理上有何区别?
在K8S中,cailico的ipip模型和ciliume的vxlan模型除了在具体的实现不同,在原理上有何区别?
|
监控 安全 API
WebSocket通过建立一个持久的连接实现实时双向通信
【5月更文挑战第2天】WebSocket通过建立一个持久的连接实现实时双向通信
580 4
|
机器学习/深度学习 分布式计算 并行计算
MapReduce是一种用于并行计算的编程模型和处理大规模数据集的实现
MapReduce是一种用于并行计算的编程模型和处理大规模数据集的实现
300 0
|
机器学习/深度学习 人工智能 编解码
OCR文字识别方法综述
摘 要:文字识别可以把海量非结构化数据转换为结构化数据,从而支撑各种创新的人工智能应用,是计算机视觉研究领域的分支之一,其任务是识别出图像中的文字内容,一般输入来自于文本检测得到的文本框截取出的图像文字区域。近几年来,基于深度学习的文字识别算法模型已取得不错成果,其过程无需进行特征处理且可以实现复杂场景文字识别,效果要优于传统文字识别方法,逐渐成为文字识别研究应用的主流方式。本文将主要介绍基于深度学习的文字识别技术综述,分类总结主流文字识别经典算法,讨论未来文字识别领域发展与研究趋势。
4388 0
OCR文字识别方法综述
|
存储 弹性计算 运维
Tair 的实操流程及常见问题 | 学习笔记
快速学习 Tair 的实操流程及常见问题
Tair 的实操流程及常见问题 | 学习笔记
|
弹性计算
阿里云服务器带宽价格收费标准(按固定带宽/使用流量)
阿里云服务器带宽计费模式选择按固定带宽计费,带宽值选择1M,那么需要按照23元/M/月的价格支付带宽费,带宽价格是根据带宽值阶梯收费的,如果带宽值选择6M,其中5M按照23元/月的单价计算,多出来的1M按照80元/月的单价支付
3027 0
阿里云服务器带宽价格收费标准(按固定带宽/使用流量)