大咖 | 美国工程院院士Glynn:基于数据的决策,仿真与库存管理(附PPT下载)

简介:

今天我主要是基于相关的研究问题,给大家分享一个观点——基于数据的决策。为解决各类问题,给大家展示一个由机器学习、人工智能和其他工具共同搭建的平台。

我们讨论利用仿真来进行决策,尤其是在库存管理的背景下。机器学习和人工智能正对世界产生着巨大影响,近几年的影响可能比过去几十年的总和还要突出,但这并不意味它们能解决所有的决策问题。而仿真也正在解决令人兴奋的决策问题,在决策中同样举足轻重。

当今的商业环境给予我们许多机遇和挑战。一是,更多的数据被收集,如各类数据在店铺层面、顾客层面和供应链层面被收集;二是,数据更加复杂,更多公司参与了零售环节,线上销售占据了更大比例,让人深思未来产业链的分配模式和新兴科技例如自动驾驶带来的影响。三是,很多决策过程甚至不需要人类的参与而是自动进行的。四是,对实时决策的需求突出。

5951945140a019bf0c9bd4769c27440e78aad266

最核心的问题是如何利用数据做更好的决策。当然我们都知道,机器学习和人工智能被广泛且有效地在这一领域得以应用。

7c9126992cbf9886566caa790ac7a9b24b62fe6c

机器学习和人工智能并不是仅有的途径,对于特定情境下的问题,机器学习并不适用,尤其是回答一些“what if”的问题时。当过去已发生过类似的例子并收集到大量的数据时,机器学习可以被应用,但很多时候我们没有足够的数据,或者无法获取这些历史数据,这时候机器学习就没有那么有效。

比如,第一个例子,一个零售商想要新建一个自动化的配送中心,来取代现在的人力配送。这是一项花费巨大的工程,所以管理层会想要关心这个中心能帮助提高多少配送时间和顾客满意度。这不是一个机器学习或者人工智能可以大放异彩的问题,因为我们正在面临一个崭新的决策,并没有相关的历史数据能告诉我们这个新技术给公司层面带来的利益如何

第二个例子,近年来线上销售大红大紫,在零售商利润中占据了的很大比例,传统零售业更多地参与到线上销售的过程中,他们需要更多地了解线上销售来定位自己在线上销售中的位置。有一个自然的问题是,线上订单会给线下商店带来什么影响。显然会有更多的到店订单,但与此同时货架上的商品也会减少。这其中也有许多“what if”问题会显著影响到公司的成功与否。

第三个例子是供应链管理中的大危机,例如日本地震时主要的供应链被中断了几个月,很多工厂、零售商必须连夜之间重新配置供应链。这些危机也许在未来会更普遍,因为我们的供应链趋向于全球化,因而也更有可能被潜在的危机影响。但是,对于这些问题严重缺乏历史数据,所以机器学习和人工智能难以适用。

但这些都是仿真可以代替机器学习起到作用的情景。仿真通过利用计算机和计算机实验来进行决策,主要的想法是建立供应链或者库存管理模型,迅速进行大量计算机实验来寻找主要会发生的典型情景,寻找出系统发生大变化时产生的主要影响。仿真的作用就是在问题真实发生和决策被实施之前了解到它们并及早采取措施。

c9e3ac3e18db1ea9dcaef153c4954eae7debbbdb

在现实世界中,大多重要的管理启发并不是量化的,但在机器学习中我们得到的经验和启示都是量化的。对于一个大规模的系统,机器学习的量化信息可能无法帮助我们理解系统的本身的工作原理,但是仿真也许能让我们追溯到模型的源头,了解一个供应链优于另一个的原因。


想要把一个系统的机理完全用量化的方式来衡量并不是一件容易的事。另外,在制定重大决策或者进行大笔金额投资时,我们倾向于看到各种可能结果的分布,而不是仅仅一个可能的结果。因为这一结果与随机发生的事件有关,是一个有特定原因的结果,而我们如何理解这一结果对于如何决策至关重要。

4b0709c48a71d636d2370a3f65a6f891d3cc19a3

仿真不仅仅能够补充机器学习完成其不能,同时适用于优化领域。因为优化方法在处理现实问题时,倾向于抽象并简化很多现实世界中的特点与条件,而运行仿真系统,可以包括更多的细节来验证优化问题的结论或观点对于真实世界是否适用。

a364d7a5fb1d47149a5de0785243beba51a2f485

所有的仿真模型需要数据,我们通过服从指定的分布生成随机变量的方式形成数据。例如在分配中心问题中,我们需要运送时间的数据,线下商店需要实现当地客户需求所花费的时间

其核心问题是如何建立概率模型来进而建立仿真模型。我们想要知道对于一个特定的投资组合的决策有多大的风险,利用计算机来进行仿真是预测风险的一个经典方法。例如模拟并计算未来30天内有巨大财产损失的概率,仿真对于极端事件非常敏感,所以我们想要关注的其实是极端的价格变化,常用的数据统计方法把所有数据视为同等重要来考虑,然而我们考虑的并不是分布的中间,而是分布的两边(尾部)。

同样在库存管理中,我们并不是非常担心典型的供应链行为,而更关注5%的极高顾客需求或系统负荷反常行为带来的影响。这和我们传统的数据处理和仿真模拟的想法完全不同,蕴含了很多具体有趣的研究问题,正在被我们关注。

另一个研究问题是数据仿真,这个概念在天气预测中最容易得到解释。我们得到各种各样的测量工具和数据,如何通过这些数据更好地预测天气就是一个核心问题,事实上人们做的事情正是一个初始化的仿真系统,求解一个基于前向时间的微分方程来理解大规模的天气系统,例如对未来二十四小时某地天气的预测。这类问题也越来越多的产生于零售业中,同样有大量不同来源种类的数据,具有不同的可靠程度和稳定性等,如何整合这些数据并做出更好的决策是一个即将变得愈发重要的数据仿真问题。

075e8c30fe22f799317dbd0ff5700438ac192624

总的来说,机器学习和人工智能将会是变革世界的重要科技,但仿真可以作为评估和补充它们的有效工具。

cde94fad376f256f07f240932a80662bdce1c5bf


原文发布时间为:2018-08-15
本文作者:金羽佳
本文来自云栖社区合作伙伴“ 大数据文摘”,了解相关信息可以关注“ 大数据文摘”。
相关文章
|
12月前
|
机器学习/深度学习 人工智能 分布式计算
蚁群、蜂群的智慧,大模型也可以有,谷歌等机构群体智能研究亮相
蚁群和蜂群以其独特的群体智能行为著称,如分布式决策、自组织性和鲁棒性。这些特性启发了科学家将群体智能原理应用于大模型的构建,以实现更高效、更智能的系统。谷歌等机构已通过模拟这些行为,开发出如“蚁群优化”算法等成果,显著提高了计算效率和系统的鲁棒性。然而,群体智能的应用仍面临通信协调、个体差异性和可解释性等挑战。
382 3
|
弹性计算 人工智能 PyTorch
GPU实验室-在云上部署ChatGLM2-6B大模型
ChatGLB2-6B大模型:由智谱AI及清华KEG实验室于2023年6月发布的中英双语对话开源大模型。截至2023年7月,在C-Eval中,排名靠前。Pytorch:一个开源的Python机器学习库,基于Torch,底层由C++实现,应用于人工智能领域,如计算机视觉和自然语言处理。它主要由Meta Platforms的人工智能研究团队开发。著名的用途有:特斯拉自动驾驶,Uber最初发起而现属Linux基金会项目的概率编程软件Pyro,Lightning。
|
网络协议 Ubuntu Linux
在IPad Pro上怎么实现代码自由,如何让IPad Pro变成你的生产力工具?
如何让IPad Pro变成你的生产力工具?在IPad上用Vscode写代码搞开发
630 1
在IPad Pro上怎么实现代码自由,如何让IPad Pro变成你的生产力工具?
|
存储 SQL 关系型数据库
一篇文章搞懂MySQL的分库分表,从拆分场景、目标评估、拆分方案、不停机迁移、一致性补偿等方面详细阐述MySQL数据库的分库分表方案
MySQL如何进行分库分表、数据迁移?从相关概念、使用场景、拆分方式、分表字段选择、数据一致性校验等角度阐述MySQL数据库的分库分表方案。
1688 15
一篇文章搞懂MySQL的分库分表,从拆分场景、目标评估、拆分方案、不停机迁移、一致性补偿等方面详细阐述MySQL数据库的分库分表方案
|
11月前
|
敏捷开发 数据可视化 数据挖掘
"智慧办公,从使用板栗看板开始"
板栗看板是一款基于看板管理理念的协同软件,提供直观的视觉平台,助力团队高效管理任务、跟踪进度和沟通。其核心特点包括可视化任务管理、灵活的工作流程、实时更新与通知、协同功能及数据分析,适用于项目管理、敏捷开发、跨部门协作等场景,有效提升团队效率。
|
搜索推荐 算法 C语言
【排序算法】八大排序(下)(c语言实现)(附源码)
本文继续学习并实现了八大排序算法中的后四种:堆排序、快速排序、归并排序和计数排序。详细介绍了每种排序算法的原理、步骤和代码实现,并通过测试数据展示了它们的性能表现。堆排序利用堆的特性进行排序,快速排序通过递归和多种划分方法实现高效排序,归并排序通过分治法将问题分解后再合并,计数排序则通过统计每个元素的出现次数实现非比较排序。最后,文章还对比了这些排序算法在处理一百万个整形数据时的运行时间,帮助读者了解不同算法的优劣。
404 7
|
SQL 数据库
执行 Transact-SQL 语句或批处理时发生了异常。 (Microsoft.SqlServer.ConnectionInfo)之解决方案
执行 Transact-SQL 语句或批处理时发生了异常。 (Microsoft.SqlServer.ConnectionInfo)之解决方案
1409 0
|
网络协议 物联网 网络性能优化
家庭常用的宽带支持UDP吗?
家庭宽带通常通过互联网服务提供商(ISP)提供,而网络协议影响数据传输效率。UDP(用户数据报协议)无需建立稳定连接即可快速传送数据包,适用于在线游戏、视频通话等实时应用。本文探讨家庭宽带对UDP的支持及其应用场景,尽管UDP速度快,但也存在数据丢失风险。文中还介绍了如何通过优化路由器设置提升UDP性能,确保家庭网络中的实时应用流畅运行。
|
机器学习/深度学习 人工智能 自然语言处理
AI与人类协作的未来:探索智能辅助系统的新篇章
本文旨在探讨人工智能(AI)如何在未来的工作中与人类形成更紧密的合作关系。通过分析当前的技术趋势和未来的发展预测,我们将揭示AI如何成为增强人类能力的助手,而非替代者。文章将详细讨论AI在医疗、教育和创意产业中的应用案例,并展望未来AI技术的发展方向和潜在的社会影响。最后,我们将反思这种合作对人类社会的深远意义,并提出对未来工作场景的建议。
|
弹性计算 运维 自然语言处理
属于Basis运维的、在Linux平台上运行的大模型测评 OS Copilot智能助手测评
OS Copilot是阿里云为Linux打造的智能操作系统助手,基于大模型,助用户进行自然语言问答、命令执行和系统运维。它简化了Linux操作,适合新手和运维人员。测评者作为IT架构师,发现OS Copilot使非技术背景人员也能操作Linux,接入命令可在官方文档找到。测试显示,通过"co"命令可与OS Copilot交互,实现生产任务融合。该工具提高了工作效率,尤其是对于遗忘具体命令时,非常有帮助。文档清晰,适合生产环境使用,值得进一步探索。
347 0