启动大数据项目之前需要问的5个问题

本文涉及的产品
云原生大数据计算服务MaxCompute,500CU*H 100GB 3个月
简介:

在关于设备性能,供应商关键绩效指标(KPI)和库存水平的每周报告之间,更多的数据可能是供应链管理者最不愿意处理的事情。

然而,每天有更多的数据不断涌现:根据IBM公司的调查报告,全球每天创造2.5EB字节的数据(即10亿千兆字节)。但它并不总是这样。根据IBM公司的计算,世界上90%的数据只是在过去两年创建的,而且报告中显示,企业使用数据可以节省数百万美元,并以前所未有的方式提高工作效率。

当企业预算收紧时,管理人员采用大数据以提高效率,这并不奇怪。毕竟,许多公司花费十多年时间来引进或升级数据处理系统,并采用云计算和/或物联网。现在,供应链管理者被要求使用这些数据,因此这说起来容易,做起来难。

人们需要认识到盲目启动项目所面临的挑战,JDA软件公司实验室负责人SureshAcharya对于大数据的应用进行了解析。

Acharya说,“没有什么是令人望而生畏的,有一个方法可以做到这一点。”他指出,供应链管理者在启动一个新项目之前必须问自己五个问题:

1.自己的业务案例是什么?

也许当管理人员试图应用数据时,其最大的问题是在头脑中没有一个能够解决的案例。当开始一个新项目时,供应链管理者应该有一个特定的业务问题要解决(比如,库存过剩),并能够量化(减少5%,将节省多少费用)。

“如果你从数据中找出需要解决的业务问题,那么这真的是本末倒置。”Acharya说。“你想要说的是:这是我想要解决的问题,是我所拥有的数据。那么是否打算收集或者购买和订阅,以帮助解决这个问题?”

“所以,需要确保你有一个业务案例,并试图解决一个业务问题,”他补充说。

2.有正确的数据源吗?

考虑到一个大数据项目作为一个需要解决的问题,而不是一个要完成的项目,这可能会表明目前可用的数据不是解决这个问题所需的信息。

“如果要查看库存或缺货情况,你有库存的数据吗?你有关于销售点或订单吗?或任何事情都可能是数据。你应该对想要解决的业务问题和拥有的数据源进行调整。”Acharya说。

提出此问题可能有助于在继续实施项目之前确定必须收集哪些其他数据。也许需要来自供应商的附加产品信息,或者来自零售商的不同销售点信息。如果合作伙伴不能提供此信息,则可能需要一种新的方法。

3.你的数据是否可用?

与第二个问题类似,供应链管理人员必须能够考虑如何记录和存储可以用来解决其业务案例的数据。

存在几种类型的数据,但无论数据是结构化的还是非结构化的,内生的或外生的,可以基于数据项目的性质来区分。换句话说,零售商和制造商可以收集各种非结构化数据,例如对产品的客户评论。但是,每一方收集,量化,分析数据的方式不同,因此根据他们的业务案例的需要可能完全不同。能够收集数据集不使它可用;业务实例的参数决定它是否可用。

“如果你认为有很多数据,但却没有真正检查是否会增加或帮助解决业务问题,那么你需要退一步并想办法解决。”Acharya说。

4.算法是否存在?

一旦商业案例被确定,并且可用数据被判断为相关和有用,企业必须确保问题可以基于当前可用的算法来解决...如果它不能,最好寻找一个更好的解决方案。

“这并不是说只要有数据,就一定有办法来帮助你解决它。无论对于学术界还是业界来说,有些问题确实是新的,这些问题尚未得到解决。”Acharya说。

“可能有一种方法来解决它,但这个具体问题可可能没有解决,所以你也需要做好探索算法的准备。”他补充说。

5.样本是什么?

如果所有上述条件都能满足,那么大数据项目是可行的。然而,只是因为可以做到,并不意味着执行者应该急于实施。

“所有这一切都应该首先在一个非常小的样本上进行测试。”Acharya说,“你想尝试一下小样本,然后如果它是可行的,已经解决了问题,那么可以开始扩大规模。“

就像生产运行需要原型和样本一样,大数据项目需要一个测试研究来确定可行性。在理想情况下,这样的项目将创建可操作的结果,但是如果算法或实施方法有问题,结果可能获得错误的解决方案。对于人们来说,不能实施项目总比错误实施项目要好。

原文发布时间为:2017年3月31日
本文来自云栖社区合作伙伴至顶网,了解相关信息可以关注至顶网。
相关实践学习
基于MaxCompute的热门话题分析
Apsara Clouder大数据专项技能认证配套课程:基于MaxCompute的热门话题分析
目录
相关文章
|
人工智能 API Docker
智能文档检索和简便集成的开源 AI 问答工具:Danswer
当你使用 Danswer 时,只需以自然的方式提出问题,就像与朋友交谈一样简单,它会自动搜索公司内部的文件和资料,然后给你一个可靠的答案,并附上来源。
|
9月前
|
弹性计算 监控 安全
API稳定安全最佳实践:用阿里云SDK为业务保驾护航
阿里云智能集团高级技术专家赵建强和曹佩杰介绍了API稳定安全最佳实践,涵盖业务上云真实案例、集成开发最佳实践、配额管理和共担模型四部分。通过分析企业在不同阶段遇到的问题,如签名报错、异常处理不严谨、扩容失败等,提出了解决方案和工具,确保API调用的安全性和稳定性。特别强调了SDK的使用、无AK方案、自动刷新机制以及配额中心的作用,帮助用户构建更稳定、安全的服务,提升运维效率。最终介绍了集成开发共担模型,旨在通过最佳实践和平台工具,保障业务的稳定与安全,推动行业创新与发展。
考研高数之无穷级数题型一:判断收敛性、求收敛半径以及收敛域和收敛区间(题目讲解)
考研高数之无穷级数题型一:判断收敛性、求收敛半径以及收敛域和收敛区间(题目讲解)
1276 0
|
开发框架 移动开发 程序员
【周末闲谈】“PHP是最好的语言”这个梗是怎么来的?
【周末闲谈】“PHP是最好的语言”这个梗是怎么来的?
795 0
|
Web App开发 索引
Qt之QTableView显示富文本
简述 对于QTableView中的显示,我们前面介绍过很多种,其中包括:文本、进度条、复选框等,今天我们介绍一下关于富文本的显示。 可能绝大多数小伙伴会通过QAbstractTableModel中的data来实现,可是现实告诉我们,那是行不通的,那么我们如何去显示呢?请看正文。 简述 效果 源码 分析 效果 源码 下面我们使用QAbstrac
1159 0
|
存储 分布式计算 数据挖掘
MaxCompute
MaxCompute是阿里云提供的一种大数据处理平台,它能够处理海量数据的存储和计算,提供PB级别的数据存储和处理能力。
1089 1
|
弹性计算 负载均衡 对象存储
阿里云新用户免费领云服务器并搭建网站教程分享(图文教程)
阿里云新用户免费领云服务器并搭建网站教程分享(图文教程)
504 0
|
弹性计算 Windows
阿里云服务器支持Windows Server 2008操作系统镜像
阿里云服务器Windows Server 2008操作系统镜像支持
832 0
阿里云服务器支持Windows Server 2008操作系统镜像
|
算法 安全 Java
农场养成种树游戏玩法及开发逻辑说明【详情】
农场养成种树是一种模拟游戏,让玩家扮演农场主或园艺师,在游戏中种植和护理各种树木
|
存储 搜索推荐 小程序
案例酷丨招商蛇口:智慧平台一键升级,驶入多业态融合新航道
案例酷丨招商蛇口:智慧平台一键升级,驶入多业态融合新航道
1194 0