启动大数据项目之前需要问的5个问题

简介:

在关于设备性能,供应商关键绩效指标(KPI)和库存水平的每周报告之间,更多的数据可能是供应链管理者最不愿意处理的事情。

然而,每天有更多的数据不断涌现:根据IBM公司的调查报告,全球每天创造2.5EB字节的数据(即10亿千兆字节)。但它并不总是这样。根据IBM公司的计算,世界上90%的数据只是在过去两年创建的,而且报告中显示,企业使用数据可以节省数百万美元,并以前所未有的方式提高工作效率。

2017-04-01-55f3e85fd5-0be1-4fbb-9620-875

当企业预算收紧时,管理人员采用大数据以提高效率,这并不奇怪。毕竟,许多公司花费十多年时间来引进或升级数据处理系统,并采用云计算和/或物联网。现在,供应链管理者被要求使用这些数据,因此这说起来容易,做起来难。

人们需要认识到盲目启动项目所面临的挑战,JDA软件公司实验室负责人SureshAcharya对于大数据的应用进行了解析。

Acharya说,“没有什么是令人望而生畏的,有一个方法可以做到这一点。”他指出,供应链管理者在启动一个新项目之前必须问自己五个问题:

1.自己的业务案例是什么?

也许当管理人员试图应用数据时,其最大的问题是在头脑中没有一个能够解决的案例。当开始一个新项目时,供应链管理者应该有一个特定的业务问题要解决(比如,库存过剩),并能够量化(减少5%,将节省多少费用)。

“如果你从数据中找出需要解决的业务问题,那么这真的是本末倒置。”Acharya说。“你想要说的是:这是我想要解决的问题,是我所拥有的数据。那么是否打算收集或者购买和订阅,以帮助解决这个问题?”

“所以,需要确保你有一个业务案例,并试图解决一个业务问题,”他补充说。

2.有正确的数据源吗?

考虑到一个大数据项目作为一个需要解决的问题,而不是一个要完成的项目,这可能会表明目前可用的数据不是解决这个问题所需的信息。

“如果要查看库存或缺货情况,你有库存的数据吗?你有关于销售点或订单吗?或任何事情都可能是数据。你应该对想要解决的业务问题和拥有的数据源进行调整。”Acharya说。

提出此问题可能有助于在继续实施项目之前确定必须收集哪些其他数据。也许需要来自供应商的附加产品信息,或者来自零售商的不同销售点信息。如果合作伙伴不能提供此信息,则可能需要一种新的方法。

3.你的数据是否可用?

与第二个问题类似,供应链管理人员必须能够考虑如何记录和存储可以用来解决其业务案例的数据。

存在几种类型的数据,但无论数据是结构化的还是非结构化的,内生的或外生的,可以基于数据项目的性质来区分。换句话说,零售商和制造商可以收集各种非结构化数据,例如对产品的客户评论。但是,每一方收集,量化,分析数据的方式不同,因此根据他们的业务案例的需要可能完全不同。能够收集数据集不使它可用;业务实例的参数决定它是否可用。

“如果你认为有很多数据,但却没有真正检查是否会增加或帮助解决业务问题,那么你需要退一步并想办法解决。”Acharya说。

4.算法是否存在?

一旦商业案例被确定,并且可用数据被判断为相关和有用,企业必须确保问题可以基于当前可用的算法来解决...如果它不能,最好寻找一个更好的解决方案。

“这并不是说只要有数据,就一定有办法来帮助你解决它。无论对于学术界还是业界来说,有些问题确实是新的,这些问题尚未得到解决。”Acharya说。

“可能有一种方法来解决它,但这个具体问题可可能没有解决,所以你也需要做好探索算法的准备。”他补充说。

5.样本是什么?

如果所有上述条件都能满足,那么大数据项目是可行的。然而,只是因为可以做到,并不意味着执行者应该急于实施。

“所有这一切都应该首先在一个非常小的样本上进行测试。”Acharya说,“你想尝试一下小样本,然后如果它是可行的,已经解决了问题,那么可以开始扩大规模。“

就像生产运行需要原型和样本一样,大数据项目需要一个测试研究来确定可行性。在理想情况下,这样的项目将创建可操作的结果,但是如果算法或实施方法有问题,结果可能获得错误的解决方案。对于人们来说,不能实施项目总比错误实施项目要好。



本文出处:畅享网
本文来自云栖社区合作伙伴畅享网,了解相关信息可以关注vsharing.com网站。

相关实践学习
简单用户画像分析
本场景主要介绍基于海量日志数据进行简单用户画像分析为背景,如何通过使用DataWorks完成数据采集 、加工数据、配置数据质量监控和数据可视化展现等任务。
SaaS 模式云数据仓库必修课
本课程由阿里云开发者社区和阿里云大数据团队共同出品,是SaaS模式云原生数据仓库领导者MaxCompute核心课程。本课程由阿里云资深产品和技术专家们从概念到方法,从场景到实践,体系化的将阿里巴巴飞天大数据平台10多年的经过验证的方法与实践深入浅出的讲给开发者们。帮助大数据开发者快速了解并掌握SaaS模式的云原生的数据仓库,助力开发者学习了解先进的技术栈,并能在实际业务中敏捷的进行大数据分析,赋能企业业务。 通过本课程可以了解SaaS模式云原生数据仓库领导者MaxCompute核心功能及典型适用场景,可应用MaxCompute实现数仓搭建,快速进行大数据分析。适合大数据工程师、大数据分析师 大量数据需要处理、存储和管理,需要搭建数据仓库?学它! 没有足够人员和经验来运维大数据平台,不想自建IDC买机器,需要免运维的大数据平台?会SQL就等于会大数据?学它! 想知道大数据用得对不对,想用更少的钱得到持续演进的数仓能力?获得极致弹性的计算资源和更好的性能,以及持续保护数据安全的生产环境?学它! 想要获得灵活的分析能力,快速洞察数据规律特征?想要兼得数据湖的灵活性与数据仓库的成长性?学它! 出品人:阿里云大数据产品及研发团队专家 产品 MaxCompute 官网 https://www.aliyun.com/product/odps 
目录
相关文章
|
7月前
|
SQL 存储 分布式计算
MaxCompute元数据使用实践--项目信息统计
MaxCompute的租户级别Information Schema从租户角度提供项目元数据及使用历史数据等信息,您可以一次性拉取您同一个元数据中心下所有Project的某类元数据,从而进行各类元数据的统计分析。
490 0
|
4月前
|
存储 SQL Oracle
助力工业物联网,工业大数据之服务域:项目总结【三十九】
助力工业物联网,工业大数据之服务域:项目总结【三十九】
43 1
|
4月前
|
Prometheus 监控 Cloud Native
助力工业物联网,工业大数据之服务域:服务器性能监控Prometheus及项目总结【三十五】
助力工业物联网,工业大数据之服务域:服务器性能监控Prometheus及项目总结【三十五】
36 1
|
4月前
|
资源调度 分布式计算 Oracle
助力工业物联网,工业大数据项目之数据采集【四】
助力工业物联网,工业大数据项目之数据采集【四】
38 0
|
4月前
|
存储 消息中间件 分布式计算
对于一般大数据物流项目的面试题(问题+答案)
对于一般大数据物流项目的面试题(问题+答案)
51 0
|
4月前
|
运维 前端开发 大数据
大数据必知必会系列——面试官一问就懵:你们做过的项目技术是如何选型的?[新星计划]
大数据必知必会系列——面试官一问就懵:你们做过的项目技术是如何选型的?[新星计划]
43 0
|
4月前
|
监控 安全 Java
【Java】Spring Cloud 智慧工地信息云平台源码(PC端+APP端)项目平台、监管平台、大数据平台
【Java】Spring Cloud 智慧工地信息云平台源码(PC端+APP端)项目平台、监管平台、大数据平台
80 0
|
6月前
|
分布式计算 运维 大数据
盘点下近几年退役的顶级 Apache 大数据项目 - 继 Sentry,Sqoop 之后,Ambari 正式退役!
盘点下近几年退役的顶级 Apache 大数据项目 - 继 Sentry,Sqoop 之后,Ambari 正式退役!
|
8月前
|
机器学习/深度学习 人工智能 算法
实用!50个大厂、987页大数据、算法项目落地经验教程合集
大数据、算法项目在任何大厂无论是面试还是工作运用都是非常广泛的,我们精选了50个百度、腾讯、阿里等大厂的大数据、算法落地经验甩给大家,千万不要做收藏党哦,空闲时间记得随时看看! 如果你没有大厂项目经验,对大厂算法、大数据的项目运用不了解建议你看看!
|
9月前
|
分布式计算 大数据 数据挖掘
云计算与大数据期末项目 电商大数据离线计算
云计算与大数据期末项目 电商大数据离线计算
87 0

热门文章

最新文章