本节书摘来自华章计算机《数据分析实战:基于EXCEL和SPSS系列工具的实践》一书中的第3章,第3.2节,作者 纪贺元,更多章节内容可以访问云栖社区“华章计算机”公众号查看。
3.2 用“逐步推进法”推测需要的数据
在与客户接触的过程中,我们发现了一种比较简单的方法:逐步推进法。通过该方法可以推测需要的数据。逐步推进法一般包括几个步骤:一是总量,二是结构,三是时间序列,四是颗粒度。下面以我做过的一个项目为例来进行说明。
客户的需求是:是否有办法降低企业的物流成本?
拿到这种需求,使用逐步推进法,首先要考虑企业的物流成本是由哪些内容构成的。
在收集数据时,从各个数据部门拿到了运输成本、库存成本、包装成本、装卸成本这四大类,关于每类成本都有一些细项的说明。
有了这四类成本之后,进一步关心的是数据的时间跨度,从该企业推行信息化之后,可以拿到2011年至2014年这4年的数据,从时间跨度上看,能够拿到4年的数据还是说得过去的。
再往下倒推,则是数据的颗粒度,这一项数据的情况就不那么理想了,我们只能获得月度数据,即使跟委托方的各部门反复沟通,最后发现也只能获得月度的数据。
另外一个倒推的方向是获取更多的成本细项。可是我们遗憾地发现,该企业在物流成本的细项方面,数据也不多。
以上就是一个项目数据收集的全部过程,由于数据规划的原因,很多数据一旦在第一时间没有收集,以后基本就很难收集起来了,因此一个合适的企业数据规划还是相当重要的。