本节书摘来自华章出版社《数据分析实战
基于EXCEL和SPSS系列工具的实践》一书中的第2章,第2.3节,纪贺元 著,更多章节内容可以访问云栖社区“华章计算机”公众号查看。
2.3 在分析需求和模型之间搭起桥梁
我们在现实工作中面临的都是实际的需求,这些需求往往乍一看跟数据分析并没有多少关系,例如:
成本上升了,对价格如何影响?
如何降低物流成本?
工厂里面做实验,有的时候成功有的时候失败,原因何在?
来我这里购买的客户有哪些特征?
看到这里,读者可能大致明白了,所谓的数据分析,一开始就没几个人考虑数据,而是首先考虑业务,然后再往数据的地方靠。
2.3.1 识别需求
首先考虑识别需求,还是看一个例子吧,一个北方的加油站企业,经常搞各种活动,大家都知道,加油站如果不搞活动,生意会不大好。问题是加油站经常搞多种活动,于是某一天,企业的领导发话了:我们搞了这么多活动,效果怎么样啊?
好了,这就是需求!非常实在的需求!
2.3.2 分解需求
下一步要分解需求,我们要去做以下的事情:
1)收集没有活动时,各加油站的加油数据。
2)收集有各种活动时,各加油站的加油数据。
需求分解完了,数据也收集完了,就形成了图2-19加油站的加油量数据。
2.3.3 选择工具和模型
对于统计的初学者来说,选择工具和模型几乎是最难的,统计软件有很多,统计模型就更加多了,各种模型之间的区分,绝对是一言难尽的事情。需要长期基于统计工具的学习和积累,才能够比较自如地选择模型。
另外,从笔者长期运用工具的经验来看,很多人选择统计模型有其“习惯”和“偏好”,有的人习惯使用相关分析模型,有的人则喜欢决策树模型,不一而足。