数据分析实战:基于EXCEL和SPSS系列工具的实践》一3.2 用“逐步推进法”推测需要的数据

简介: 本节书摘来华章计算机《数据分析实战:基于EXCEL和SPSS系列工具的实践》一书中的第3章 ,第3.2节,纪贺元 著 更多章节内容可以访问云栖社区“华章计算机”公众号查看。 3.2 用“逐步推进法”推测需要的数据 在与客户接触的过程中,我们发现了一种比较简单的方法:逐步推进法。

本节书摘来华章计算机《数据分析实战:基于EXCEL和SPSS系列工具的实践》一书中的第3章 ,第3.2节,纪贺元 著 更多章节内容可以访问云栖社区“华章计算机”公众号查看。

3.2 用“逐步推进法”推测需要的数据

在与客户接触的过程中,我们发现了一种比较简单的方法:逐步推进法。通过该方法可以推测需要的数据。逐步推进法一般包括几个步骤:一是总量,二是结构,三是时间序列,四是颗粒度。下面以我做过的一个项目为例来进行说明。
客户的需求是:是否有办法降低企业的物流成本?
拿到这种需求,使用逐步推进法,首先要考虑企业的物流成本是由哪些内容构成的。
在收集数据时,从各个数据部门拿到了运输成本、库存成本、包装成本、装卸成本这四大类,关于每类成本都有一些细项的说明。
有了这四类成本之后,进一步关心的是数据的时间跨度,从该企业推行信息化之后,可以拿到2011年至2014年这4年的数据,从时间跨度上看,能够拿到4年的数据还是说得过去的。
再往下倒推,则是数据的颗粒度,这一项数据的情况就不那么理想了,我们只能获得月度数据,即使跟委托方的各部门反复沟通,最后发现也只能获得月度的数据。
另外一个倒推的方向是获取更多的成本细项。可是我们遗憾地发现,该企业在物流成本的细项方面,数据也不多。
以上就是一个项目数据收集的全部过程,由于数据规划的原因,很多数据一旦在第一时间没有收集,以后基本就很难收集起来了,因此一个合适的企业数据规划还是相当重要的。

相关文章
|
11天前
|
数据可视化 前端开发 数据挖掘
R语言对综合社会调查GSS数据进行自举法bootstrap统计推断、假设检验、探索性数据分析可视化|数据分享(上)
R语言对综合社会调查GSS数据进行自举法bootstrap统计推断、假设检验、探索性数据分析可视化|数据分享
|
3天前
|
数据采集 数据可视化 数据挖掘
Python 与 PySpark数据分析实战指南:解锁数据洞见
Python 与 PySpark数据分析实战指南:解锁数据洞见
|
5天前
|
SQL 数据采集 存储
Hive实战 —— 电商数据分析(全流程详解 真实数据)
关于基于小型数据的Hive数仓构建实战,目的是通过分析某零售企业的门店数据来进行业务洞察。内容涵盖了数据清洗、数据分析和Hive表的创建。项目需求包括客户画像、消费统计、资源利用率、特征人群定位和数据可视化。数据源包括Customer、Transaction、Store和Review四张表,涉及多个维度的聚合和分析,如按性别、国家统计客户、按时间段计算总收入等。项目执行需先下载数据和配置Zeppelin环境,然后通过Hive进行数据清洗、建表和分析。在建表过程中,涉及ODS、DWD、DWT、DWS和DM五层,每层都有其特定的任务和粒度。最后,通过Hive SQL进行各种业务指标的计算和分析。
23 1
Hive实战 —— 电商数据分析(全流程详解 真实数据)
|
11天前
|
前端开发 数据可视化 数据挖掘
R语言对综合社会调查GSS数据进行自举法bootstrap统计推断、假设检验、探索性数据分析可视化|数据分享(下)
R语言对综合社会调查GSS数据进行自举法bootstrap统计推断、假设检验、探索性数据分析可视化|数据分享
|
12天前
|
SQL 人工智能 自然语言处理
让老板成为数据分析师--ChatGpt链接本地数据源实战测试
本文探究ChatGpt等AI机器人能否帮助老板快速的做数据分析?用自然语言同老板进行沟通,满足老板的所有数据分析的诉求?
|
12天前
|
数据挖掘 Python
SPSS时间序列ARIMA、指数平滑法数据分析汽车销量数据
SPSS时间序列ARIMA、指数平滑法数据分析汽车销量数据
|
14天前
|
Java Apache
java读取excel数据案例
Java代码示例使用Apache POI库读取Excel(example.xlsx)数据。创建FileInputStream和XSSFWorkbook对象,获取Sheet,遍历行和列,根据单元格类型(STRING, NUMERIC, BOOLEAN)打印值。需引入Apache POI库并确保替换文件路径。
11 1
|
18天前
|
机器学习/深度学习 数据可视化 数据挖掘
Python跳水:探索数据分析的深渊
Python跳水:探索数据分析的深渊
22 0
|
12天前
|
机器学习/深度学习 数据采集 算法
Python用逻辑回归、决策树、SVM、XGBoost 算法机器学习预测用户信贷行为数据分析报告
Python用逻辑回归、决策树、SVM、XGBoost 算法机器学习预测用户信贷行为数据分析报告