《数据分析实战:基于EXCEL和SPSS系列工具的实践》一1.2 数据分析能给我们带来什么

简介: 本节书摘来华章计算机《数据分析实战:基于EXCEL和SPSS系列工具的实践》一书中的第1章 ,第1.2节,纪贺元 著 更多章节内容可以访问云栖社区“华章计算机”公众号查看。 1.2 数据分析能给我们带来什么 数据分析是有成本的,这种成本包括时间精力、金钱,以及情感上的烦恼等。

本节书摘来华章计算机《数据分析实战:基于EXCEL和SPSS系列工具的实践》一书中的第1章 ,第1.2节,纪贺元 著 更多章节内容可以访问云栖社区“华章计算机”公众号查看。

1.2 数据分析能给我们带来什么

数据分析是有成本的,这种成本包括时间精力、金钱,以及情感上的烦恼等。既然有成本付出,那人们自然关心,我能够从数据分析中得到什么?

1.2.1 了解数据的整体状况

曾有人在培训时提出,我公司的业务状况,我非常清楚,还用得着分析吗?可是,事实真的是这样吗?你真的对公司的数据了如指掌?对它所体现的特征一清二楚?如果公司的数据量比较大、比较复杂,那么它就有可能存在潜在的价值,就有分析的必要。
数据的整体状况包括如下内容:
(1)总体状况
总体销量是多少?质量问题的总计是多少?研发团队目前有多少人?研发费用是多少?
(2)结构状况
在关注总量之余,我们也关心结构情况,例如销售在各产品、各区域的分布是怎么样的?哪些设备、哪些机床有质量问题?
(3)异常情况
曾经有客户问过我这个问题:“老师,我们希望把产品销售增速放缓的品线找出来,可以吗?”这里先解释一下客户的需求,就是假如客户一月份的销售增速是3%,二月份的增速是3.4%,三月份的增速是4.5%,如果四月份的增速是3.9%,那么4月份的增速就放缓了,就属于异常值。
什么是异常值?简单地讲,就是根据客户的想法感觉有些异样的值,这些值是我们要重点关注的东西,并且会试图分析其背后的原因。后面会成体系地详细讲解。
(4)其他一些数据特征
我们有时候也会关心数据的稳定性、对称性等特征,后续都会详细讲解。

1.2.2 快速查询数据

数据分析的第二个好处是我们可以快速地查询数据,在数据分析领域中,筛选查询是一个宽泛的课题,涉及很多技术,从简单的筛选数据到动态筛选再到ACCESS的数据查询,内容非常丰富。
我曾经碰到一个企业的老总,他跟我说,企业里面的数据,他不可能都记得很清楚,但是他时常需要了解某个数据,例如某个产品在某个时间段里的返修率是怎么样的,这个时候他会去问秘书,秘书找到数据后再告诉他。“有的时候查一个数据,要一个小时”,这位老总觉得效率不高。
碰到这种情况,如果企业的规模比较大,则需要建立数据库;对于小规模的企业来说,用VB控件把企业的重要数据全部整合起来放在一个EXCEL文件中,是一个高效而且切合实际的做法。后面会详细讲解VB控件的具体安装和应用。

1.2.3 数据之间关系的探索

这部分内容应该是数据分析中最像“数据分析”的部分,例如以下的问题:
产品价格中的成本占比是多少?
如果成本上升了,价格怎样调整才是最优的?
影响产品质量的因素有很多个,假如这些数据都是能量化的,那么哪些因素对产品质量是有影响的?
肥胖和饮食习惯对冠心病有影响吗?
这些都是“正规”的数据分析的内容,需要运用一些统计分析的模型算法等进行分析。
1.2.4 业务预测
这里把业务预测放在数据分析收益的最后,并不代表数据预测的重要性是排在最后的。在我和企业接触的过程中,发现很多企业都有数据预测的需求,即使我告知他们预测未必很准确,但是一些企业也坚持要做一些预测,他们认为科学预测过的数据,对他们的生产经营等能有一个比较科学的指导。

相关文章
|
5天前
|
数据采集 数据可视化 数据挖掘
Python 与 PySpark数据分析实战指南:解锁数据洞见
Python 与 PySpark数据分析实战指南:解锁数据洞见
|
7天前
|
SQL 数据采集 存储
Hive实战 —— 电商数据分析(全流程详解 真实数据)
关于基于小型数据的Hive数仓构建实战,目的是通过分析某零售企业的门店数据来进行业务洞察。内容涵盖了数据清洗、数据分析和Hive表的创建。项目需求包括客户画像、消费统计、资源利用率、特征人群定位和数据可视化。数据源包括Customer、Transaction、Store和Review四张表,涉及多个维度的聚合和分析,如按性别、国家统计客户、按时间段计算总收入等。项目执行需先下载数据和配置Zeppelin环境,然后通过Hive进行数据清洗、建表和分析。在建表过程中,涉及ODS、DWD、DWT、DWS和DM五层,每层都有其特定的任务和粒度。最后,通过Hive SQL进行各种业务指标的计算和分析。
27 1
Hive实战 —— 电商数据分析(全流程详解 真实数据)
|
14天前
|
SQL 人工智能 自然语言处理
让老板成为数据分析师--ChatGpt链接本地数据源实战测试
本文探究ChatGpt等AI机器人能否帮助老板快速的做数据分析?用自然语言同老板进行沟通,满足老板的所有数据分析的诉求?
|
14天前
|
Linux 网络安全 数据处理
【专栏】Linux下的xxd命令是一个强大的二进制数据处理工具,用于十六进制转储和数据分析,我教你应该如何使用!
【4月更文挑战第28天】Linux下的xxd命令是一个强大的二进制数据处理工具,用于十六进制转储和数据分析。它可以显示文件的十六进制和ASCII表示,方便查看内容、分析数据结构和比较文件。xxd支持指定输出格式、写入文件、数据提取和转换等功能。在网络安全分析、程序调试和数据恢复等领域有广泛应用。通过掌握xxd,用户能更深入理解和处理二进制数据。
|
18天前
|
数据采集 数据可视化 数据挖掘
R语言与Python:比较两种数据分析工具
【4月更文挑战第25天】R语言和Python是目前最流行的两种数据分析工具。本文将对这两种工具进行比较,包括它们的历史、特点、应用场景、社区支持、学习资源、性能等方面,以帮助读者更好地了解和选择适合自己的数据分析工具。
|
24天前
|
机器学习/深度学习 数据可视化 数据挖掘
python数据分析工具StatsModels
【4月更文挑战第15天】`StatsModels`是Python的统计库,基于NumPy和SciPy,提供线性模型、广义线性模型、稳健回归、时间序列分析等多样功能。支持离散选择模型、方差分析和非参数统计,还包含图形和可视化工具。安装`StatsModels`可使用`pip install statsmodels`。示例展示了如何进行普通最小二乘回归并绘制回归线。该库适用于数据分析和预测建模。
20 1
|
24天前
|
机器学习/深度学习 数据挖掘 计算机视觉
python数据分析工具SciPy
【4月更文挑战第15天】SciPy是Python的开源库,用于数学、科学和工程计算,基于NumPy扩展了优化、线性代数、积分、插值、特殊函数、信号处理、图像处理和常微分方程求解等功能。它包含优化、线性代数、积分、信号和图像处理等多个模块。通过SciPy,可以方便地执行各种科学计算任务。例如,计算高斯分布的PDF,需要结合NumPy使用。要安装SciPy,可以使用`pip install scipy`命令。这个库极大地丰富了Python在科学计算领域的应用。
15 1
|
24天前
|
数据可视化 数据挖掘 Linux
python数据分析工具Seaborn
【4月更文挑战第15天】Seaborn是Python的数据可视化库,基于matplotlib,提供统计图形绘制。它包含内置数据集,支持风格控制和多种图形类型如散点图、分布图,擅长处理分类数据并能可视化统计估计。Seaborn还能绘制热图、聚类图及交互式图形。要使用它,先用`pip install seaborn`安装,然后导入并应用到数据集上,如示例中展示的散点图绘制。
13 1
|
25天前
|
数据可视化 数据挖掘 API
Python数据分析工具Seaborn
【4月更文挑战第14天】Seaborn是Python的数据可视化库,基于matplotlib,为数据科学家提供高级接口创建统计图形。其特点包括简洁的API、丰富的图形类型(如散点图、直方图)、内置统计功能、数据集集成和与pandas的紧密配合。使用时需先安装Seaborn和matplotlib,然后通过Seaborn的函数(如`scatterplot()`、`histplot()`)绘制图形。它是数据分析和可视化的一个强大工具。
22 8
Python数据分析工具Seaborn
|
25天前
|
数据可视化 数据挖掘 Python
Python中数据分析工具Matplotlib
【4月更文挑战第14天】Matplotlib是Python的数据可视化库,能生成多种图表,如折线图、柱状图等。以下是一个绘制简单折线图的代码示例: ```python import matplotlib.pyplot as plt x = [1, 2, 3, 4, 5] y = [2, 4, 6, 8, 10] plt.figure() plt.plot(x, y) plt.title('简单折线图') plt.xlabel('X轴') plt.ylabel('Y轴') plt.show() ```
13 1