《数据分析实战 基于EXCEL和SPSS系列工具的实践》一1.3 数据分析的几大抓手

简介: 时不时地有培训学员来问我一个问题:“我怎么样才能把数据分析做好?”要回答这个问题还真是不容易,就像业余围棋爱好者问“我怎么样才能快速提高自己的棋力?”或者刚刚进入职场的大学生问“我怎么样才能把销售业绩做好?”一样。

本节书摘来自华章出版社《数据分析实战
基于EXCEL和SPSS系列工具的实践》一书中的第1章,第1.3节,纪贺元 著,更多章节内容可以访问云栖社区“华章计算机”公众号查看。

1.3 数据分析的几大抓手

时不时地有培训学员来问我一个问题:“我怎么样才能把数据分析做好?”要回答这个问题还真是不容易,就像业余围棋爱好者问“我怎么样才能快速提高自己的棋力?”或者刚刚进入职场的大学生问“我怎么样才能把销售业绩做好?”一样。
任何一项工作要做好,都是一个综合的成体系的事情,这里就简单梳理一下把数据分析做好的几个必要条件。

1.3.1 足够多的数据

给巧妇多一点米吧!数据量越多,每天更新的数据就越多,做分析的价值就越大。这也就是为什么现在数据分析做得比较好的还是电信、金融、互联网等几个行业,汽车行业现在进展也比较快。从部门的角度看,市场部、财务部、生产部、质量部等是需要做数据分析的重点部门,为什么?就是因为数据多啊。

1.3.2 数据质量

光有数据量还不行,数据质量也是非常重要的。总体来说,我国很多企业的数据质量目前还比较低下的,先不说数据是否有造假的成分,光是数据的“粗漏错乱”这些就足以让企业的数据分析人员头疼了。
“粗”是指数据的颗粒度很粗,过于粗疏的数据,使得数据的分析价值非常低。
“漏”是指由于企业的数据规划或者数据记录仪器等的问题,很多数据都没有被记录下来。
“错”和“乱”指记录的数据错误,或者是数据被不同的部门所记录,但是数据对不上。例如有一个指标数据,市场部记录为103,而财务部记录为124,大家看到这个例子可能会觉得这怎么可能啊?但是我想告诉你,由于IT系统的五花八门以及部门之间数据经常缺乏稽核比对,因此很容易出现这类问题。

1.3.3 合适的工具

用来做数据分析的工具很多,比较知名的就有10多种,如果再加上那些不知名的,说几十种都算少的。
有的学员在跟我交流时提到不愿意换工具,例如他好不容易熟悉了Eviews,然后要做销售数据的季节性分解,虽然听说SPSS比较好,但是他不愿意换,觉得再学一个软件比较麻烦。
我个人的观点是:存在的就是合理的。每种软件都有它的优势,反过来,也有它的问题。其实我们可以逆向思维,如果有一个软件什么都能干,那么其他的软件就可以退出市场了。
要把各种软件的优势和长处说清楚是件不容易的事情,2.2节会尽可能做一个总结和描述。

1.3.4 分析结果的呈现

仅仅能够分析数据是不够的,还需要把分析的结果展示给其他人,这包括领导、同事、客户等。数据呈现目前是一个热门话题,所谓呈现,就是把数据分析的比较专业甚至晦涩的结果,以生动的甚至有趣的形式展示给他人看。
比较通俗地讲,有人认为呈现就是画图,我比较认同这个观点,“一图抵千言”,人们对于图形的接受程度要远远高于文字和数字。
EXCEL中有很多绘图技巧,EXCEL的更新版本也在对图形绘制进行不断地改进,各种专业统计工具中都有绘图模块,Stata、SAS、R等软件都有专门的绘图命令用来绘制图形。

相关文章
|
20天前
|
人工智能 Python
读取excel工具:openpyxl | AI应用开发
`openpyxl` 是一个 Python 库,专门用于读写 Excel 2010 xlsx/xlsm/xltx/xltm 文件。它是处理 Excel 文件的强大工具,可以让你在不需要安装 Excel 软件的情况下,对 Excel 文件进行创建、修改、读取和写入操作【10月更文挑战第3天】
52 0
|
25天前
|
数据采集 数据可视化 数据挖掘
基于Python的数据分析与可视化实战
本文将引导读者通过Python进行数据分析和可视化,从基础的数据操作到高级的数据可视化技巧。我们将使用Pandas库处理数据,并利用Matplotlib和Seaborn库创建直观的图表。文章不仅提供代码示例,还将解释每个步骤的重要性和目的,帮助读者理解背后的逻辑。无论你是初学者还是有一定基础的开发者,这篇文章都将为你提供有价值的见解和技能。
55 0
|
1月前
|
SQL 数据采集 数据可视化
深入 Python 数据分析:高级技术与实战应用
本文系统地介绍了Python在高级数据分析中的应用,涵盖数据读取、预处理、探索及可视化等关键环节,并详细展示了聚类分析、PCA、时间序列分析等高级技术。通过实际案例,帮助读者掌握解决复杂问题的方法,提升数据分析技能。使用pandas、matplotlib、seaborn及sklearn等库,提供了丰富的代码示例,便于实践操作。
152 64
|
2天前
|
消息中间件 数据挖掘 Kafka
Apache Kafka流处理实战:构建实时数据分析应用
【10月更文挑战第24天】在当今这个数据爆炸的时代,能够快速准确地处理实时数据变得尤为重要。无论是金融交易监控、网络行为分析还是物联网设备的数据收集,实时数据处理技术都是不可或缺的一部分。Apache Kafka作为一款高性能的消息队列系统,不仅支持传统的消息传递模式,还提供了强大的流处理能力,能够帮助开发者构建高效、可扩展的实时数据分析应用。
17 5
|
3天前
|
数据处理
在Excel中,通配符是一种强大的工具
【10月更文挑战第23天】在Excel中,通配符是一种强大的工具
9 4
|
5天前
|
机器学习/深度学习 并行计算 数据挖掘
R语言是一种强大的统计分析工具,广泛应用于数据分析和机器学习领域
【10月更文挑战第21天】R语言是一种强大的统计分析工具,广泛应用于数据分析和机器学习领域。本文将介绍R语言中的一些高级编程技巧,包括函数式编程、向量化运算、字符串处理、循环和条件语句、异常处理和性能优化等方面,以帮助读者更好地掌握R语言的编程技巧,提高数据分析的效率。
18 2
|
5天前
|
数据采集 数据可视化 数据挖掘
R语言与Python:比较两种数据分析工具
R语言和Python是目前最流行的两种数据分析工具。本文将对这两种工具进行比较,包括它们的历史、特点、应用场景、社区支持、学习资源、性能等方面,以帮助读者更好地了解和选择适合自己的数据分析工具。
10 2
|
27天前
|
数据采集 数据可视化 数据挖掘
使用Python进行数据分析:从入门到实践
使用Python进行数据分析:从入门到实践
34 2
|
2月前
|
数据挖掘 Python
Pandas实战(3):电商购物用户行为数据分析
Pandas实战(3):电商购物用户行为数据分析
84 1
|
17天前
|
SQL 分布式计算 数据挖掘
加速数据分析:阿里云Hologres在实时数仓中的应用实践
【10月更文挑战第9天】随着大数据技术的发展,企业对于数据处理和分析的需求日益增长。特别是在面对海量数据时,如何快速、准确地进行数据查询和分析成为了关键问题。阿里云Hologres作为一个高性能的实时交互式分析服务,为解决这些问题提供了强大的支持。本文将深入探讨Hologres的特点及其在实时数仓中的应用,并通过具体的代码示例来展示其实际应用。
89 0