人人都会点数据分析 | 了解数据

简介: 人人都会点数据分析 | 了解数据

数据分析师必备的技能

硬技能 - 硬性数据处理和分析工具的使用

1、Excel - 电子表格

2、SQL - 数据库操作

3、Tableau - 可视化

4、Python - 大数据处理分析

以上硬技能会就是会不会就是不会,不会就学,零基础也可以很快掌握。

软技能 - 对事物的认知方式、经验积累

从招聘角度上讲就是你有多了解任职的行业与需要负责的业务。

这也是为什么有经验的数据分析师的工资水涨船高,但是校招数据分析师招聘内卷化严重的原因。

因为校招的数据分析硬技能占比更高,不会就学嘛,反正有大把的时光。

什么是互联网数据分析

上面总结了关于数据分析师应该掌握的软硬技能,不过按照目前招聘网站上的招聘信息来看。

数据分析按照场景大致就是传统的数据分析和互联网数据分析两大类,目前大多招聘都集中在互联网数据分析领域。

那么搞清楚互联网数据分析就很有必要了。

数据分析是上面大家应该很清楚,这里的互联网数据分析就是对基于线上产生的数据进行分析,比如分析线上课程投放的效果,广告引流的效果等等。

如果现在还不清楚互联网数据分析和传统数据分析的概念可以上招聘网站上以【数据分析】为关键词查找,bat 招聘的基本都是了。

什么是数据

大致理清楚关于互联网数据分析的概念之后,现在需要重新认识一下什么是数据?

数据就是对于事物的描述和记录

根据数据的计量层次可以将数据进行进一步的分类。

无法进行计算比较的数据计量层次较低,比如:水果,蔬菜等

可以进行计算比较的数据计量层次较高,比如:1,2,3,4

除了这个之外,数据还可以分为一下几种类型

数据的类型

定类数据

定类数据按照类别属性进行分类,各类别之间是平等并列关系

这种数据不带数量信息,并且不能在各类别间进行排序

主要是数值运算,计算每一类别中的项目频数和频率

就像下面这些一样

性别:男,女

颜色:红,白,蓝

水果:苹果,橙子,香蕉

定序数据

定序数据之间可以进行排序,比较优劣

就像下面这些数据

等级:优秀,良好,合格,不合格

教育程度:小学,初中,高中,大学

定距数据

定距数据具有一定单位的实际测量值

定距数据的精确性比定类数据和定序数据要高

定距数据可以通过计算各变量之间的实际差距,不仅可以进行排序还可以进行加减,但是不能进行乘除运算

就像下面这样

温度:20,30,45

年龄:3,6,9

定比数据

定比数据可以进行比较大小,进行加减乘除运算

在定比数据中,刻度 0 代表的意思是没有

在定距数据中,刻度 0 代表的就是 0 ,例如 0 摄氏度,-1 摄氏度

定比数据就像下面这样

用户数:300,600,900

利润:10万,20万,30万

在定比数据中存在绝对零点,就是 0 代表没有,而在定距数据中没有绝对零点存在。

总结上面说的四种数据类型,可以总结为以下两大类

定性数据

一组表示事物性质、规定事物类别的文字表述型数据

1、定类数据

2、定序数据

定量数据

一组以数量形式存在着的属性,并因此可以对其进行测量的数据(可以进行数据运算)

3、定距数据

4、定比数据

而将上面数据以一定的标准组合起来的时候就是数据矩阵(二维数据表)

以上就是数据的基本介绍了,只有了解了什么是数据,才能进一步的学习数据分析。

今天的文章到这里就结束了,咱们下次再会。

有知有行

[ 完 ]

相关文章
|
1月前
|
数据采集 数据可视化 数据挖掘
多维数据分析:使用Pandas进行复杂的数据操作和聚合
【4月更文挑战第12天】Pandas是Python的强大数据分析库,提供DataFrame数据结构进行多维数据处理。本文介绍了使用Pandas进行多维数据分析的流程:1) 导入数据(如CSV、Excel);2) 数据预处理,包括缺失值处理和类型转换;3) 数据探索,利用describe()、hist()、plot()等进行统计和可视化;4) 数据操作,如筛选、排序和分组;5) 数据聚合,通过groupby()和agg()进行计算。文中还给出了电商数据分析的案例,展示Pandas在实际应用中的价值。
|
1月前
|
人工智能 监控 数据可视化
【Python】Python商业公司贸易业务数据分析可视化(数据+源码)【独一无二】
【Python】Python商业公司贸易业务数据分析可视化(数据+源码)【独一无二】
|
1月前
|
存储 分布式计算 搜索推荐
【专栏】数据之海,分布式计算、数据存储与管理、数据分析与挖掘成为关键技术
【4月更文挑战第27天】在大数据时代,数据量爆炸性增长、类型多样及处理速度需求提升带来挑战。分布式计算、数据存储与管理、数据分析与挖掘成为关键技术,如Hadoop、Spark、HDFS、NoSQL等。实际应用包括互联网搜索、推荐系统、金融科技、智能城市等领域,大规模数据处理发挥关键作用,持续推动创新与奇迹。
|
1月前
|
数据可视化 前端开发 数据挖掘
R语言对综合社会调查GSS数据进行自举法bootstrap统计推断、假设检验、探索性数据分析可视化|数据分享(上)
R语言对综合社会调查GSS数据进行自举法bootstrap统计推断、假设检验、探索性数据分析可视化|数据分享
|
1月前
|
SQL 数据采集 存储
Hive实战 —— 电商数据分析(全流程详解 真实数据)
关于基于小型数据的Hive数仓构建实战,目的是通过分析某零售企业的门店数据来进行业务洞察。内容涵盖了数据清洗、数据分析和Hive表的创建。项目需求包括客户画像、消费统计、资源利用率、特征人群定位和数据可视化。数据源包括Customer、Transaction、Store和Review四张表,涉及多个维度的聚合和分析,如按性别、国家统计客户、按时间段计算总收入等。项目执行需先下载数据和配置Zeppelin环境,然后通过Hive进行数据清洗、建表和分析。在建表过程中,涉及ODS、DWD、DWT、DWS和DM五层,每层都有其特定的任务和粒度。最后,通过Hive SQL进行各种业务指标的计算和分析。
327 1
Hive实战 —— 电商数据分析(全流程详解 真实数据)
|
1月前
|
数据采集 数据可视化 数据挖掘
Python 与 PySpark数据分析实战指南:解锁数据洞见
Python 与 PySpark数据分析实战指南:解锁数据洞见
|
1月前
|
机器学习/深度学习 数据采集 数据挖掘
Python 的科学计算和数据分析: 解释什么是数据规整(Data Wrangling)?
【4月更文挑战第15天】数据规整是将原始数据转化为适合分析和建模的格式的关键步骤,涉及缺失值处理(删除、填充、插值)、异常值检测与处理、数据类型转换、重采样、数据合并、特征选择和特征变换等任务。这些预处理步骤确保数据质量和准确性,为后续的数据分析和机器学习模型构建奠定基础。
36 4
|
1月前
|
存储 机器学习/深度学习 数据采集
数据分析师如何处理数据以进行分析?
【4月更文挑战第4天】数据分析师如何处理数据以进行分析?
28 9
|
1月前
|
机器学习/深度学习 数据可视化 算法
数据分析师如何处理缺失值和错误数据?
【4月更文挑战第4天】数据分析师如何处理缺失值和错误数据?
24 6
|
1月前
|
前端开发 数据可视化 数据挖掘
R语言对综合社会调查GSS数据进行自举法bootstrap统计推断、假设检验、探索性数据分析可视化|数据分享(下)
R语言对综合社会调查GSS数据进行自举法bootstrap统计推断、假设检验、探索性数据分析可视化|数据分享

热门文章

最新文章