文末送书|数据分析必知必会之维度&指标

简介: 在业务场景中,维度和指标是基础,清晰准确地定义维度和指标能帮助我们更好地探寻数字背后的含义。下图列举了一些电商常用的指标和维度,你能正确区分吗?

业务篇:维度 & 指标


在业务场景中,维度和指标是基础,清晰准确地定义维度和指标能帮助我们更好地探寻数字背后的含义。下图列举了一些电商常用的指标和维度,你能正确区分吗?

P`E1D[6[X5@DQP7P{6YWGSE.png


维度

维度是对事物特征或属性的一种描述,一般情况下都为分类变量。单独分析维度是没有意义的,它依赖于指标。上图中,日期、渠道、省份、生命周期都是维度。

假设公司有一个新产品在线上发售,设定的维度字段就是日期、省份、渠道,省份维度下有北京、天津、河北这三个类别。

单独看省份维度得不到任何具体信息,无法知道这三个城市的在此次活动中的具体表现如何。即使是将维度组合,也无法获得有价值的信息。


指标

指标是对事物的具体度量单位,通常情况下都可以用数值来展示。上图中,曝光人数、点击人数是非常常见的基础指标,而利润率、访购率、点击率这类需要通过计算得到的是复合指标。指标虽然有具体含义,但仍需要结合维度讨论。

下面我选取部分维度和指标组合成一张表进行举例分析:IR1ZY39T8S28_U0NBAE9{SI.png

第一条数据的解读是:2022年2月1日,在小程序上点击该产品的用户中有 30% 来自北京,通过小程序下单该产品的用户有 15% 是北京的。


SQL 实现

使用不同维度组合,可以获得不同信息,但是数据并不是简单累加的,需要根据维度重新聚合。比如只看日期和渠道,就能知道小程序和 APP 各自的点击率和购买率,SQL 实现如下:

select dt,channel,click_rate,buy_rate
from table
group by dt,channel

得到数据为下表,比较发现 APP 的点击率和购买率更高,因此可以在 APP 上增加宣传投入。对于小程序点击率低,需要思考原因,进而做出相应调整。

image.gifKG[5)K1U534AHFLP8HCOPAJ.png


由于在实际场景中,会考虑不同维度组合,分别查询很麻烦,这时可以通过 Hive 中的grouping sets实现,它等价于将不同维度的group by结果集进行union all

首先,确定好想看的维度组合,例如:

维度组合
日期、省份、渠道
日期、省份
日期、渠道


代码实现如下:

select dt,province,channel,click_rate,buy_rate
from table
group by dt,province,channel
grouping sets( 
              (dt,province),
              (dt,channel),
              (dt,province,channel)
              )


等价于:

select dt,province,channel,click_rate,buy_rate 
from table 
group by dt,province,channel
union all
select dt,province,null channel,click_rate,buy_rate 
from table 
group by dt,province
union all
select dt,channel,null province,click_rate,buy_rate  
from table 
group by dt,channel


上述代码得到的数据较多就不做展示了,这里给出例子的建表语句大家可以自行尝试噢。

CREATE TABLE table
    (`dt` datetime, `province` varchar(2), `channel` varchar(3), `click_rate` varchar(3), `buy_rate` varchar(3))
;
INSERT INTO table
    (`dt`, `province`, `channel`, `click_rate`, `buy_rate`)
VALUES
    ('2022-02-01', '北京', '小程序', '30%', '15%'),
    ('2022-02-01', '天津', '小程序', '15%', '9%'),
    ('2022-02-01', '河北', '小程序', '21%', '10%'),
    ('2022-02-01', '北京', 'APP', '68%', '62%'),
    ('2022-02-01', '天津', 'APP', '54%', '46%'),
    ('2022-02-01', '河北', 'APP', '45%', '36%'),
    ('2022-02-02', '北京', '小程序', '25%', '14%'),
    ('2022-02-02', '天津', '小程序', '19%', '10%'),
    ('2022-02-02', '河北', '小程序', '16%', '8%'),
    ('2022-02-02', '北京', 'APP', '73%', '66%'),
    ('2022-02-02', '天津', 'APP', '46%', '40%'),
    ('2022-02-02', '河北', 'APP', '38%', '30%')
;
目录
相关文章
|
6月前
|
SQL 数据采集 数据挖掘
大数据行业应用之Hive数据分析航班线路相关的各项指标
大数据行业应用之Hive数据分析航班线路相关的各项指标
194 1
|
6月前
|
数据挖掘 Python
python数据分析——业务指标量化
业务指标量化是衡量企业运营效果的重要手段,通过具体的数据和数值,可以更加直观地了解企业的运营状况,为企业决策提供有力的数据支持。
146 1
|
6月前
|
监控 搜索推荐 数据挖掘
python数据分析——业务指标分析
业务指标分析是企业运营中不可或缺的一环,通过对各项关键指标的深入剖析,我们能够更好地了解企业的运营状况,发现潜在问题,进而制定相应的策略来优化业务流程、提升经营效率。 在业务指标分析中,我们首先要明确分析的目的和范围。是为了评估整体业务健康状况,还是针对某一具体环节进行优化?明确了目的后,我们需要收集相关的数据,这些数据可能来源于不同的业务系统和数据库,因此数据的整合和清洗也是分析过程中的重要步骤。 接下来,我们要选择合适的分析方法。比如,对于销售数据,我们可以采用时间序列分析来观察销售趋势;对于用户行为数据,我们可以使用用户画像和路径分析来洞察用户需求和行为习惯。
204 1
|
6月前
|
供应链 UED
电商数据分析-01-电商数据分析指标
电商数据分析-01-电商数据分析指标
|
6月前
|
监控 小程序 数据挖掘
九大数据分析方法-单指标分析方法与多指标分析方法
九大数据分析方法-单指标分析方法与多指标分析方法
|
供应链 数据挖掘
数据分析五大指标分类
数据分析中常见的指标分类方法
|
数据挖掘
怎么理解数据分析、维度和指标?
怎么理解数据分析、维度和指标?
|
数据挖掘 数据处理
人人都会点数据分析 | 了解统计指标与异常值的简单处理
人人都会点数据分析 | 了解统计指标与异常值的简单处理
119 0
|
安全 数据挖掘
数据分析指标
数据分析指标
118 0
|
SQL 存储 数据挖掘
ChatGPT 数据仓库实战:Kaggle 酒店入住数据分析与维度建模
ChatGPT 数据仓库实战:Kaggle 酒店入住数据分析与维度建模
下一篇
无影云桌面