大数据开发工程师需要了解的【数仓中的指标体系】

本文涉及的产品
云原生数据仓库AnalyticDB MySQL版,基础版 8ACU 100GB 1个月
云原生大数据计算服务 MaxCompute,5000CU*H 100GB 3个月
云原生大数据计算服务MaxCompute,500CU*H 100GB 3个月
简介: 笔记

(1)为什么要构建指标体系


指标体系的理解:

指标体系是将零散单点的具有相互联系的的指标,系统化的组织起来。通过单点看全局,通过全局解决单点的问题。

比如:本月销售净利润为20W,上月销售净利润为30W。从单点看是盈利的,但从全局看是亏损的。

1.png


建立业务量化衡量的标准:

指标体系可以建立业务量化衡量的标准,数据分析的目的就是说明、衡量、预测业务的发展,比方说衡量一个门店

经营的状况,一个门店月净利润20万元,刚看这个指标感觉这个店盈利不少,发展应该不错,但是再一看前两个月

的净利润,发现前两个月的净利润都是40万以上,增加了这一个指标,我们就发现了这个店的经营状况可能存在问

题了。

在衡量业务经营状况的过程中,单一数据指标衡量很可能片面化,需要通过补充其他的指标来使我们的判断更加准

确。因此,搭建系统的指标体系,才能全面衡量业务发展情况,促进业务有序增长。


减少重复工作,提高分析效率:

有了指标体系,数据分析师就可以少干点临时提数的活,指标体系建立后应该能覆盖大部分临时数据分析需求,如

果指标体系搭建完了,还是有很多临时的分析需求涌现,那证明这个指标体系是有问题的


帮助快速定位问题:

建立了系统指标体系,有了过程与结果指标,有了指标的前后关联关系,就可以通过回溯与下钻,快速找到关键指

标波动的原因,老板让你分析原因,再也不用愁眉苦脸了。

2.png



(2)如何搭建有效的指标体系


重点关注的3个方面:


搭建指标体系要有重点,不能只是罗列指标


这是很多数据分析师都会犯的通病,上来先把大量的指标列好,也不说明优先级,先看哪个后看哪个,业务根本就看不懂。

搭建指标体系要有目标


很多人习惯了列指标,自有一套指标拆分的套路,不管我们要解决的业务问题是什么,反正就是按照时间、渠道、区域等纬度拆分,分来分去也没个具体的标准,最后还要纠结到底指标变化多少才是问题

指标体系不是越全越好,和业务最贴切的才是最好的


这个我在之前的指标体系文章里反复强调了,写文章的时候会为了吸引眼球,标题写XX行业指标体系大全,虽然我给大

家整理指标体系的时候尽量概括多个业务场景,指标列的很详细,但是不同的公司,业务复杂不一样,没有一套指标系统是能够通用的,只有和业务最贴切的才是最好用的

体系指标的建设流程:

3.png


(3)指标类型及关系


指标类型:

4.png

派生指标规则:

5.png6.png



(4)企业常用的指标体系方法论




7.png

(5)指标体系整体架构


8.png


(6)企业中指标常见的问题


9.png


(7)如何划分原子指标和派生指标


如果修饰词有对应的维表,那就可以作为派生指标

如果修饰词没有对应的维表,那就作为原子指标管理


相关实践学习
AnalyticDB MySQL海量数据秒级分析体验
快速上手AnalyticDB MySQL,玩转SQL开发等功能!本教程介绍如何在AnalyticDB MySQL中,一键加载内置数据集,并基于自动生成的查询脚本,运行复杂查询语句,秒级生成查询结果。
阿里云云原生数据仓库AnalyticDB MySQL版 使用教程
云原生数据仓库AnalyticDB MySQL版是一种支持高并发低延时查询的新一代云原生数据仓库,高度兼容MySQL协议以及SQL:92、SQL:99、SQL:2003标准,可以对海量数据进行即时的多维分析透视和业务探索,快速构建企业云上数据仓库。 了解产品 https://www.aliyun.com/product/ApsaraDB/ads
相关文章
|
1月前
|
SQL 分布式计算 资源调度
ODPS开发大全:进阶篇(1)
ODPS开发大全:进阶篇
159 13
|
1月前
|
SQL 存储 分布式计算
ODPS开发大全:入门篇(3)
ODPS开发大全:入门篇
66 13
|
6天前
|
消息中间件 存储 大数据
大数据-数据仓库-实时数仓架构分析
大数据-数据仓库-实时数仓架构分析
21 1
|
17天前
|
存储 运维 Cloud Native
"Flink+Paimon:阿里云大数据云原生运维数仓的创新实践,引领实时数据处理新纪元"
【8月更文挑战第2天】Flink+Paimon在阿里云大数据云原生运维数仓的实践
180 3
|
26天前
|
SQL 分布式计算 MaxCompute
SQL开发问题之对于ODPS中的UNION操作,执行计划的问题如何解决
SQL开发问题之对于ODPS中的UNION操作,执行计划的问题如何解决
|
1天前
|
分布式计算 关系型数据库 Serverless
实时数仓 Hologres产品使用合集之如何将ODPS视图表数据导入到Hologres内表
实时数仓Hologres是阿里云推出的一款高性能、实时分析的数据库服务,专为大数据分析和复杂查询场景设计。使用Hologres,企业能够打破传统数据仓库的延迟瓶颈,实现数据到决策的无缝衔接,加速业务创新和响应速度。以下是Hologres产品的一些典型使用场景合集。
|
1天前
|
存储 分布式计算 关系型数据库
实时数仓 Hologres产品使用合集之创建外部表时提示不支持ODPS的datetime数据类型,该怎么解决
实时数仓Hologres是阿里云推出的一款高性能、实时分析的数据库服务,专为大数据分析和复杂查询场景设计。使用Hologres,企业能够打破传统数据仓库的延迟瓶颈,实现数据到决策的无缝衔接,加速业务创新和响应速度。以下是Hologres产品的一些典型使用场景合集。
|
26天前
|
存储 分布式计算 MaxCompute
构建NLP 开发问题之如何支持其他存储介质(如 HDFS、ODPS Volumn)在 transformers 框架中
构建NLP 开发问题之如何支持其他存储介质(如 HDFS、ODPS Volumn)在 transformers 框架中
|
3天前
|
分布式计算 大数据 Java
Scala 入门指南:从零开始的大数据开发
Scala 入门指南:从零开始的大数据开发
|
1月前
|
存储 DataWorks Java
DataWorks产品使用合集之开发离线数仓时,需要多个工作空间的情况有哪些
DataWorks作为一站式的数据开发与治理平台,提供了从数据采集、清洗、开发、调度、服务化、质量监控到安全管理的全套解决方案,帮助企业构建高效、规范、安全的大数据处理体系。以下是对DataWorks产品使用合集的概述,涵盖数据处理的各个环节。

热门文章

最新文章