《全链路数据治理-智能数据建模 》——数仓建模理论与规范(2) https://developer.aliyun.com/article/1231084?groupCode=tech_library
五、 数据模型设计流程
数据模型设计主要分为三个阶段:需求调研,规范定义,模型设计。
1. 名词解释
1) 时间周期
用来明确数据统计的时间范围或者时间点,如最近30 天、自然周、截至当日等。
2) 修饰词
指除了统计维度以外指标的业务场景限定抽象,比如有效(下单金额),PC 端(下单金额)。
3) 度量
• 对某个业务事件的衡量,通常为数字,如件数,次数。
• 区别于原子指标,度量命名一般不带上具体的业务动作。
4) 原子指标
• 基于某一业务事件行为下的度量,具有明确业务含义,是业务定义中不可再拆分的指标。
• 原子指标=业务过程+度量,如下单(事件)金额(度量)。
5) 派生指标
• 可以理解为对原子指标业务统计范围的圈定。
• 派生指标=一个原子指标+多个修饰词(可选)+时间周期。
• 比如:最近30 天PC 端下单金额(最近30 天为时间周期,PC 端为修饰词,下单金额为原子指标)。
6) 维度
• 维度是对应业务的数据分析角度,维度是度量的环境,用来反映业务的属性,某类属性的集合构成一个维度。
• 维度归属于一个数据域,如地理维度(其中包括国家、地区、省以及城市等级别的内容)、时间维度(其中包括年、季、月、周、日等级别的内容),会员维度。
7) 粒度
• 精确定义事实表的每一行所表示的业务含义,传递的是与事实表度量有关的细节层次,比如子订单粒度。
《全链路数据治理-智能数据建模 》——数仓建模理论与规范(4) https://developer.aliyun.com/article/1231081?groupCode=tech_library