《全链路数据治理-智能数据建模 》——产品实操:零售电商数据建模操作实践(2) https://developer.aliyun.com/article/1230569?groupCode=tech_library
二、 维度建模
维度建模储备知识介绍。
1. 基本概念
智能建模强依赖于Kimball 维度建模理论,在实操前务必阅读一下数仓分层和维度
建模中的基本概念。
维度建模:详情请参见维度建模。
业务分类:当企业业务比较复杂,不同类型业务彼此间需要共享数据域,但是又希
望能在模型设计和应用过程中快速定位本业务的数据,可结合真实业务情况,规划
不同的业务分类,在后续模型设计过程中,可将模型归属到对应的业务分类,提升
后续模型使用的便捷性。例如零售电子商务就是一个一级业务分类,如需进一步细
分,可分为门店零售,电子商务等。
数据域:是对企业业务过程进行抽象、提炼、组合的集合,是企业业务人员在使用
数据时第一个分组入口,可以帮助企业业务人员快速的从海量的数据中快速圈定到
自己的业务数据。例如在电商领域,可以划分会员域、商品域、交易域等。
业务过程:业务过程指企业的业务活动事件,如下单,支付。
数据集市:是基于业务分类,面向特定应用场景或者产品的数据组织。通常位于数
据应用层,依赖于公共层的整合数据。例如电商集市、生意参谋集市等。
主题域:用于将数据集市按照分析视角进行划分,通常是联系较为紧密的数据主题
的集合。例如在电商集市下,可以创建电商360、活动等主题域。
维度:维度是用于分析数据的一个角度,一方面对维度进行可控管理,另一方面指
导维度表的设计,如地理维度,时间维度。
维度属性:维度属性隶属于一个维度,用来描述维度的属性,如地理维度中的国家
名称,省份名称。
时间周期:时间周期是用来明确数据统计的时间范围或者时间点,如最近30 天,自
然周。
修饰词:修饰词是对指标统计业务范围的划定,指除了统计维度外指标的业务场景
的限定抽象,如PC 端,无线端。
原子指标:用于明确业务的统计口径和计算逻辑,是基于用户的业务活动(即业务
过程)创建的,用于统计业务活动中某一业务状况的数值。例如,存量会员数。
派生指标:由原子指标、时间周期、修饰词构成,用于反映企业某一业务活动在指
定时间周期及目标范围中的业务状况。例如,历史截至当日(时间周期)_异常会员
(修饰词)_存量会员数(原子指标)。
• 数仓分层:详情请参见数仓分层
• 数据引入层ODS(Operation Data Store)
• 数据公共层CDM(Common Data Model,又称通用数据模型层)
公共维度层(DIM)
公共汇总粒度事实层(DWS)
明细粒度事实层(DWD)
• 数据应用层ADS(Application Data Service)
《全链路数据治理-智能数据建模 》——产品实操:零售电商数据建模操作实践(4) https://developer.aliyun.com/article/1230565?groupCode=tech_library