《全链路数据治理-智能数据建模 》——数仓建模理论与规范(6) https://developer.aliyun.com/article/1231079?groupCode=tech_library
3) 事实表设计
a) 事务型事实表
• 针对业务过程构建的一类事实表,用以跟踪定义业务过程的个体行为,是数仓
最原子的明细数据,提供丰富的分析能力。
• 按照所描述的业务过程的数量分为单事务事实表和多事务事实表。
设计流程
基本原则
完整性:尽可能包含所有与业务过程相关的事实。
高内聚低耦合:只选择和业务过程相关的事实。
粒度明确:在同一个事实表中,粒度必须唯一。
成本性能的平衡:使用退化维度提高事实表的易用性。
b) 单事务事实表
淘宝下单事件事务事实表:dwd_tb_trd_ord_di
基本特征
业务过程:订单创建
事实表类型:单事务事实表
粒度:子订单ID
度量:订单创建金额等
冗余属性:冗余商品、会员属性
数据存储:仅插入不更新、每个实体在整张表只有一条记录
适用场景
单业务过程,如下单、支付等
单业务过程分析无需限定业务过程
举例:双11 下单单量
Select count ( order_id ) from tbcdm.dwd_tb_trd_ord_di where
ds=‘20211111’
冗余原则
冗余维度属性下游常用
冗余维度属性不影响产出时效
《全链路数据治理-智能数据建模 》——数仓建模理论与规范(8) https://developer.aliyun.com/article/1231077?groupCode=tech_library