《全链路数据治理-智能数据建模 》——客户案例:汽车行业数据建模最佳实践(4) https://developer.aliyun.com/article/1230830?groupCode=tech_library
五、 数据模型落地
基于以上设计,阿里云全球技术服务团队与DataWorks 产品团队合作,通过智能数据建模产品将以上规范在客户生产环境落地。DataWorks 智能建模产品分为四个模块:数据指标、数据标准、数仓规划、维度建模。
1. 数据指标
分别包含派生指标、原子指标、修饰词、时间周期四个模块。
1) 原子指标
原子指标用于明确业务的统计口径和计算逻辑,是基于用户的业务活动(即业务过程)创建的,用于统计业务活动中某一业务状况的数值。比如,车的产量是根据车体过点记录中通过车间下线工位为准,故以车体过点记录明细表加上下线业务动作约束,可以得到车的产量。
实际产成品数量原子指标
2) 派生指标
派生指标通常由原子指标+时间周期+一个或多个修饰词组成。因此,派生指标关注的点为原子指标、时间周期、修饰词以及所属的业务过程。并且,由于公共层和应用层的定位均可存放派生指标,故也要指定好其所属层级。比如,我们要计算近1天的XX 车型实际产量,需要通过“车体实际产量+1d+XX 车型”得到。
某派生指标
3) 修饰词
修饰词是一种业务修饰,用来圈定或者聚焦统计数据的业务范围和限定。在此产品中,修饰词被分为普通业务修饰词和维度枚举修饰词。车型信息可以作为一种修饰词,去结合其他的原子指标,衍生出车型维度下的各个派生指标。
某修饰词
4) 时间周期
时间周期是用来明确数据统计的时间范围或者时间窗口,例如近1天,近1自然周。用于在统计派生指标时,限定业务统计的时间范围。本次项目中用到的时间周期有,近1 天,近一周,近一个月,近一个季度,近一年,每日,每月,每季度,每年。
时间周期示例
《全链路数据治理-智能数据建模 》——客户案例:汽车行业数据建模最佳实践(6) https://developer.aliyun.com/article/1230828?groupCode=tech_library