《全链路数据治理-智能数据建模 》——客户案例:工业OT 域数据最佳实践(2) https://developer.aliyun.com/article/1230884?groupCode=tech_library
三、 指标工厂实现思路
由于在OT 数据域下,指标的特点是数量特别大,但是其计算方式可枚举或者可归纳,因此可以在现有方案的基础上,参考维度建模定义标准的建模分层,同时设计批量指标定义和计算的实现方案,实现批量的指标的定义及加工计算。
1. 指标工厂实现思路
指标工厂建设思路是,OT 域建模分层和传统IT 域维度建模一致,但是设计开发过程有比较大的差异,不需要对单个指标做复杂的设计,可以通过工厂化配置的方式批量定义和计算。
1) 对原始采集定位的数据定义清洗转换规则,得到基础的原子指标。
2) 定义原子指标计算方式(聚合函数),计算方式可枚举,通过周期聚合计算得到派生指标。
3) 自定义衍生指标计算公式,计算公式只涉及派生指标之间的公式计算,不涉及其他约束条件。
通过这种设计方式,通过几个计算任务即可完成原子指标、派生指标、衍生指标的批量计算,当业务场景需要增加指标时,只需要增加对应的指标计算公式即可。
2. 指标工厂与维度建模的关系
通过指标工厂的思路,可以在OT 数据域下快速的定义及生成指标,和传统的维度建模概念类似,分为原子指标、派生指标、衍生指标等。
区别在于传统IT 数据域下,数据源的形式(数据源来自不同业务表)及指标计算方式(包括统计周期、修饰词、维度、计算公式等)比较难统一,因此基本上需要对每一个指标做建模设计。而OT 数据域虽然数据源量特别大,例如一个车间可能就有上万个点位的数据,但是其数据格式是一样的,可以放在一个表中用ID 区分不同点位数据,指标计算的方式也是比较统一的。
维度建模示例
如上图所示,维度建模需要对每一个指标做比较详细的设计,且不同的指标计算大多是需要在不同的任务中去计算。而OT 域下基于指标工厂的指标设计和计算会简化很多,通过批量定义原子指标的统计类型,以及派生指标的计算公式,用几个任务即可完成所有指标的计算。
IT域建模与OT域建模差异
《全链路数据治理-智能数据建模 》——客户案例:工业OT 域数据最佳实践(4) https://developer.aliyun.com/article/1230881?groupCode=tech_library