《构建企业级好数据(Dataphin智能数据建设与治理白皮书)》——二、Dataphin 演进之路:产品大图及核心功能详解——(二)研发:集成、建模、发布、运维(2) https://developer.aliyun.com/article/1229664?groupCode=dataphin
4) 属性与约束
在概念建模中,创建好实体,配置好实体间的关系,整个业务的大图就已经清晰的落地到数据中台。但是不同实体除了名字不同,关系不一样之外,还有哪些区别呢?
例如,用户和会员有什么区别,这就是逻辑建模要来解决的问题。逻辑建模的核心工作是梳理实体的特征,即给实体添加属性,并明确属性的业务约束,一个实体有很多属性(也叫特征),这些属性可以用于区分实体。
属性按照类型,可以分为:
• 标识属性,即实体的某个具体实例的唯一标识。实体是一个抽象概念,实体实例是具体事物。比如,商品鞋是一个实体。一双 36 码、白色、编码为 6901234的鞋就是一个实例。一个实体可以有多个标识属性,如商品 ID、商品编码。
• 关联实体属性,实体的某个属性本身可能也是一个实体。比如,商品的卖家(货主)属性,卖家是一个独立的实体。
• 描述属性,表述实体某一个维度的特征的一般属性,实体中的定性属性,一般是文本字符类型,如名称。
• 度量属性,某个维度数量程度的属性,定量属性。一般是数值类型,如金额、价格。
• 时间属性,描述实体某个行为的时间。
根据实体的类型(业务对象或业务活动),每个实体都有一些必须有的属性,即关键属性:
• 业务对象至少有一个标识属性,根据业务可以添加其他关键属性。
• 业务活动必须有一个关联实体属性来标识活动的主体(发起人,比如订单活动中的买家),一个或多个时间属性来明确活动时间。
实体丰富了属性之后还不能完全反映业务现实,还需要给属性加上一些约束规则:
• 取值规则,约束属性的取值范围,即约束实体实例中该属性的具体内容的有效性。
• 枚举值,如鞋子颜色只有黑色和白色两个。
• 取值范围,如年龄一般是 0~150。
• 唯一性,除标识属性外,其他属性也可能有唯一性要求。
• 非空性,不允许该属性出现空值。
• 其他。
实例化
定义好逻辑模型后,映射数据到模型的过程就是模型的实例化,浅白的说就是将物理的数据映射到逻辑模型。实例化的数据来源是 ODS 数据,少数情形下,ODS 数据需要做一些额外处理,将其按照一定的规则注册挂载到逻辑模型。Dataphin 将根据映射自动生成计算代码和周期调度任务,并基于属性约束生成数据质量校验规则。到这一步,就完成了逻辑模型的构建。
5) 分析模型
逻辑模型构建后之后,基于逻辑模型可以构建分析模型,即下图中的业务分析模型。
分析模型的目标是快速生成业务分析中的指标,称为派生指标,且保障这些指标的可靠性和可维护性。最终使用的指标拆解为四个基本组成部分:
• 统计周期
• 原子指标
• 业务限定
• 统计粒度
以上描述可能还是让人无法准确明白分析模型是什么,可以参照下图,从传统 SQL视角来理解:
分析建模的步骤是,统计周期设置->原子指标/业务限定配置->派生指标配置,所有配置完成后,系统将自动生成计算代码和周期调度任务。
Dataphin 通过规范化、模块化的低代码配置式研发,有效的保证了模型与代码的一致性。
《构建企业级好数据(Dataphin智能数据建设与治理白皮书)》——二、Dataphin 演进之路:产品大图及核心功能详解——(二)研发:集成、建模、发布、运维(4) https://developer.aliyun.com/article/1229661?groupCode=dataphin