(一)规划:数据体系
1. 企业数据体系应该怎么规划
数据中台是数据沉淀、建设、管理与使用的一整套体系。Dataphin 的核心优势是在数据的建设与治理上,引入了阿里巴巴多年来数据中台建设沉淀出的建模方法论,可以帮助企业通过智能数据建设与治理,构建数据中台。
建模方法论将数据中台建设分为四层:
• 主题域建模:在数据中台,主题对应一个宏观的分析领域,比如销售分析就是分析“销售”这个主题,联系较为紧密的主题的集合就是主题域。每一个行业都可以拆分为有多个(十个左右不等)主题域组成的主题域模型。
• 概念建模:在主题域的基础上,每个主题域内增加了实体以及实体之间的关系。
• 逻辑建模:在概念模型的基础上,增加每个实体的属性以及属性的约束。
• 业务分析建模:行业中重要的以及常用的分析方法与分析视角。在逻辑模型基础上,将业务分析问题转换为 Dataphin 特有的派生指标,并进一步提炼出原子指标和业务限定。
1) Dataphin 建模能力
主题域建模和概念建模都可以由 Dataphin 的规划功能来承载实现。
建模方法论的四层不针对企业级数据中台,而是围绕单个独立业务来展开的,多个独立业务通过公共的维度来实现企业级数据中台。因此,Dataphin 的规划功能还包括独立业务的划分,即业务板块的划分。
规划并不会影响数据的准确性与产出时效,而是会影响数据的查找,理解与权限管控等多方面。
2) 业务板块划分原则
企业的规模有大有小,业务复杂度和跨度也不同,数据反映业务,所以每个企业的数据中台也是不同的。数据中台建设的第一步是做规划,规划的第一步是全盘梳理企业的业务架构,将业务划分为一个个独立业务,对应到 Dataphin 就是业务板块的划分。
业务板块的划分总原则是,高内聚,低耦合,具体的流程如下:
• 考察企业所有的业务流程,如果两个业务流程之间存在上下游的关系,或者有共同的业务对象,那么他们就应该被放到同一个业务板块。将范围扩大,列举出每个业务流程的上下游和业务对象,直接或者间接的连接在一起的业务流程应当属于同一个业务板块。
举例:零售业务中,采购->采购物流->仓储->销售发货,营销->销售->履约->售后等,有的有上下游的关系,有的可以通过货品连接到一起,他们就属于“零售”这一业务板块。
• 反之,如果两个业务流程之间不存在任何直接或者间接的上下游关系,也没有直接或者间接共同的业务对象,他们就不应当被放在同一个业务板块。
举例:同一个企业下,可能有零售和地产。地产业务中,拿地->设计->开发->销售等流程与零售的业务流程之间不存在上下游的关系,也没法通过某个业务对象连接到一起,应当分别创建“零售”“地产”两个业务板块。
• 值得注意的是,某些业务对象是企业级共用的,比如,公司的员工,行政地理区划(没错,这个也属于业务对象)等,这些会将整个公司的所有的业务流程连接到一个巨大的单一网络中。因此,先要识别出这些企业级的业务对象,对于只通过这些业务对象连接在一起(而没有上下游关系)的业务流程,需要剪断这种连接,将他们归属到不同的业务板块。
《构建企业级好数据(Dataphin智能数据建设与治理白皮书)》——二、Dataphin 演进之路:产品大图及核心功能详解——(一)规划:数据体系(2) https://developer.aliyun.com/article/1229689?groupCode=dataphin