《全链路数据治理-智能数据建模 》——客户案例:工业OT 域数据最佳实践(1)

简介: 《全链路数据治理-智能数据建模 》——客户案例:工业OT 域数据最佳实践(1)

客户案例:工业OT 域数据最佳实践


作者:张为,阿里云全球技术服务部


一、 传统维度建模的方案介绍


数仓建设中常用的方式是维度建模,其核心是将原表分为事实表和维度表。然后采用星型模型或者雪花模型进行数据建模。星型模型,是一种非常简单常用的模型,事实表直接和多个维度表相连,维度表之间无连接。雪花模型,事实表与多个维度表相连,维度表之间有连接。


阿里内部在维度建模理论基础上,对数据的分层分域、维度一致性、事实表设计、原子指标/派生指标的定义及设计等做了细化定义,同时定义了一套标准的从设计到开发的实施流程。


1. 维度建模工作流程


维度建模工作的实施流程如下图所示。


image.png


需求调研:分为自底向上和自顶向下两种,自底向上是从现有的业务系统入手,从业务上分析数据域、业务过程,了解数据需求。自顶向下是和实际报表使用人员了解需求,依据报表SQL 反向推导所需的数据源及指标信息。

数据域划分:对数仓建设涉及的数据类别进行划分,一般可以按照行业标准或者业务系统功能模块来划分。

指标设计:构建总线矩阵,梳理原子指标及派生指标清单,以及原子指标的溯源、派生指标的计算逻辑等。

数据建模:构建一致性维度,构建一致性度量及指标,分层设计DWD/DWS/DIM/ADS 模型。

数据开发:物理表创建,数据业务逻辑SQL 开发。

任务运维:数据开发任务运维。


从工作流程可以看出,维度建模的任务链路是比较长的,同时其工作量和指标规模基本成正比。涉及的指标量越多,调研、设计、开发的工作成比例的增加。


2. 维度建模使用场景及特点


维度建模广泛应用于IT 域数仓建设的场景中,该类场景的特点是原始数据来源于业务系统各功能模块,数据可以很自然的分为维度表和事实表,同时挂载到类似业务板块、业务过程这种概念上,通过统一的一套方法论即可对不同的场景、不同的数据源完成建模设计。虽然使用的建模方法论和流程是相同的,但是对于不同的指标设计是不同的,即当增加一个场景的指标时,需求调研、指标设计、模型设计、开发运维这个过程需要完整的走一遍,因此项目的实施工作量和指标数量基本成正比关系。





《全链路数据治理-智能数据建模 》——客户案例:工业OT 域数据最佳实践(2) https://developer.aliyun.com/article/1230884?groupCode=tech_library

相关文章
|
弹性计算 监控 数据可视化
ECS网络流量监控
ECS网络流量监控
740 2
|
前端开发 架构师 搜索推荐
COLA 4.0:直击应用架构本质的最佳实践
COLA 4.0:直击应用架构本质的最佳实践
3511 0
COLA 4.0:直击应用架构本质的最佳实践
|
3月前
|
人工智能 运维 安全
从“裸奔”到“金钟罩”:AI身份凭据安全的进化之路
构建身份权限安全,护航企业数据合规
1471 37
|
3月前
|
JavaScript 关系型数据库 MySQL
基于python的网上外卖订餐系统
本系统基于Python与Flask框架,结合MySQL数据库及Vue前端技术,实现了一个功能完善的网上订餐平台。系统涵盖餐品、订单、用户及评价管理模块,并深入研究订餐系统的商业模式、用户行为与服务质量。技术上采用HTML、PyCharm开发工具,支持移动端访问,助力餐饮业数字化转型。
人工智能 开发框架 自然语言处理
255 20
|
3月前
|
存储 安全 固态存储
基于C#实现的支持文件传输的Socket聊天室
基于C#实现的支持文件传输的Socket聊天室
234 5
|
3月前
|
人工智能 前端开发 Java
Java 转 AI 不用慌!3 周求职打卡表,帮你按天推进、高效拿 offer
三周(21天)AI应用工程师转型打卡计划,涵盖Python基础、Prompt工程、实战项目与面试准备,每日明确任务目标,助力系统学习与进度追踪。
368 7
|
4月前
|
存储 数据挖掘 大数据
基于python大数据的用户行为数据分析系统
本系统基于Python大数据技术,深入研究用户行为数据分析,结合Pandas、NumPy等工具提升数据处理效率,利用B/S架构与MySQL数据库实现高效存储与访问。研究涵盖技术背景、学术与商业意义、国内外研究现状及PyCharm、Python语言等关键技术,助力企业精准营销与产品优化,具有广泛的应用前景与社会价值。
|
人工智能 运维 关系型数据库
云栖大会|数据库与AI全面融合,迈入数据智能新纪元
2024年云栖大会「数据库与AI融合」专场,来自NVIDIA、宇视科技、合思信息、杭州光云科技、MiniMax等企业的代表与阿里云瑶池数据库团队,共同分享了Data+AI全面融合的最新技术进展。阿里云发布了DMS的跨云统一开放元数据OneMeta和智能开发OneOps,推出《云数据库运维》技术图书,并介绍了PolarDB、AnalyticDB、Lindorm和Tair等产品的最新能力,展示了AI在数据库领域的广泛应用和创新。
1000 15

热门文章

最新文章