《全链路数据治理-智能数据建模 》——客户案例:汽车行业数据建模最佳实践(3)

简介: 《全链路数据治理-智能数据建模 》——客户案例:汽车行业数据建模最佳实践(3)

《全链路数据治理-智能数据建模 》——客户案例:汽车行业数据建模最佳实践(2) https://developer.aliyun.com/article/1230832?groupCode=tech_library



四、 指标需求确认


参考业务流程调研结果和总线矩阵,确定出可以产出的指标以及指标衍生维度。比如,对于汽车生产流程下的各个动作步骤可以产生的一些指标如下:

image.png

业务动作下产生的指标示例


1. 规范制定


1) 命名规范


在进行模型设计之前,需要约定好数仓各个层级表的命名规范。一方面统一的规范命名可以帮助我们提高开发效率,见名知义;一方面可以避免重复开发,减少资源浪费。


常见的一个表的命名要结合所在数仓层级、涉及到的业务模块、业务动作过程、以及更新方式和时间周期组合生成。在此项目中我们用到的命名规则如下:

image.png

表命名规范


2) 更新规范


更新分为全量更新和增量更新。一般来说,在离线计算采用每天新增一个分区,将当天新更新的数据写入该分区中。考虑到此客户的资源较建行和数据量较大,我们决定采用增量更新写入,再在下游用全量合并成当天全量表的方式来存储,这样可以节省存储资源,缩短数据同步时间。


3) 度量标准


为指标制定统一的度量,避免因为度量体系不一致导致后期数据质量问题,为使用者带来困扰。此项目中涉及到的实体与度量的关系如下:

image.png

实体与度量关系


4) 词典


词典与命名规范和度量息息相关,在描述统一实体时统一规范我们的措辞,可以帮助我们提升沟通效率。

image.png

词典




《全链路数据治理-智能数据建模 》——客户案例:汽车行业数据建模最佳实践(4) https://developer.aliyun.com/article/1230830?groupCode=tech_library

相关文章
|
新零售 数据采集 分布式计算
6000字干货分享:数据中台项目管理实践分享
本文总结了企业级数据中台项目的实践经验,希望能够为正在规划或者已在实施数据中台类项目的企业和个人提供经验。
6000字干货分享:数据中台项目管理实践分享
|
机器学习/深度学习 存储 自然语言处理
深度学习之持续的知识积累与转移
基于深度学习的持续知识积累与转移是指利用深度学习技术在多个任务或领域中有效地获取、更新和应用知识。这一过程能够提高模型在新任务上的性能,同时减少对大量标注数据的依赖。
272 8
|
安全 算法 网络安全
数字堡垒:探索网络安全的守护之策
在这个数字时代,网络安全已成为全球关注的焦点。本文深入探讨了网络安全的核心要素,包括漏洞的形成与防护、加密技术的应用以及安全意识的培养,旨在为读者提供一个全面的网络安全知识框架。通过对这些关键领域的分析,文章揭示了构建坚固网络防线的重要性,同时强调了个人和组织在维护信息安全方面应承担的责任。
|
Python
Matplotlib 教程 之 Matplotlib 绘图标记 7
在本教程中,您将学习如何使用Matplotlib的`plot()`方法中的`marker`参数来自定义图表标记。我们提供了线型(如实线`-`、虚线`:`等)、颜色(如红色`r`、绿色`g`等)的详细列表,并介绍了如何调整标记的大小和颜色,包括`markersize`(`ms`)以改变大小,`markerfacecolor`(`mfc`)以设定内部颜色,以及`markeredgecolor`(`mec`)以设定边框颜色。示例代码展示了如何应用这些属性。
297 0
|
关系型数据库 Java 数据库
实时计算 Flink版操作报错合集之flinksql采PG数据库时报错,该如何解决
在使用实时计算Flink版过程中,可能会遇到各种错误,了解这些错误的原因及解决方法对于高效排错至关重要。针对具体问题,查看Flink的日志是关键,它们通常会提供更详细的错误信息和堆栈跟踪,有助于定位问题。此外,Flink社区文档和官方论坛也是寻求帮助的好去处。以下是一些常见的操作报错及其可能的原因与解决策略。
|
存储 SQL 分布式计算
maxcompute是什么
【5月更文挑战第5天】maxcompute是什么
598 6
|
存储 监控 安全
Java基于物联网技术的智慧工地云管理平台源码 依托丰富的设备接口标准库,快速接入工地现场各类型设备
围绕施工安全、质量管理主线,通过物联感知设备全周期、全覆盖实时监测,将管理动作前置,实现从事后被动补救到事前主动预防的转变。例如塔吊运行监测,超重预警,升降机、高支模等机械设备危险监控等,通过安全关键指标设定,全面掌握现场安全情况,防患于未然。
458 5
|
存储 资源调度 算法
m基于FPGA和IP核的RS编译码verilog实现,包含testbench测试文件
m基于FPGA和IP核的RS编译码verilog实现,包含testbench测试文件
519 1
|
存储 分布式计算 算法
《全链路数据治理-智能数据建模 》——客户案例:汽车行业数据建模最佳实践(4)
《全链路数据治理-智能数据建模 》——客户案例:汽车行业数据建模最佳实践(4)
647 0
|
数据建模 数据挖掘 物联网
《全链路数据治理-智能数据建模 》——客户案例:汽车行业数据建模最佳实践(2)
《全链路数据治理-智能数据建模 》——客户案例:汽车行业数据建模最佳实践(2)
494 0