一篇文章搞懂数据仓库:元数据分类、元数据管理

本文涉及的产品
数据管理 DMS,安全协同 3个实例 3个月
推荐场景:
学生管理系统数据库
简介: 一篇文章搞懂数据仓库:元数据分类、元数据管理

正文


1、业务元数据


描述 ”数据”背后的业务含义


主题定义:每段 ETL、表背后的归属业务主题。


业务描述:每段代码实现的具体业务逻辑。


标准指标:类似于 BI 中的语义层、数仓中的一致性事实;将分析中的指标进行规范化。


标准维度:同标准指标,对分析的各维度定义实现规范化、标准化。


不断的进行维护且与业务方进行沟通确认。


2、技术元数据


数据源元数据


例如:数据源的 IP、端口、数据库类型;数据获取的方式;数据存储的结构;原数据各列的定义及 key 指对应的值。


ETL 元数据


根据 ETL 目的的不同,可以分为两类:数据清洗元数据;数据处理元数据。

数据清洗,主要目的是为了解决掉脏数据及规范数据格式;因此此处元数据主要为:各表各列的"正确"数据规则;默认数据类型的"正确"规则。

数据处理,例如常见的表输入表输出;非结构化数据结构化;特殊字段的拆分等。源数据到数仓、数据集市层的各类规则。比如内容、清理、数据刷新规则。


数据仓库元数据


数据仓库结构的描述,包括仓库模式、视图、维、层次结构及数据集市的位置和内容;业务系统、数据仓库和数据集市的体系结构和模式等。


BI 元数据


汇总用的算法、包括各类度量和维度定义算法。数据粒度、主题领域、聚集、汇总、预定义的查询与报告。


3、管理元数据


管理领域相关,包括管理流程、人员组织、角色职责等。


4、小编有话


在日常工作中,元数据的管理主要体现在元数据的采集、存储、查询、应用几个方面。原则上应从规范化,到脚本化,到工具化的方向进行建设。


采集:元数据采集时尽可能详细,真实,可通过工具生成或者勾选,避免手动录入带来不规范等问题

存储:存储元数据要做到不失真,元数据变更时及时同步

查询:通过网页或库表等方式,方便快捷的看到元数据,辅助进行开发

应用:数据血缘、优化调度依赖、数据治理等

相关实践学习
MySQL基础-学生管理系统数据库设计
本场景介绍如何使用DMS工具连接RDS,并使用DMS图形化工具创建数据库表。
相关文章
|
6月前
|
数据采集 机器学习/深度学习 存储
数据仓库与数据湖:不同的数据管理方式
在当今数据驱动的时代,数据管理成为了企业发展的关键。数据仓库和数据湖是两种不同的数据管理方式。本文将介绍数据仓库和数据湖的概念及其应用,并分析其优缺点,帮助企业选择适合自身的数据管理方式。
|
2月前
|
存储 分布式计算 数据管理
不可思议!Delta Lake 打造批流一体数据仓库,颠覆传统数据管理的奇迹之作
【9月更文挑战第3天】Delta Lake 是一种高效的数据存储格式,适用于构建批流一体的数据仓库。它支持 ACID 事务,确保数据一致性;能自动处理数据模式变更,简化开发流程。本文将分四步介绍如何使用 Delta Lake 实现批流一体的数据仓库:配置环境、创建 Delta Lake 表、执行批处理与流处理操作。通过示例代码展示其强大功能,适用于电商等多种场景下的数据整合与实时分析。
53 2
|
3月前
|
存储 分布式计算 数据管理
不可思议!Delta Lake 打造批流一体数据仓库,颠覆传统数据管理的奇迹之作
【8月更文挑战第9天】Delta Lake 是一种先进的数据存储格式,它通过支持 ACID 事务、自动处理数据模式变更及提供统一编程接口等特性,为构建批流一体的数据仓库提供高效可靠的解决方案。本指南介绍如何利用 Delta Lake 实现批流一体数据处理,包括环境配置、表创建、批处理与流处理操作,并通过示例代码展示其在电商数据仓库中的应用,以实现数据的实时洞察与分析。
47 4
|
6月前
|
SQL 数据采集 存储
数据仓库(12)数据治理之数仓数据管理实践心得
这边文章聊聊自己对数据治理开发实践的一些思路,就是聊聊怎么开始去做数据治理这件事情。说起数据治理,有时候虽然看了很多文章,看了很多的介绍,了解数据治理的理论,但是实际上需要我们去搞的时候,就会踩很多的坑。这里记一下自己做数据治理的一些思路,做做笔记,也分享给需要的同学。 当然,想要做数据治理,想要学习了解,一下数据治理的范围,理论等,最好可以看看别人怎么做的,了解数据治理可以参考:[数据仓库(11)什么是大数据治理,数据治理的范围是哪些](https://zhuanlan.zhihu.com/p/467433967)。
384 0
|
6月前
|
存储 机器学习/深度学习 运维
数据仓库与数据湖:解析企业数据管理的两大利器
在信息时代,企业数据的管理和分析变得至关重要。数据仓库和数据湖作为两种不同的数据管理模式,各自具有独特的特点和应用场景。本文将深入探讨数据仓库与数据湖的概念、优势和应用,帮助读者更好地理解和运用这两个工具。
174 0
|
数据库 数据库管理
DMS中,同步元数据
DMS中,同步元数据
88 1
|
SQL 存储 大数据
关于数据仓库的Hive的Hive架构的MetaStore元数据服务
随着大数据技术的不断发展,数据仓库成为了企业中不可或缺的一部分。而Hive作为一种开源的数据仓库系统,因其易于使用和高效处理等特点,成为了许多企业的首选。然而,对于普通用户来说,直接使用Hive的命令行工具进行操作并不方便。因此,开发者社区中涌现出了大量的Hive GUI工具,其中最为流行的就是Web GUI工具。
307 2
|
存储 数据采集 编解码
谈谈数据管理中的数据治理和元数据
数据治理是数据管理策略中最基本的功能,因为它是其他功能的中心和领导。在这里,我们应该对两个经常被误解的概念进行区分:
谈谈数据管理中的数据治理和元数据
|
数据采集 存储 数据管理
一文看透元数据和主数据本质|谈谈元数据管理和主数据管理的区别
高速发展的数字化时代,企业必须依靠对数据的了解来生存和发展。
一文看透元数据和主数据本质|谈谈元数据管理和主数据管理的区别
|
数据采集 运维 监控
数据管理这场盛宴,无元数据不成席
元数据管理和主数据管理、数据标准管理的关系 元数据管理是数据管理的核心要素,是主数据管理的基础组成部分,也是数据标准实施的重要载体。
数据管理这场盛宴,无元数据不成席

热门文章

最新文章