谈谈数据管理中的数据治理和元数据

本文涉及的产品
数据管理 DMS,安全协同 3个实例 3个月
推荐场景:
学生管理系统数据库
简介: 数据治理是数据管理策略中最基本的功能,因为它是其他功能的中心和领导。在这里,我们应该对两个经常被误解的概念进行区分:

一 数据治理

数据治理是数据管理策略中最基本的功能,因为它是其他功能的中心和领导。在这里,我们应该对两个经常被误解的概念进行区分:

•数据治理负责定义数据管理策略

•数据管理是执行定义的策略

虽然数据治理不是一个技术性的功能,但它可以利用元数据和建模工具的力量来定义数据管理的某些方面。这些工具将用于更好地理解将要使用的数据和数据流的总体架构。

根据DAMA,数据治理是指对组织中使用的数据的可靠性、可用性、完整性和安全性的综合管理。

数据治理包括:

•管理机构(理事会)

•一套标准和政策

•执行这些标准和政策的计划。

数据治理计划在整个组织中建立流程,以便在系统和应用程序中提供标准,例如术语的定义和一致的业务规则。

它确定参与需求定义的合适人员,并建立数据标准和数据使用的定义。

数据治理确保在整个组织中定义和应用相同的数据标准和策略。

1数据管理的基本原则

•为了确保在整个企业中遵循已定义的标准,必须建立一个数据治理组织。

•数据治理的组织涉及到多层业务和技术角色的组合:

•发起人:为数据治理工作提供领导和资金

•数据管理委员会:鼓励采用和实施控制和流程

•角色:为数据建立角色并明确定义职责

•标准:明确定义和发布的标准和政策

•监督:建立跟踪、审计和报告符合标准和政策的过程。

•变更控制:建立评估、批准和沟通标准和策略变更的过程。

•执行支持:确保执行人员参与并与数据治理计划保持一致。

2数据治理过程

03b5e400f6db85306f8824753fc9e467.png

(1)数据治理组织建立

•确定数据治理计划的执行发起人

•建立数据治理委员会

•让数据治理活动的主要涉众(数据所有者、数据管理员、数据管家、架构师)参与进来

(2)定义标准和数据策略

•定义数据标准

•定义数据策略

(3)数据标准和政策遵从

•在整个组织内应用标准和数据策略

(4)审计监控及及测量

•定期进行审计和控制操作

•数据治理控制绩效的监控和测量。

3数据治理的技术工具

元数据和数据质量支持工具用于数据治理的实现。市场上很少有工具被认为是特定的。数据治理的重要功能是设计工作流,该工作流可用于实现数据标准和策略。另一个重要的功能是设计用于监视和控制数据治理活动的仪表板。

852c11a968245715e48f5abc0a0ae0f3.png

二 元数据

元数据管理是成功的数据管理策略的另一个关键功能。在深入讨论它之前,让我们先介绍元数据的概念和它的不同类型。

1元数据的基本概念

根据维基百科,元数据是“提供关于其他数据的信息的数据信息”。换句话说,元数据是关于数据的数据,数据提供关于该数据的一个或多个方面的信息

元数据用于总结基本信息,以便于跟踪和处理数据。例如,我们一张数字图像,它的元数据可以是图像的大小、分辨率、存储的位置、生成的时间等等。元数据概念中有两个基本组件:数据元素(DE)和关键数据元素(CDE)。(

1)数据元素(DE)

数据元素或DE,是由一组属性组成的数据原子单元:

•定义

•识别

•表示

•允许的值

(2)关键数据元素(CDE)

关键数据元素是对特定业务领域或业务流程的成功至关重要的数据元素。数据元素成为关键元素的标准是:

•业务数据被认为是该组织的关键元素。

•关键业务流程数据及其组件,例如客户联系方式。

•高级业务报告中使用的关键数据。

•公司中重要事物的唯一标识符,例如客户ID。

2元数据管理

它涉及到管理关于其他数据的数据,例如数据模型和结构,而不是内容。它包括管理关于不同模型的数据结构及其关联的信息,如:

•术语表中的业务术语

•数据逻辑模型或数据库表和列中的属性,以及它们的关联有业务元数据和技术元数据,它们的特征如下图所示:

ddfd006c521a3316d7d9a7bffb2a40af.png

(1)业务元数据

它们从业务使用的角度描述数据元素,包括包含术语和定义、同义词、首字母缩写、业务规则和职责的业务术语表等信息。我们所说的业务元数据是指:

•商业词汇和分类

•业务规则

•责任

(2)技术元数据

它们从技术的角度描述数据元素,包括逻辑数据模型、源和目标系统、表和字段结构以及系统依赖关系等信息。操作元数据是关于应用程序的:频率、帐户记录,以及用于审计目的的分析和其他统计数据的组件。

(3)关键数据元素标准

技术和业务元数据表示关键数据元素标准,这意味着从技术和业务角度对关键数据元素进行了全面描述。

关键数据元素标准又称关键数据元素的360º视图。通过获得关键数据元素的360°视图,为整个组织的数据管理提供最佳条件,这是数据管理的最终目标。一旦实现了这一点,就有可能回答以下问题:

•关键数据元素的定义是什么?

•谁拥有关键数据元素业务?

•关键数据元素存储在哪里?

•在哪些报告中使用关键数据元素 ?

(4)元数据管理角色

元数据管理涉及到的几个角色:

•业务所有者:负责数据的定义、质量和数据价值。他们负责确认数据的使用与一般数据策略一致。数据治理,他们还负责驱动活动和数据管理流程。

•管理员:或者数据管家负责对数据进行操作监控,以及与整个组织中各个领域的专家进行互动,以及确认数据标准的定义,以及流程和实践的实施

•技术负责人:技术专家,负责确保来自系统的数据由已定义的数据标准管理和使用。包括遵从业务规则、策略和过程。

•数据保管人:技术专家,负责系统中数据的安全管理。它负责确认所定义的数据标准是否得到应用。

•关键数据元素的最终来源是什么系统?

3元数据管理流程

10d3174593e2cdbf80db8f200cb4ec1e.png

元数据流程活动涵盖了数据管理中的人员、流程和技术。

(1)识别关键数据元素

通过与涉众面谈来分析业务需求和确定最相关的关键数据元素的活动。

(2)为关键数据元素收集业务元数据

对于相关的关键数据元素定义业务术语,同义词、首字母缩写、定义和分类法也定义业务规则并负责地确定这些规则。

(3)为关键数据元素收集技术元数据

对于相关的关键数据元素,确定数据系统中的关键数据元素表示,确定数据源和数据沿袭。

(4)创建关键数据元素标准(360º视图)

关键数据元素创建业务和技术元数据之间的关联,验证关键数据元素数据标准。

(5)应用关键数据元素标准

确保符合关键数据元素标准,以确保每个关键数据元素的管理并由定义的标准(数据治理)使用。

4系统开发的生命周期

指的是计划、创建、测试和部署信息的过程。定义从系统开发生命周期中获得的元数据,并将其作为元数据功能过程的一部分,这一点很重要。

aef5c6020e9673a1886a4f603606f27f.png

5元数据工具

元数据管理系统最低技术要求要包含以下功能:

•能够建立和部署集中的元数据存储库。

•能够通过词汇表的层次结构定义一致的术语、有效的定义、有效的值和数据域。

•能够从数据建模工具、商业智能工具和ETL中提取最流行的数据库管理系统(Oracle、SQLServer、NoSQL)的元数据。

•能够管理来自多个来源和技术的元数据版本。

16aeb475edbfc0659aa1a5830d20ef12.png

三 小结

元数据被称为“描述数据的数据”,是数据治理的基础,元数据描述着数据的属性,数据与数据之间的关系,对我们进行数据治理有着极深的关系,它清晰展示出数据的血缘关系、提供数据地图和影响分析大大提高业务人员在业务系统修改数据时的效率,是数据治理的基石。

相关实践学习
MySQL基础-学生管理系统数据库设计
本场景介绍如何使用DMS工具连接RDS,并使用DMS图形化工具创建数据库表。
相关文章
|
1月前
|
人工智能 关系型数据库 分布式数据库
拥抱Data+AI|“全球第一”雅迪如何实现智能营销?DMS+PolarDB注入数据新活力
针对雅迪“云销通App”的需求与痛点,本文将介绍阿里云瑶池数据库DMS+PolarDB for AI提供的一站式Data+AI解决方案,助力销售人员高效用数,全面提升销售管理效率。
|
4月前
|
物联网 数据管理 Apache
拥抱IoT浪潮,Apache IoTDB如何成为你的智能数据守护者?解锁物联网新纪元的数据管理秘籍!
【8月更文挑战第22天】随着物联网技术的发展,数据量激增对数据库提出新挑战。Apache IoTDB凭借其面向时间序列数据的设计,在IoT领域脱颖而出。相较于传统数据库,IoTDB采用树形数据模型高效管理实时数据,具备轻量级结构与高并发能力,并集成Hadoop/Spark支持复杂分析。在智能城市等场景下,IoTDB能处理如交通流量等数据,为决策提供支持。IoTDB还提供InfluxDB协议适配器简化迁移过程,并支持细致的权限管理确保数据安全。综上所述,IoTDB在IoT数据管理中展现出巨大潜力与竞争力。
121 1
|
5月前
|
SQL NoSQL 数据管理
数据管理DMS使用问题之如何批量导入MongoDB的数据文件
阿里云数据管理DMS提供了全面的数据管理、数据库运维、数据安全、数据迁移与同步等功能,助力企业高效、安全地进行数据库管理和运维工作。以下是DMS产品使用合集的详细介绍。
|
1月前
|
关系型数据库 分布式数据库 数据库
云栖大会|从数据到决策:AI时代数据库如何实现高效数据管理?
在2024云栖大会「海量数据的高效存储与管理」专场,阿里云瑶池讲师团携手AMD、FunPlus、太美医疗科技、中石化、平安科技以及小赢科技、迅雷集团的资深技术专家深入分享了阿里云在OLTP方向的最新技术进展和行业最佳实践。
|
2月前
|
存储 人工智能 安全
【荣誉奖项】荣获2024数据治理优秀产品!瓴羊Dataphin联合DAMA发布数据管理技能认证
瓴羊Dataphin连续俩年获得DAMA年度优秀数据治理产品奖,本次与DAMA联合发布“DAMA x 瓴羊 数据管理技能认证”,助力提升全民数据素养。
168 0
【荣誉奖项】荣获2024数据治理优秀产品!瓴羊Dataphin联合DAMA发布数据管理技能认证
|
2月前
|
数据采集 安全 数据管理
通信行业数据治理:如何实现高效、安全的数据管理?
在未来的发展中,通信行业的企业应加强数据治理意识,提高数据治理能力;同时,积极开展跨行业的合作创新,共同推动行业的繁荣与发展。相信在不久的将来,通信行业将迎来更加美好的明天。
|
4月前
|
JSON 数据管理 关系型数据库
【Dataphin V3.9】颠覆你的数据管理体验!API数据源接入与集成优化,如何让企业轻松驾驭海量异构数据,实现数据价值最大化?全面解析、实战案例、专业指导,带你解锁数据整合新技能!
【8月更文挑战第15天】随着大数据技术的发展,企业对数据处理的需求不断增长。Dataphin V3.9 版本提供更灵活的数据源接入和高效 API 集成能力,支持 MySQL、Oracle、Hive 等多种数据源,增强 RESTful 和 SOAP API 支持,简化外部数据服务集成。例如,可轻松从 RESTful API 获取销售数据并存储分析。此外,Dataphin V3.9 还提供数据同步工具和丰富的数据治理功能,确保数据质量和一致性,助力企业最大化数据价值。
223 1
|
4月前
|
Java 测试技术 容器
从零到英雄:Struts 2 最佳实践——你的Web应用开发超级变身指南!
【8月更文挑战第31天】《Struts 2 最佳实践:从设计到部署的全流程指南》深入介绍如何利用 Struts 2 框架从项目设计到部署的全流程。从初始化配置到采用 MVC 设计模式,再到性能优化与测试,本书详细讲解了如何构建高效、稳定的 Web 应用。通过最佳实践和代码示例,帮助读者掌握 Struts 2 的核心功能,并确保应用的安全性和可维护性。无论是在项目初期还是后期运维,本书都是不可或缺的参考指南。
55 0
|
4月前
|
SQL 存储 数据管理
掌握SQL Server Integration Services (SSIS)精髓:从零开始构建自动化数据提取、转换与加载(ETL)流程,实现高效数据迁移与集成——轻松上手SSIS打造企业级数据管理利器
【8月更文挑战第31天】SQL Server Integration Services (SSIS) 是 Microsoft 提供的企业级数据集成平台,用于高效完成数据提取、转换和加载(ETL)任务。本文通过简单示例介绍 SSIS 的基本使用方法,包括创建数据包、配置数据源与目标以及自动化执行流程。首先确保安装了 SQL Server Data Tools (SSDT),然后在 Visual Studio 中创建新的 SSIS 项目,通过添加控制流和数据流组件,实现从 CSV 文件到 SQL Server 数据库的数据迁移。
317 0
|
5月前
|
运维 数据管理 数据库
数据管理DMS操作报错合集之数据归档时,遇到报错:"DMS获取内容为空,无须备份",该怎么办
阿里云数据管理DMS提供了全面的数据管理、数据库运维、数据安全、数据迁移与同步等功能,助力企业高效、安全地进行数据库管理和运维工作。以下是DMS产品使用合集的详细介绍。