开始数据治理时三个常见的陷阱和解决方法

本文涉及的产品
数据管理 DMS,安全协同 3个实例 3个月
推荐场景:
学生管理系统数据库
简介: 当我们与客户合作帮助他们提高数据管理能力时,大多数部门都同意更好的数据治理将有助于解决他们的数据问题。

当我们与客户合作帮助他们提高数据管理能力时,大多数部门都同意更好的数据治理将有助于解决他们的数据问题。然而,我们发现数据治理很少是优先事项,而且往往被搁置一旁,去支持更紧迫的业务工作。这有点像使用牙线——当你在牙医诊所时很容易获得动力,但当你回到家时很难保持。

本文主要是帮助将新的数据治理计划从理论转变为实践,从而提供有意义的价值或为那些已经开始其旅程的人提供一些参考。

1. 制定数据治理策略

■常见陷阱

数据治理通常始于模糊且难以采取行动的高级策略。通常,这源于数据治理在其他被认为更重要的数据功能中扮演次要角色,例如新数据平台建设或部署新的人工智能。由此产生的数据治理策略可能采取以下形式:

(1)成立数据治理委员会

(2)编写数据策略

(3)根据(1)和(2)的结果定义未来的活动

虽然数据治理委员会和数据政策都是数据治理的关键部分,但从这里开始可能是一种误导性的方法来产生影响,甚至导致数据治理脱轨。通常,数据治理委员会的成员是高级决策者。这些人不是负责制定可以执行的详细数据治理策略的人,因此虽然这些早期会议可能会引发一些关注,但很容易导致缺乏行动。同样,虽然从一开始就编写数据策略在理论上听起来不错,可能会产生大量编写良好的文档,而这些文档很难定义接下来要实施的步骤。因此,这可能导致动力严重丧失,数据治理对更具体的活动失去青睐。

■推荐方法

在交付新功能时,专注于与业务成果保持一致似乎很直观。根据我们的经验,在数据治理方面,这一点经常被忽视。很难将数据治理直接与业务成果联系起来,因为实现该成果的解决方案通常涉及数据治理加上数据科学、数据工程等。但这没关系,数据治理不需要成为实现业务成果的独立解决方案,尽管有时确实如此。重要的是,数据治理是对业务至关重要的解决方案的关键部分。常见的例子有:

•按业务上下文(例如,数据域)组织的数据,并充当数据管理专员

•支持新 ERP 系统部署的业务术语表

•一个集中的数据目录,允许对重要的共享数据资产和流程的理解保持一致

最终,我们建议采用业务成果驱动的方法(也称为“用例驱动方法”)来优先发展数据治理能力。这些数据治理能力可能涵盖从新的人员需求(例如,增加数据管理员的职责)到新的流程需求(例如,编写新的数据策略)到新技术需求(例如,在数据治理工具中构建数据目录)的任何内容. 然后,这构成了数据治理策略的基础。

c43e892f9bbb40d465899538b4a916b0.png

关键的一点是,数据治理能力需要与业务成果保持一致并按其优先级排序——即使它们不是实现这些业务成果的独立解决方案

2. 定义数据管理员的角色

■常见陷阱

在高级别定义数据管理员角色可能听起来很容易——通常它描述了像数据领域的“首席专家”这样的人,负责确保遵守数据政策和标准,并有权对数据做出决策. 具有挑战性的是将这些职责转化为数据管理员的明确定义的活动。结果,我们通常会看到两种不同的情况之一:

(1)角色的高级描述导致混乱和无所作为:在某些情况下,组织并不真正知道数据管理员的日常工作应该是什么样子,因此角色的定义最终会变得模棱两可。对于新的数据管家来说,这让他们很难上手,尤其是在他们没有强大的数据治理团队指导的情况下。

(2)详细的责任清单铺天盖地;吓跑了潜在的数据管理员:我们还看到了与(1)完全相反的情况,即组织花费大量时间详细定义每项职责。由于数据管理员的角色很少伴随着加薪或升职,这对潜在的数据管理员来说可能是令人生畏的。为什么要担任这个听起来工作量很大的新角色?

■推荐方法

我们推荐的方法侧重于花更少的时间预先确定数据管理者角色和责任定义的确切细节。我们建议专注于识别那些已经充当自然数据管家的个人,并授权他们开始使用新的数据治理计划。对数据管理者角色的高级描述是将这一概念介绍给领导层以及潜在管理者担任新角色的好方法——但最重要的是确定合适的个人担任数据管理者。

一旦确定了这些人,我们发现花时间开发和执行强大的培训/采用计划非常有价值,因此管理员在他们过渡到新角色时得到足够的支持。该计划的结构将根据组织的数据成熟度而有所不同——对于一些潜在的管理者来说,这将是一个自然的过渡,事实上,他们可能已经以非正式的方式履行了数据管理者的所有职责。对于其他人来说,这可能是一个全新的概念,因此需要数据治理团队花更多时间帮助他们为新角色做好准备。

就分配给管家的具体职责而言,我们建议逐步构建它们并将它们直接链接到数据域中的数据治理功能(参见上面的#1)。例如,从维护业务词汇表的职责开始,然后围绕数据质量、访问等添加词汇表。同样重要的是要注意,并非所有数据管理员都会做同样的事情。有些可能在本质上更具技术性;其他人可能会担任这个角色,因为他们对数据如何影响业务有更深入的了解。这将导致谁应该履行哪些数据管理职责的自然区别。

三个关键要点是 (1) 找到合适的人担任数据管理员,(2) 数据管理员的定义将随着时间的推移而不断变化和成熟,以及 (3) 每个数据管理员的定义都不相同

6663fa0323a314b7a70e1eadff285d12.png

3. 实施新的数据治理能力

■常见陷阱

实施新的数据治理能力是我们看到公司苦苦挣扎的另一个领域。为了说明这个陷阱,让我们举个例子。客户刚开始使用新的数据治理工具(例如 Collibra),他们很高兴开始构建他们的第一个数据治理功能——在这种情况下,假设它是一个业务词汇表。团队开始从文档和讨论中识别和收集潜在的业务术语。很快就会有大量积压的业务术语需要定义,并且需要以对其特定业务环境有意义的方式对其进行充分定义。几个月过去了,数据治理团队与数据管理员和协调员一起定义定义,继续完善积压工作。最后,新的业务词汇表已投入生产,因此组织的其他人可以使用它。唯一的问题是:数据治理团队已经为此工作了几个月,而组织的其他人还没有看到任何东西。

通过采用这种自下而上的整体方法来构建业务词汇表,存在很大的风险,即延迟组织在业务词汇表中看到的价值实现时间,以及构建不符合企业需求的东西。另一个风险是数据管理员和协调员的倦怠,特别是如果他们没有看到业务词汇表会产生业务影响,或者更糟的是,他们已经投入时间定义不相关的术语。尽管此示例特定于业务词汇表,但很容易想象类似的场景会用于实现任何类型的与目录相关的数据治理功能。

■推荐方法

在这里,我们推荐的方法可以概括为“超越完美的进步”。我们的意思是通过优先考虑对业务具有最大价值的术语,专注于小的块构建业务词汇表。这些可能是出现在常用报告中的简单术语,因此更可能对更广泛的组织有用,或者在组织的不同领域具有不同含义的复杂术语,尽管考虑到这些术语的定义需要更长的时间来权衡,通常涉及的利益相关者的数量。同样,这个例子可以扩展到任何类型的数据编目工作,无论是专注于报告、数据集还是其他东西。

重要的是,数据治理对于组织的其他部分来说不会像黑匣子一样出现。数据治理需要成为以业务为主导的职能,并且需要与业务领导者不断协作,以确定可以通过数据解决的相关问题。所有数据都很重要,但目前并非所有数据都很重要。最终,数据治理必须建立动力以显示持续的价值。

两个关键要点是:(1) 需要投入时间来根据业务价值对目录中包含的内容进行优先排序;(2) 在整个工作中稳步显示进展是至关重要的。  

相关实践学习
MySQL基础-学生管理系统数据库设计
本场景介绍如何使用DMS工具连接RDS,并使用DMS图形化工具创建数据库表。
相关文章
|
8月前
|
SQL 安全 程序员
PHP编程中的关键性错误及解决方法
在PHP编程过程中,程序员常常会遇到一些关键性错误,这些错误可能会导致程序运行异常甚至崩溃。本文将重点探讨PHP编程中常见的关键性错误,并提供解决方法,帮助程序员更好地应对这些问题,提高编程效率和代码质量。
44 1
|
2月前
|
设计模式 Java 开发者
Java多线程编程的陷阱与解决方案####
本文深入探讨了Java多线程编程中常见的问题及其解决策略。通过分析竞态条件、死锁、活锁等典型场景,并结合代码示例和实用技巧,帮助开发者有效避免这些陷阱,提升并发程序的稳定性和性能。 ####
|
2月前
|
缓存 Java 开发者
Java多线程编程的陷阱与最佳实践####
本文深入探讨了Java多线程编程中常见的陷阱,如竞态条件、死锁和内存一致性错误,并提供了实用的避免策略。通过分析典型错误案例,本文旨在帮助开发者更好地理解和掌握多线程环境下的编程技巧,从而提升并发程序的稳定性和性能。 ####
|
30天前
|
安全 算法 Java
Java多线程编程中的陷阱与最佳实践####
本文探讨了Java多线程编程中常见的陷阱,并介绍了如何通过最佳实践来避免这些问题。我们将从基础概念入手,逐步深入到具体的代码示例,帮助开发者更好地理解和应用多线程技术。无论是初学者还是有经验的开发者,都能从中获得有价值的见解和建议。 ####
|
8月前
|
安全
编程高级陷阱-破坏原有生态
编程高级陷阱-破坏原有生态
|
测试技术 数据库
以目标为导向思考解决问题的方式
以目标为导向思考解决问题的方式
947 0
以目标为导向思考解决问题的方式
|
机器学习/深度学习 人工智能 运维
评估ML监控解决方案时要避免的常见陷阱(mona)
机器学习运营 (MLOps) 是目前最热门的创业投资领域之一,因为虽然构建机器学习模型的最佳实践相对容易理解,但大量创新正被投入到设计方法以最佳地将它们用于生产环境。 MLOps 类别中最主要的是 ML 监控。 了解 ML 监控工具的前景可能令人懊恼、耗时,而且很容易令人困惑。 我们撰写本文的目的是绘制其制图图,并希望借此阐明选择适当监控解决方案的一些常见陷阱,从而为混乱带来秩序。
|
数据管理 项目管理
谈谈实施数据治理时常犯的10大错误
我所见过的最大的错误就是企业没有将文化变革纳为数据治理举措的一部分。到目前为止,这个错误是最大和最常见的错误,它最终可能导致数据治理计划的彻底失败。
|
安全 Java
Java开发过程中 异常及日常如何规避
Java开发过程中 异常及日常如何规避
|
数据采集 数据管理 数据挖掘
「数据治理那点事」系列之三:不忘初心方得始终,数据质量管理要稳住!
本文主要讲数据治理中的重要工作:数据质量管理。 从数据质量管理的目标,质量问题产生的根源,讲到如何评估数据质量,如何贯彻数据质量管理流程,最后从取与舍两个角度谈谈我对质量问题的一些个人观点。