数据治理的三度修炼

本文涉及的产品
数据管理 DMS,安全协同 3个实例 3个月
推荐场景:
学生管理系统数据库
简介: 所有企业都需要计划如何使用数据,以便在整个业务中一致地处理和使用数据,以支持业务结果。

基础-是什么,为什么,如何做,谁来做和15个最佳实践

   所有企业都需要计划如何使用数据,以便在整个业务中一致地处理和使用数据,以支持业务结果。这意味着,成功做到这一点的组织要考虑数据的来源、内容、方式、时间、地点和原因,不仅要确保安全性和合规性,而且要从整个业务中收集和存储的所有数据中提取价值,从而提高业务绩效。

关键在于如何处理业务中收集的数据。

---------------------------------------------

这就是数据治理,而大多数组织都在不知不觉中进行了某种类型的数据治理。

---------------------------------------------

   根据《2019年数据管理状态》,数据治理是2019年全球组织的五大战略举措之一。由于机器学习和人工智能等技术趋势依赖于数据质量,而且随着全球数字化转型举措的推动,这一趋势可能不会在短期内改变。

   正因为如此,我希望提高人们对数据治理的认识,以帮助那些关心数据质量的人更多地了解数据治理如何影响当今的业务环境、利益相关者和企业目标。

   一、什么是数据治理

   如果您到百度或谷歌里搜索“数据治理”。不出五秒钟,你就会淹没在定义之中。希望你能找到你最喜欢的。

   我喜欢让事情简单化,所以我给出一句数据治理的定义:

--------------------------------------------

数据治理是一组原则和实践,可在整个数据生命周期中确保数据高质量。

--------------------------------------------

   根据数据治理研究所(DGI)的说法,它是一个实用的、可操作的框架,可以帮助任何组织的各种数据利益相关者识别和满足他们对数据的需求。

   DGI认为,企业需要的不仅仅是管理数据的系统。他们需要一套完整的规则体系,以及确保这些规则在每个工作日都得到一致遵守的流程和程序。这对任何治理体系来说都是一个艰巨的任务。如果企业有数据治理平台这样的工具将使工作变得容易得多。

   二、为什么进行数据治理

   数据正在成为决定企业成功与否的核心资产。数字化转型已经提上了世界各国的议程。只有在能够管理数据的情况下,才能利用数据资产并进行成功的数字化转型。这意味着必须部署适合您的组织和未来业务目标和业务模型的数据治理框架。该框架必须控制这一过程所需的数据标准,并在组织内以及与公司运营的业务生态系统相关的范围内指派所需的角色和责任。

   一个管理良好的数据治理框架将支持企业在多个层次上在数字平台上运营的业务转型:

   •管理:对于最高管理层来说,这将确保监督企业数据资产的价值和它们在不断变化的业务运营和市场机会中的影响;

   •财务:对于财务来说,这将确保报告的一致性和准确性;

   •销售:对于销售和市场营销来说,这将有助于对客户偏好和行为的可靠洞察;

   •采购:对于采购和供应链管理而言,这将加强基于挖掘数据和商业生态系统协作的成本降低和运营效率计划;

   •生产:对于生产来说,这将是部署自动化的关键要素;

   •法规:对于法律和合规而言,这将是满足日益增长的监管要求的唯一途径。

   数据治理意味着更好,更精简,更干净的数据,这意味着更好的分析,这意味着更好的业务决策,这意味着更好的业务结果,更好的市场定位,更高的利润率。

   三、数据治理的目的

   当然,定义很重要。但行动更重要。现在我们知道什么是数据治理了,那么我们想用它做什么呢?

   下面给出几种进行数据治理的目的:

   •根据可靠的数据做出一致、可信的业务决策,这些数据与企业内部使用数据资产的各种目的保持一致;

   •通过记录数据资产的沿袭和与数据相关的访问控制,满足法规要求并避免罚款;

   •通过建立数据所有权和相关责任来提高数据安全性

   •定义和验证数据分发政策,包括涉及的内部和外部实体的角色和职责;

   •使用数据来增加利润,数据盈利首先需要以最佳方式存储、维护、分类数据并让用户能够访问这些数据;

   •分配数据质量职责,以衡量和跟踪企业内部与总体绩效KPI相关的数据质量KPI;

   •不必为每个计划的项目清理和整理数据就可以很好地进行项目建设;

   •通过拥有可信的、标准化的、能够服务于多种目的的数据资产来消除重复工作

   •通过提供满足所需数据质量要求的数据资产优化员工效率;

   •通过逐步提高数据治理成熟度水平进行评估和改进;

   •承认已经取得的成果,并继续向前推进,以确保利益相关者的持续承诺和广泛的组织支持。

   这些只是您可以通过优秀的数据治理完成的一小部分工作。最重要的是,我们要么想做这些事情以保持企业经济增长,要么我们必须做它们以满足法规要求。不论是何原因,不做数据治理最终结果是一样的。如果我们有错误的数据,那么我们会做出错误的决定,直到后来,我们才意识到这些错误的决定。

   四、谁需要参与数据治理

   数据治理会或多或少地涉及到整个组织,让我们分析一下最常见的角色:

   数据所有者:首先,需要指定业务中的数据所有者。他们必须是能够做出决定并在整个组织中执行这些决定的人。可以在实体级任命数据所有者(如客户数据、产品数据、员工数据等等),也可以在属性级任命数据所有者(如客户地址、客户状态、产品名称、产品分类等等)。数据所有者要对数据作为资产的状态负责。

   数据专员:接下来,需要指定数据专员,他们是确保在日常业务中遵循数据策略和数据标准的人。这些人通常是数据实体或一组数据属性的主题专家。数据专员要么是负责将数据作为资产处理的人,要么是在如何处理数据方面提供咨询的人。

   数据保管人:此外,可以指定数据保管人(或数据操作员)对数据资产进行业务和技术采集、维护和报废更新。

   数据治理委员会:通常,企业需要成立一个数据治理委员会,作为批准数据政策和数据标准以及处理升级问题的组织。根据企业的规模和结构,每个数据域可能有管理小组 (如客户、供应商、产品、员工)。

   上面的这些角色应该得到数据治理办公室和数据治理团队的支持。在一个典型的企业中,以下是一些可能是组成数据治理团队的人员:

   •主数据治理经理:领导整个公司的主数据控制和治理的设计、实施和持续维护。

   •解决方案和数据治理架构师:为解决方案的设计和实现提供监督。

   •数据分析师:使用分析来确定趋势和审查信息。

   •数据策略师:制定并执行趋势模式分析计划。

   •合规专家:确保符合要求的标准(法律、辩护、医疗、隐私)。

   分配和履行角色最重要的方面之一是对角色,期望以及角色如何相互作用进行详细记录。这通常将在RACI矩阵中概述,该矩阵描述在特定的执行、过程或作为政策或标准的特定工作中,谁是执行的、谁是负责的、咨询谁和告知谁的。

   五、数据治理框架

   数据治理框架是一组数据规则、组织角色委派和过程,旨在使组织中的每个人都处于同一页面。

   有很多数据治理框架。作为示例,我们将使用来自数据治理研究所的示例。这个框架有10个部分。

f54a0fc8c33c83e877cc330b23bdcc3f.jpg4967c0790bcd81381810df229304387c.png

   六、数据治理成熟模型

   根据数据治理成熟度模型对组织进行度量,对于制定路线图、沟通数据治理活动的当前任务和未来工作以及部署数据治理框架的环境来说是非常有用的。

   这种成熟度模型的一个例子是Gartner提供的企业信息管理成熟度模型:

fdbe7f71f7782a76ab5c773044d514ad.jpg    大多数组织在开始数据治理项目之前会发现自己处于这种模型的较低阶段。

   阶段0—无意识阶段:这可能处于无意识阶段,这通常意味着您的组织或多或少会有关于数据治理如何实现更好的业务结果的想法。在这个阶段,你可能对需要做什么有了一个愿景,但需要专注于更卑微的事情,比如说服业务中正确的人,以及围绕着意识和较小的IT目标。

   阶段1 -意识:在意识阶段,意识到缺乏所有权和支持,意识到对政策和标准的需求,有机会推出定制的数据治理框架,解决组织中明显的痛点。

   阶段2和3 -被动和主动: 进入被动式和主动式阶段意味着可以建立一个更全面的数据治理框架,涵盖数据治理的所有方面以及包括数据所有权和数据管理以及数据治理的完整组织结构办公室/团队与已实现和将要实现的业务成果保持一致。

   阶段4和5 -管理和有效:通过达到管理和有效阶段,您的数据治理框架将成为开展业务的不可或缺的一部分。

   如果您当前的数据治理策略和过程是您的指南,那么成熟度模型就是您的历史记录。它是根据基于成熟度评估的历史数据汇编而成,该评估将公司的绩效与给定时期(例如一个季度,一年或一年甚至五年)内的既定目标和基准进行比较。该模型显示您去过的管理水平,这有助于您确定要达到的水平。

   尽管“一刀切”的解决方案在成熟度模型中并不能真正发挥作用,但“如果一刀切”的方法对许多公司来说效果很好。搜索现有模型,找到最接近的模型,然后对其进行调整以满足公司的需求。如果鞋子不合适,则很容易更改鞋子的尺寸。改变脚的尺寸并不是那么容易。

   七、数据治理最佳实践

   一方面,您可以从其他从事数据治理实施的人那里学到很多东西。但是,每个组织都不同,您需要从无意识的数据管理阶段一直到有效的成熟阶段,就必须不断调整数据治理实践。

   不过,请阅读以下15个适用于一般情况最佳实践集合:

   •从小开始。与业务的各个方面一样,不要试图一口吃个胖子。力争快速获胜,并随着时间的推移逐步建立信心。

   •设定清晰,可衡量且具体的目标。您无法控制无法测量的工作。庆祝达到目标,并以此来赢得下一个胜利。

   •定义所有权。没有业务所有权,数据治理框架将无法成功。

   •确定相关角色和职责。数据治理是一个团队合作,其中包含业务各个部门需要交付的成果。

   •培训利益相关者。尽可能使用业务术语并将数据治理学科的学术部分转换为业务情境中容易的内容。

   •关注运营模式。数据治理框架必须集成到您在企业中开展业务的方式中。

   •基础架构,体系结构和工具。您的数据治理框架必须是企业体系结构,IT环境和所需工具的合理组成部分。

   •制定标准化的数据定义。在需要集中的内容和敏捷性和本地化的最佳工作方式之间取得平衡是至关重要的

   •识别数据域。从具有提高数据治理成熟度的影响和工作量最佳比例的数据领域开始。

   •识别关键数据元素。关注最关键的数据元素。

   •定义控制度量。将它们部署在最有意义的业务流程,IT应用程序和/或报告中。

   •建立业务案例。确定与增长,成本节省,风险和合规性相关的数据治理成熟度不断提高的优势。

   •利用指标。专注于一组有限的数据质量KPI,这些数据质量可以与企业内的总体性能KPI相关。

   •经常交流。数据治理从业者一致认为,交流是该学科最关键的部分。

   •这是一种实践,而不是一个项目。

95f0ee21c89db4daa4fcea1dedddbc6e.png

进阶-深入理解数据治理的框架

    一、数据治理的重要性

   缺乏数据治理常常导致组织尽管在整个数据价值链上进行了大量投资,却无法从数据中获得任何实质性的收益。数据治理框架是指建立用于管理企业数据的模型的过程。

   定义明确的数据治理框架使组织能够定义有关数据管理的准则和规则。组织可以就如何管理其数据资产并确保有效利用跨价值链的受信任且受适当监管的数据做出明智的决策。采用标准数据治理框架还可以最大程度地降低数据管理成本,例如数据存储,数据处理,运营成本。

   在高度管制的业务环境中,组织(尤其是银行,金融服务,医疗保健等行业)管理与数据相关的风险和合规性问题面临挑战。因此,定义数据治理框架确实有助于风险管理,并确保组织满足对数据管理的法规,法律和不同国家要求的日益增长的需求。

   数据治理框架涵盖了组织数据管理流程的每个部分,直至单个技术,数据库和数据模型。本文介绍了可参考的整体数据治理框架及其主要组成部分。本文还详细概述了组织如何在各种数据治理领域中适应此框架,并在将来利用它来创建更大的数据驱动程序。

1d3c7b0c08634d833c4461a5e4aff0eb.jpg

   二、可参考的数据治理框架

   我们进一步迈出了一步,定义了企业数据治理框架,该框架考虑了当前和下一代数据格局以及即将到来的数据治理挑战。

f28b370a918d953514a0b11d0e1c135d.jpg

   数据治理框架包括以下几个部分:

 (一)数据治理策略

   组织通过定义希望实施数据治理实现的业务目标,以及计划如何使用相应的绩效指标来跟踪其数据治理过程中的进度和里程碑来开始其数据治理。

 (二)企业数据管理

   该部分涵盖了所有关键域,这些域对于任何典型的组织数据生态系统都是必不可少的。例如,数据体系结构管理,数据模型,数据集成,元数据管理,参考数据管理和商业智能/分析等都是企业数据管理的一部分。

 (三)数据生命周期管理

   这是一种基于策略的方法,用于管理信息系统整个生命周期中的数据流-从创建和初始存储到过时并被删除。它结合了数据流程,业务战略和技术,因此这三者的战略结合可能会对组织产生必要的影响。一旦制定了完善的数据生命周期管理策略,企业即可获得显着的收益,包括更好的责任感,更高的合规性,成本节省,有效的组织治理,更好的数据保护和更高的报告完整性。

 (四)数据管理和核心职能

   它涵盖了应该成功执行任何数据治理计划的优先域。组织还应该决定跨部门,业务条线和绩效的各种关键绩效指标(KPI),以衡量数据治理成效。治理操作涵盖了更精细的功能,例如业务词汇表设置,元数据管理,数据沿袭,数据质量,数据隐私和安全性以及数据访问和控制。

 (五)数据治理促成因素

   上面解释的数据治理框架的组件围绕治理的三个关键支柱-人员和文化,流程和运营模型以及工具和技术。在开始任何数据治理计划之前,组织需要围绕如何处理其数据资产评估其当前的成熟度和流程,找出处理数据方面的差距,并提出相关的解决方案设计和治理实施的路线图。

   除了上述部分之外,数据治理框架还可以帮助组织提供一些支持功能,例如变更管理,管理和用户工作指南,以便组织可以在整个企业中顺畅地适应框架。

   三、全球数据治理框架

   在各个行业中,数据治理一直是许多组织关注的重点领域。对于有的企业来说,由于不断引入新的数据法规和合规性,因此有必要调整数据治理措施。对于有的企业来说,则需要对其实施以更好地控制和管理其数据资产。当组织开始进行数据治理时,它们会使用模板和指南来寻找已定义的框架。有多个可用的数据治理框架,下面给出了一些领先的和使用最广泛的全局数据治理框架。

9beaf215d2b4230c54129fea0c1c6863.png

   这些框架是标准的,并在全球范围内使用。这些框架虽然很流行,但它们将其专业知识限制在数据治理作为促成因素,或者专注于在任何数据管理或其他以数据为中心的计划中要考虑的关键领域,而不是以解决数据治理及其解决方案为关注点。

   第二部分给出的可参考的数据治理框架是在仔细考虑所有其他行业主导的全球治理框架之后建立的。它涵盖了组织需要处理的数据治理的所有关键领域。它是全面的,可确保对组织中数据生态系统的每一层进行支持。

744f4316c55663e6be352ff9c81b8879.png

行动-打破数据治理的神话

   数据治理的目的是使组织对其数据资产拥有更大的控制权。数据治理是通过计划,监视和执行严格的政策,标准和程序来实现的。但是,对大量数据行使权限对于组织而言可能是一个复杂的过程,并且可能需要其他业务部门(例如人力资源,流程和技术)参与进来,从而有可能引起对数据治理的误解。

   一、关于数据治理的常见误解

   1、数据治理是一项以技术为中心的活动

   为了在组织中成功实施数据治理计划,业务部门和IT部门都应该团结起来并承担同等的责任。成功的数据治理只有在业务部门和IT部门共同配合下才能实现,以从流程和数据资产中获得收益并创造业务价值。执行,负责,咨询和/或知情的(RACI)图表是一种有效的组织机制,它定义了组织内数据治理的明确角色,以消除任何误解。

   2、数据治理是一次性活动

   人们之所以认为数据治理是一次性活动,是因为组织倾向于认为行使授权和控制权以及一次定义数据策略和流程将导致组织继续实现所需的业务目标。组织倾向于忽略组织风险随外部环境变化而需要持续监控,数据治理策略,标准,体系结构,过程和度量标准发生变化的事实。

   3、忽略关键结果

   通常,组织会错过数据治理的整体目的,并认为法规遵从,提高数据质量,采取适当的数据安全措施,获取数据沿袭或记录元数据是数据治理计划下的唯一活动。低估数据治理的总体范围不会使组织受益。

   4、数据治理需要最新技术

   人们通常认为,要使有效的数据治理模型能够运行,就需要最新的技术。工具和技术确实促进了数据治理。但是,为了更好地控制现有数据资产,治理工具也可以与现有技术集成。另外,如果通过使用与当前使用的技术相适应的新技术以具有成本效益的方式减轻了数据安全问题,则可以采用新技术。

   二、数据治理框架及其范围

   可以通过行业公认的数据治理框架来阐明数据治理的神话,该框架将数据治理核心原则应用于核心数据治理领域,以及它们与数据管理部分和数据生命周期的相互作用。

   下图所示数据治理框架涵盖了组织数据的各个层,包括企业数据体系结构,企业数据管理,信息生命周期管理以及完整的治理层,包括治理章程,治理核心领域,治理措施,治理运营,治理策略和愿景。帮助企业适应并遵守不断变化的数据监管格局。该框架有助于组织转变为以数据为导向的企业,并帮助建立数据战略,优化数据基础架构,流程和系统,并利用最新技术来创建数据治理文化。

b5067e41c7f995c9740cfd17f34f9149.jpg

   1、数据管理层

   为了在组织中成功实施数据治理,业务部门和IT部门都应该团结起来并承担同等的责任。

   2、数据治理促成因素

   在开始任何数据治理计划之前,组织需要围绕如何处理其数据资产评估其当前的成熟度和流程,找出处理数据方面的差距,并提出相关的解决方案设计和治理实施的路线图。

   3、数据治理章程、管理和核心层

   该章程提供了数据治理计划的整体蓝图,并明确定义了愿景,范围,职责和目标。数据治理框架的范围应包括但不限于以下核心领域:

   •数据治理运营模型

   •团队和运营结构

   •使命与愿景

   •数据访问与控制

   •元数据,业务词汇表和数据沿袭

   •环境管理

   •数据治理工具和技术

   •变更管理和用户采用

   •数据管理

   •创新,监控和控制。

   •治理策略与愿景

   数据治理的首要步骤包括定义组织如何通过利用数据进行“增长”和“控制”来发展。结合起来,这两个组成部分将带来运营效率和财务收益。

   明确定义和理解有关数据的各种政策,所有权和问责制以及程序和变更管理以及数据治理实践(例如数据管理)的运营模型可以提高生产率,品牌效益和组织绩效。

36c141e8a98d08497eee81308eda4795.jpg

   三、如何开始数据治理

   数据治理为组织带来了有形和无形的收益。因此,建议组织尽快开展数据治理。企业可以利用数据治理专业知识和外部专家团队,通过引入有关数据治理的文化变革,来实现数据治理目标。数据治理的常见流程如下:

   •定义和制定策略;

   •评估与计划;

   •设计与实施;

   •执行和监控。

相关实践学习
MySQL基础-学生管理系统数据库设计
本场景介绍如何使用DMS工具连接RDS,并使用DMS图形化工具创建数据库表。
相关文章
|
6月前
|
数据采集 NoSQL 数据管理
数据治理体系建设
随着信息化的不断发展,数据的数量和质量都呈现了爆发式的增长,数据已经成为核心资源。数据治理是银行实现数字化转型、提升核心竞争力的重要手段,也是银行信息化建设的重要组成部分。
|
6天前
|
监控 关系型数据库 MySQL
数据治理平台Datavines
【10月更文挑战第20天】随着数据量的增长和数字化转型的推进,数据治理成为关键议题。Datavines是一个开源的数据治理平台,提供数据目录、概览及质量检查等功能,帮助用户全面了解和管理数据,确保数据的准确性和有效性。通过简单的部署和配置,即可快速启动使用,支持数据源配置、质量监控及作业管理等核心功能。
64 10
|
5月前
|
数据采集 监控 大数据
大数据时代的数据质量与数据治理策略
在大数据时代,高质量数据对驱动企业决策和创新至关重要。然而,数据量的爆炸式增长带来了数据质量挑战,如准确性、完整性和时效性问题。本文探讨了数据质量的定义、重要性及评估方法,并提出数据治理策略,包括建立治理体系、数据质量管理流程和生命周期管理。通过使用Apache Nifi等工具进行数据质量监控和问题修复,结合元数据管理和数据集成工具,企业可以提升数据质量,释放数据价值。数据治理需要全员参与和持续优化,以应对数据质量挑战并推动企业发展。
1373 3
|
4月前
|
安全 项目管理 数据安全/隐私保护
|
12月前
|
SQL 存储 安全
浅谈数据治理
浅谈数据治理
125 0
|
数据采集 人工智能 数据管理
数据资产化的前提-浅谈数据治理体系的建设
数据资产化的前提-浅谈数据治理体系的建设
|
数据采集 存储 安全
数据治理:管理和保护数据的最佳实践
随着企业日益依赖数据来驱动业务决策和创新,数据治理成为一个至关重要的话题。数据治理是指规范、管理和保护数据资产的过程,以确保数据质量、合规性和安全性。在本文中,我们将探讨数据治理的重要性以及一些实施数据治理的最佳实践。
450 0
|
存储 数据采集 安全
【数据治理】什么是数据治理模型?
【数据治理】什么是数据治理模型?
|
存储 数据采集 数据管理
说说数据治理中常见的20个问题
数据治理是一项战略计划,用于优化企业处理数据的方式。它旨在组织和改进公司用于定义、收集、存储、保护、管理和货币化业务数据的政策和程序。
|
数据采集 SQL 机器学习/深度学习
Dataphin数据治理系列:基于数据质量管理,支撑业务快速发展
数据质量是数据建设和管理中非常重要的一环。所有的数据应用,不论是用于支持业务开展的数据库,还是用于支持商业决策,或者用于机器学习和人工智能等高级应用,实现数据价值的前提是数据本身是高质量的,是可靠和可信的。
Dataphin数据治理系列:基于数据质量管理,支撑业务快速发展