前言
罗伯特·泽米基斯(Robert Zemeckis)在1994年的电影《阿甘正传》中有一句话“生活就像一盒巧克力。你永远都不知道会得到什么。”,但是这不应该应用于您的数据策略。在迈向数据战略的第一步时,您首先需要了解数据中的内容,这至关重要。为此,您需要加强数据驱动的数据治理策略。
在儿童故事《大象如何得到他的鼻子》的序言中有这样一首短诗:
我有六个诚实的仆人
(我所知道的都是他们教的);
他们的名字是什么,为什么,什么时候
以及如何,在哪里和谁。
这些问题,“是什么?为什么?什么时候?如何?在哪里?和谁?是寻求解决方案和收集数据的基础。我将使用它们来构建这篇关于数据治理基础的介绍。
一、数据治理的“是什么”“为什么”“谁”
当与某人讨论某个主题时,总是有必要确认所有各方都对他们所谈论的内容保持一致,因此让我们从确定什么是数据治理开始。为了配合前面的诗,让我们回忆一下起源于印度的盲人和大象的寓言。
对这个故事有很多解释,但在这里适用的一个解释是,背景很重要,某件事的真相往往是观察和印象的混合。
1、”什么是”数据治理与”什么不是”数据治理
为此,我提供了来自数据治理中著名人物的定义,包括我们自己的产品团队。这四个来源是我的大部分内容的来源:
DAMA的DMBoK: 对数据资产的管理进行授权和控制(计划,监视,执行)。
史蒂夫·萨斯菲尔德: 商业用户和技术人员组成跨职能团队进行数据管理协作的方式。
鲍勃·塞纳: 在信息资产的定义,生产和使用上形式化并指导现有行为。
我的理解: 流程,角色,策略,标准和度量的集合,可确保有效和高效地使用信息以使组织能够实现其目标。
在定义中,我将重要的观点加粗了:
- 数据治理不只是IT的事,而是业务与技术人员之间的一种协作关系。著名的数据治理顾问Ladley建议, CIO不要全部“拥有”对数据治理的权利。
- 数据治理有点用词不当,因为真正治理的是数据管理。
- 数据治理是跨职能的,它不是孤立地进行,而是遍及整个组织。一旦数据治理开始,就没有任何一个团体拥有它。
- 数据治理需要将数据视为资产,而不是从某种模糊的比喻意义上讲,而是视为必须进行正式管理的真实,有形资产。
- 数据治理的核心不是技术,而是关于如何创建、管理和使用数据的指导行为。它的重点是改善这三个事件背后的过程。。
- 数据治理旨在为数据驱动赋能,而不仅仅是命令和控制。它的目的是使数据管理实践与组织目标保持一致,而不是充当数据警察。
在确定什么是数据治理之后,我想谈一谈什么不是数据治理:
- 数据治理不仅仅是一个项目,而是一个计划。你可能会问,有什么区别?根据项目管理协会的说法,“一个项目的持续时间是有限的,并且关注于可交付的成果,而一个计划是正在进行的,并且关注于交付有益的成果。“项目有投资回报率;计划是推动者——它们是组织成功所必需的。数据治理的建立,确实是一个项目,但是它的正常业务状态就像一个持续按照计划进行的程序。
- 数据治理不能仅仅通过技术来实现。它是通过改变组织行为来实现的。技术在实现这一目标中扮演着重要的角色,但是要想在数据治理方面取得成功,您需要建立并制度化该工具所支持的活动和行为。一个为技术公司工作的人轻视技术可能看起来很奇怪,但是请记住,作为客户成功架构师,我的角色就是帮助确保这一点,并且任何工具的成功利用的关键是它所支持的管理活动或行为的成功。
- 数据治理不是一个独立的部门的事。作为一个程序,它可能有一个卓越中心,但这并不是一个明显的功能领域。相反,你是在整个组织中把功能落实到位。
- 数据治理与数据管理不同。管理层关注执行,而治理则是监督-审计和小型“ c”控制功能。数据治理通过建立,维护和实施数据管理标准来确保正确完成管理。回想我之前提到的数据治理有点用词不当,实际上数据治理对数据管理而言就像会计对于财务一样。有被统治者和统治者。
2、 “为什么”要进行数据治理
管理数据的好处很多,但很简单,那些管理数据的组织可以从中获得更多价值。
以下是DG的一些宏观方面的好处:
- 数据治理导致可信数据。正如最高法院大法官路易斯·布兰代斯(Louis Brandeis)所说,“据说阳光是最好的消毒剂。” 通过关注数据,数据治理可以实现质量更高的数据。当数据质量提高时,对数据的信任也会增加。
- 数据治理通过启用和改进围绕数据的创建,管理和使用的流程,在每个管理级别上都可带来好处。战略优势包括使业务需求与技术和数据保持一致,更好的客户成果以及对组织竞争性生态系统的更好理解。战术上的好处包括消除数据孤岛,即更大程度的数据共享和重用,以及及时访问关键数据。运营收益包括效率提高以及数据涉众之间更好的协调,合作和沟通。
- 在决定是否要做某事时,组织通常会根据“某件事”对“三要素”的影响程度来决定其价值:收入,成本和风险。治理数据可以通过多种方式增加收入,降低成本并降低风险,但是它的实现方式对于组织而言是高度特定的。这些细节是在制定DG的业务案例时需要确定的。
3、“谁”需要数据治理
有个老笑话问:“更换灯泡需要多少医生?答案是:“只有一个,但灯泡必须要更换。” 当然,变革尤其是组织变革是困难的,但借助数据治理,值得一试。
我在上面提到过那些管理他们数据的组织从中得到的更多受益,所以对于“谁?”答案是“每个组织”。“只有在数据及其驱动的决策有显著的改进空间时,才需要数据治理。”正如你可以想象的那样,他认为这种描述适用于大多数组织。
组织认识到数据是一种战略使能者,可以治理数据,以确保数据管理职责与业务驱动相一致。此外,银行和金融服务等受到严格监管的组织也会被迫实施数据治理,以确保它们以正确的方式做正确的事情。如果您是数据驱动的企业,那么您应该管理和治理数据。
二、数据治理的“何时”“何处”“如何开展”
1、“何时”开展数据治理
2001年,Gartner的分析师道格·莱尼(Doug Laney)定义了如今无处不在的数据“ 3-V”特征:数量,速度和多样性。Laney最初的背景是电子商务,但是当今大多数关于3-V的讨论都在大数据环境中。Laney认为,每个V的增加都需要改变数据的管理方式。自从他撰写论文以来,就添加了其他“ V”,例如价值和准确性。由于它涉及数据质量,因此我将其包括在内。
当组织的数据量和种类达到某个阈值,而现有的管理和处置方法不再起作用时,就需要一种更加规范的数据处理方法。在这种情况下,就要进行数据治理。
随着组织的发展和扩展,收购公司或提供其他产品和服务,数量和品种不断增长。这样,公司的成功可能会强制执行数据治理实践。基于准确性或真实性,数据质量也可以成为数据治理的驱动力。随着生成和合并更多数据,存在更多的数据质量问题机会领域。如果您的组织中有很多人致力于修复数据,则可以肯定地表明了数据治理的必要性。现在可能是时候开始管理您的数据了。
2、“何处”开展数据治理
关于谁应该拥有数据治理以及它应该驻留在何处,存在许多观点。包括:
- 首席数据官办公室:毕竟,数据战略是他们的职责。
- 业务:拥有业务自己的数据治理需要他们在其中发挥积极作用,并使其在战略上更加统一。但是哪个“业务”?合规?财务?采购?
- IT:数据治理通常起源于他们,他们很可能会管理其支持技术,更不用说已经运行的系统和数据存储。也许他们应该这样做?
- 没关系:建立谁“做什么”比“哪里”更重要,因为无论谁管理数据,数据治理都要成功。
但是,最好的答案是,一旦数据治理处于稳定状态,则数据治理“组织”应该是整个组织中无处不在的业务和IT人员联合会,而没有一个所有者。考虑一下织物的隐喻:要制造织物,您需要两条线-经纱和纬纱。
以类似的方式,最好的数据治理类型是组织图表中所编织的一种。您将不会在此处看到数据治理部门,也不会看到诸如“数据管理员”之类的人力资源职位。 将数据功能放在现有组织层次结构中,作为人们“常规”工作的叠加,数据治理才是最成功的。正如DMBoK所说,数据治理应嵌入现有的组织实践中。
3、“如何”开展数据治理
数据治理存在于人员,流程和技术的交汇处。正如我之前所说,数据治理不是仅通过技术来实现的,但技术对数据治理的成功至关重要。
(1)人
数据治理中有两个主要角色,即数据管理者和数据所有者。数据管理者应对数据负责,尤其是对与数据是否符合其预期目的相关的控制和使用负责。同样,数据管理员不在组织结构图中。相反,它是人们在日常工作中执行的功能,并根据一个人与数据的现有关系来分配管理员。此外,可能存在不同级别的管理者,例如域数据管理者。
数据所有者是主题专家,并会批准数据管理员的工作。通过数据的主题领域,如客户,产品,贷款,位置等,这些是交易被执行的业务条线。有时用于数据所有者的另一个术语是数据保管人。
最后,有一个数据治理委员会,这听起来可能不太吉利,但其实并非如此。该委员会由数据管理者,所有者和IT人员组成,他们定期开会讨论和解决升级的数据问题。将其视为数据治理的“最高法院”。
它的层次结构不是聚合,而是包含在较低级别无法达成共识的情况下用于审批的升级路径。DMBoK估计80-85%的数据治理问题可以在这些较低的级别上解决,委员会只需要仲裁大约5%的问题。
有很多方法可以将框架角色分层;我刚刚展示了一个特别灵活的例子。叶子级别通常是业务线(LoB)。
联合是数据治理组织框架的关键组件。根据Ladley的说法,联邦描述了数据治理渗透到给定主题领域的程度。它是跨组织混合和分层各种治理角色和功能的方法。这一点之所以重要,是因为某些主题的某些方面,例如创建一个新的产品实体,可能会比其他方面更集中地加以控制。一个组织相对缺乏数据管理的成熟度采取更大的中央控制可能是合理的。
(2)流程
当我说“流程”时,我是在用宽松的术语来形容人们需要整理和记录的东西。这些“事物”实际上是原则,政策和标准。
- 原则是指导行为的描述,是其他三个原则以及它们所要指导的行为的基础。原则的一个示例是“数据是需要正式管理的资产”。
- 政策是一种过程。如果原则回答“为什么”,那么政策解决“如何”。DMBoK将政策定义为“通过描述……行动指南来编纂要求”。政策可实施原则,并且是可强制执行的(即要求遵循原则)。
- 标准是一种策略,它建立要评估的规范或标准,例如业务词汇表术语定义标准。
确定角色和流程后,下一步就是将两者映射。为此,RACI矩阵是理想的方法。这些分别代表:执行人,负责人,咨询顾问和知情人。 谁负责(R = Responsible),即负责执行任务的角色,他/她具体负责操控项目、解决问题。谁批准(A = Accountable),即对任务负全责的角色,只有经他/她同意或签署之后,项目才能得以进行。咨询谁(C = Consulted),拥有完成项目所需的信息或能力的人员。通知谁 (I =Informed),即拥有特权、应及时被通知结果的人员,却不必向他/她咨询、征求意见。
(3)工具与技术
我曾多次提到,不能仅通过技术来实现数据治理。数据治理计划通常是由具有数据质量或元数据形式的重要技术组件的协同工作促成的。这两种技术不仅互补,而且对促进数据治理的目标也有帮助。请记住,控制的一个关键方面是监控。
三、重要提示
回想一下业务价值的主要决定因素:收入、成本和风险暴露。在提出治理的理由时,请记住这些。话虽如此,不过不要只是说“我们应该控制我们的数据,因为这样做会增加收入,降低成本,并降低风险”。要使治理成为理由,关键是将IT与业务目标联系起来。数据治理旨在成为一种启用功能,“使组织实现其目标”。
开始将治理与业务目标联系起来的一个好方法是进行差距分析。建议您记住这个问题:“该组织不能用它现在拥有的数据做什么?”在寻找差距时。通过推荐业务对齐练习、标杆企业分析呼应这一点,这是一个很好的下一步,它将业务流程与数据需求联系起来。如果您可以将数据问题与业务需求联系起来,将现金流与这些业务需求联系起来,那么您就可以在治理所增加的业务价值上加上一个重要的价值数字。
四、结论
只有组织致力于改变其数据管理行为,才能实现成功的治理。一旦做出了这一承诺,人员,业务流程和工具的精心安排就可以使新行为投入运营。本文通过回答数据管理的原理,原因,执行者,何时执行,什么部门执行以及如何执行,介绍了数据管理的基础。请大家参考,并批评指正!