序言
在大数据和数据科学时代,大多数组织都意识到数据在加速结果方面的潜在力量。然而,大多数人面临的挑战是,不断变化的客户期望和相关需求,以确保准确和可访问的数据,以指导决策,以满足客户的不同需求。
一个全面的数据治理过程可以帮助确保数据的一致质量、完整性和可用性。此外,了解客户的需求以及与组织的互动有助于缩小期望与组织交付的价值之间的差距。在本文中,分享了我们从工作中总结的有价值的见解,并强调了几个更关键的成功关键。
一、信息和数据管理
信息和数据管理(IDM)是一组相关学科,旨在全面管理数据资产,从概念到退役。虽然数据管理和数据完整性协议由下图中所示的众多主题和流程组成,但我们发现关注数据质量和数据治理通常是一个理想的起点。为提高质量而投入的努力对于确保基于准确、及时和相关的数据做出决策至关重要。通过适当的数据治理来维护高质量数据的相关工作通过将数据作为战略资产的重要性嵌入到组织结构和流程的结构中来扩大投资回报。
二、数据质量和可访问性
一个大型的数据管理和完整性项目的结果是:
•明确数据改进的共同优先事项
•更健康、更准确的数据库
•严格的基准流程,积极监测数据库健康状况,衡量进展,并为执行讨论和董事会报告提供信息
•外联数据的完整性提高50%
•强大的数据完整性协议,收集、清理、集成和分析数据
•分享数据作为组织资产的团队观点,以及数据管理的新方法
•增加对现有数据的信心,以支持明智的决策
确定哪些数据对组织真正重要对于任何数据质量计划都是至关重要的。组织必须尽早确定优先级字段,并将焦点缩小到那些被认为对关键业务结果最重要的领域。一旦确定并商定了优先领域,就可以围绕这一高优先数据的质量制定行动计划。随之而来的问题是:我们如何处理这些数据?组织不可能保存所有的数据,因此,分析师和数据管理人员必须依靠判断来决定保留哪些数据以及如何存储数据——在处理明确确定的优先级数据字段时,这些决策要简单得多。
可以应用以下标准和问题来确定保留哪些数据以及出于什么原因。通常情况下,如果需要遵从法规,或者如果下列任何问题得到肯定的回答,则应该保留数据。根据数据必须满足的长期目标以及与这些目标相比它的价值有多高,标准可能会有不同的权重。
1质量水平
•描述:是否有足够的信息(例如,来自最新的数据管理计划),关于数据是什么,如何以及为什么收集数据,以及如何处理数据以评估其质量和对确定的目标的有用性?
•质量:在完整性、样本量、准确性、有效性、可靠性、代表性或其他相关标准方面,数据质量是否足够?
2需求
•用户:是否有用户在等待这些数据,或者过去是否有需求的证据(例如,数据是否会为已建立的资源或系列增加价值)?
•推荐:资助者或学习/研究领域的专业协会或同等的身体推荐这种类型的共享数据或在这个研究主题?
•整合:数据描述的元素是否适合其他研究领域的标准化术语或词汇(例如,地理位置和时间段)?
•声誉:研究小组或项目产生的数据是否在原创性、重要性和之前研究成果的严谨性方面得到了高度评价?提供数据是否会显著提高一个团队或项目的声誉?
•吸引力:数据是否具有广泛的吸引力(例如,与具有里程碑意义的发现、重大的新研究过程或国际政策和社会关注有关)?
3复制
•不可复制:复制数据是否困难、昂贵或不可能(例如,在不可重复观察的情况下)?
4使用障碍
•清楚:数据是否根据其敏感性进行分类,并且不受隐私/伦理、合同、许可或版权条款和条件的限制,这些条款和条件会限制公众访问和重用?这项研究是否有正常的限制域?
•开放格式:数据的格式是否不需要许可证费用或专有软件或硬件的重用?
•独立性:如果使用数据需要任何专业的软件或硬件,它是否在研究领域中被广泛使用并易于获得?
5存储
•唯一:这是数据的唯一和最完整的副本吗?
•风险:数据是否保存在保证长期存储的位置?
三、数据治理
研究表明:客户参与策略以及潜在的客户体验改善计划的相关数据需求是大多数接受调查的高级主管的首要任务。在我们与客户的对话中,这些优先级逻辑上的结论:数据不再被视为单个部门的责任。相反,数据必须成为跨越多个群体的责任。如何管理数据导致了围绕数据治理的几个重要决策。
根据数据治理研究所(Data Governance Institute, DGI)的定义,数据治理是一个信息相关流程的决策权和责任系统,根据商定的模型执行,这些模型描述了所有数据相关事项的许多规定,包括什么、谁、何时、为什么和如何。数据健康或质量是治理的一个关键方面,该决策系统允许组织维护其数据健康水平,以确保关键战略和计划目标能够实现。
数据治理需要:
•组织机构
•规则
•决策权(我们如何“决定如何决定”)
•岗位职责
•监控、控制和其他执行方法
数据治理程序可以根据其重点(例如,法规遵循/安全、数据集成/迁移、主数据管理)而有很大的不同。然而,不管治理的“风格”如何,每个程序本质上都有相同的三部分任务:
•制定/收集/对齐规则
•解决问题
•监督/执行合规,同时为数据利益相关者提供持续支持
1数据治理机构
在组织的一个或多个组被授权制定有关数据管理的规则和关键决策。这组个人(或群体的层次结构)通常代表了利益相关者群体的要求。这些组一起以策略、标准、需求、指导方针和/或数据定义的形式定义了一组规则。
根据经验,在建立数据治理“权威”时,要考虑的最重要的方面是如何最好地让整个组织的关键人员定期围绕数据作为战略资产进行高价值的讨论。将数据的用户(如生产主管、营销和沟通团队成员)与IT和信息管理人员联系起来,可以在改善沟通流程、了解数据如何被利用、需要做什么来提高数据质量方面获得巨大的好处,以及每个团队如何在加强数据质量方面发挥作用
2数据的利益相关者
数据涉众是可能影响或受讨论中的数据影响的个人或群体。大多数程序可能有一个常见的对象列表——明显的涉众,如某些业务小组、IT团队和数据架构师/分析师。然而,对于给定的决策或情况,其他涉众可能不会如此明显。
数据治理团队的职责是知道应该在什么时候把哪个利益相关者带到谈判桌上。让不同的个人参与进来,连接不同的终端用户,有助于培养围绕数据进行的高价值讨论,将数据作为推动业务目标的战略资产。
数据治理将跨职能团队聚集在一起,以制定相互依赖的规则、解决问题或向数据涉众提供服务。这些跨职能团队可能来自整个组织,但通常来自运营的业务方面。它们包括创建数据的组、使用数据的组,以及为数据设置策略设置规则和需求的组,IT和数据组在建立架构、实现自己的最佳实践和处理需求时将遵循这些规则和需求。数据治理是实现这一工作的整个过程。
数据涉众的一种类型是“数据管家”。他们关心的是不属于管理人员本身的数据资产。它们代表了其他人的关注点,有些可能代表了整个组织的需求。另一些人的任务可能是代表较小的群体,如业务单位/目标、部门,甚至是一组特定的数据。在大多数情况下,管理人员是利益相关者团体的高级代表,他们聚集在一起对数据资产的处理做出决定
3数据治理过程
每个组织都将决定为治理数据的过程引入多少结构、严格性和正式性。数据治理研究所(DGI)建议:
1. 调整策略、需求和控制
2. 建立决策权
3.建立问责制
4. 执行管理
5. 管理变更
6. 定义数据
7. 解决问题
8. 确定数据质量要求
9. 建立治理技术
10. 利益相关者关怀
11. 沟通
12. 测量和报告价值
无论数据治理过程多么正式或严格,建立基准程序至关重要,以便积极衡量和报告加强数据质量的进展,并帮助围绕数据计划进行沟通。在我们与客户的合作中,我们制定并实施严格的协议,以保持持续的数据完整性,利用稳健的审计和基准过程,使客户能够积极监控其数据的健康状况,衡量进展,并加强数据作为关键组织资产的概念。
在改善数据质量方面的投资可以更容易地确定趋势,并增加对组织得出的推论和结论的信心,确保战略建立在可靠的数据基础上。
四、结论
加强数据质量并确保必要的治理流程到位,以随着时间的推移维护这些数据改进,这是理解客户/成员及其需求的关键第一步。更高的数据质量还允许组织跟踪进度,改进实时决策,并向董事会证明支出的合理性。
通过连接关键战略目标实现这些目标所需的数据,数据管理人员可以从理论转变对话的成员参与讨论与高度的未知精确的谈话围绕业务分析,需要改变什么,如何满足成员需求的运作效率。