数据管理员是负责一组数据或数据域的专家,通常确保组织定义业务术语、创建和维护数据质量规则,并在所有系统,应用程序和报告中一致且准确地应用数据。
在某些组织中,数据管理员可能还负责数据访问管理或授予用户访问数据集的权限。尽管数据管理员的角色在不同的公司和行业中可能千差万别,但它们的核心职责基本一致。以下是一些最佳实践,帮助数据管理员更有效地发挥作用和管理数据。
一.了解数据职责
组织可以选择数据管理者来向业务部门报告,特别是如果他们在数据领域具有主题专业知识的话。无论组织层次结构如何,所有数据管理员都需要了解他们需要遵循哪些流程才能维护公司数据的完整性。如果这些过程或流程都不存在,则由数据管理员创建它们以确保正确维护数据。
创建适当的流程需要了解和识别:
■组织的数据存在和存储的位置
■有权访问数据的人及其使用目的
■哪些系统是数据的下游使用者
■哪些业务和风险受到数据影响
■组织数据的定义和数据质量标准
二.加强部门沟通
数据管理员不要孤立的工作。必须与业务部门(例如技术部门,运营部门、风险和合规部门等)合作,以正确理解和使用公司数据。
这就需要对数据元素的正确定义进行频繁和彻底的沟通。它还包括记录定义的所有衍生数据,并努力标准化整个组织中的数据定义。
如果数据管理员在还充当数据提供者的部门工作,则他们可能需要传达数据的质量。因此,至关重要的是,他们必须合作以确保在整个公司中正确使用数据元素。
三.厘清数据域
数据管理员必须每天勤奋工作,为其管辖的数据元素创建一组初始定义,在整个企业范围内对其进行标准化,并仔细记录所有可能不适用的例外情况。
此后,数据管理员需要对数据元素进行分类,并为适当的上下文用法适当地对其进行标记。例如,将“个人身份”分类映射到每个数据元素。它是敏感,受限制还是机密的数据?是否应该只在金融交易计算中使用此数据吗?
这些类型的元数据将帮助数据分析师了解如何在不同的业务场景中应用数据。在中央存储库中识别和记录的业务和运营元数据越多越好。此上下文使业务用户可以使用和信任数据。
四.明晰数据沿袭
识别数据的使用方式可能很棘手,尤其是在大型、复杂的组织中,这些组织具有复杂的系统和下游应用程序。一方面,在数据管理员不知情的情况下,可能会存储数据的多个副本。但是,最为重要的是,数据管理员应利用技术手段从头到尾识别数据沿袭。
了解数据的来源有助于确定数据质量区域的主要来源。在数据质量较差的数据点上识别问题可以降低风险。
此外,数据管理员应知道哪些业务领域需要数据,并且可能需要多个上下文的特定定义。
五.补救数据质量问题
数据管理员监督从采集到销毁的数据。从消耗或摄取点开始,数据管理员熟悉数据的原始质量,尤其是如果它来自第三方供应商。
如果数据集是在内部创建的,则数据管理员还可以帮助定义来自数据集生产者的数据质量规则。它们可以帮助记录数据用户所需的数据质量规则。通常,这些规则对于生产者和消费者而言都是不同的。
最终,数据管理员将与技术和运营团队一起工作,修复和消除数据质量问题,帮助业务部门树立对数据修复的期望。