数据质量最佳实践(3):通过质量治理工作台,实现质量问题的跟踪和处理

本文涉及的产品
智能数据建设与治理Dataphin,200数据处理单元
简介: 在Dataphin数据治理系列:基于数据质量管理,支撑业务快速发展这篇文章中,我们详细的介绍了Dataphin数据质量模块的产品核心能力和产品使用演示。在实际的质量管理中,做完了事前的质量规则的配置和事中的质量规则校验后,会产生大量的质量问题待治理项,这时候需要有一个完整的工作流程去管理质量问题,实现从质量规则配置,到质量问题发现,到质量治理修复问题,最终提升数据质量的完整PDCA流程。

Dataphin数据治理系列:基于数据质量管理,支撑业务快速发展这篇文章中,我们详细的介绍了Dataphin数据质量模块的产品核心能力和产品使用演示。

在实际的质量管理中,做完了事前的质量规则的配置和事中的质量规则校验后,会产生大量的质量问题待治理项,这时候需要有一个完整的工作流程去管理质量问题,实现从质量规则配置,到质量问题发现,到质量治理修复问题,最终提升数据质量的完整PDCA流程。


一、场景介绍

场景1某电商公司通过手机号进行会员广告投放,历史处理的手机号都是11位,突然有一天发现了一个新的待治理项,通过查看校验详情,发现是有一个新的采集渠道采集上来的手机号是带了国际电话区号(+86)的未处理数据,处理异常数据后,点击重新校验,校验通过即可完成该治理项。


场景2:某财务部门,发现月度财务账单核对后存在差异。通过质量校验发现,有上下游相关的5张表都出现了数据口径不一致的问题,这是可以将5张表放入一个 财务数据治理流程 中,通过流程统一跟踪和治理出现的质量的问题,治理后由财务部门进行最终的数据验收。


二、产品能力介绍

1、治理工作台

质量校验时发现的质量问题,会出现在治理工作台中,等待负责人处理。

通过治理工作台,可以通过以下治理操作:发起治理、忽略本次异常、添加白名单、重新校验、通知负责人进行具体的问题治理;或者查看问题的历史操作记录,了解历史问题和治理方案。

image.png


1.1、查看校验详情

点击校验详情,可以查看本次质量异常的校验详情信息,包括检验对象、校验时间、关键指标,用于初步判断问题原因,更详细的问题定位需要结合异常数据和数据任务等共同判断。

image (1).png


1.2、发起治理

针对需要按照完整的治理流程(先治理后验收)处理的问题,和多个同一个领域可以一起治理的问题,可以发起治理流程,在治理流程中对这些问题进行统一的处理。

image (2).png


1.3、忽略异常

针对偶尔出现的异常问题(如网络波动),如果已经修复,则可以直接忽略本次异常。image (3).png


1.4、加入白名单

对于不是核心需要治理的对象,比如临时表,可以加入白名单,有效期内出现的后续质量问题不会再出现工作台中。

image (4).png


1.5、重新校验

针对偶尔出现的异常,但是目前已经恢复的数据;或者已经在上游治理过的数据,可以执行一次重新校验,对最新的数据进行一次校验,看是否符合质量规则校验条件。

image (5).png


1.6、通知责任人

对于需要负责人重点关注的问题,或者长期未处理的问题,可以直接通知该问题的负责人加急处理。

image (6).png


1.7、查看操作记录

操作记录中保留了治理问题从出现开始的所有操作记录,包括问题的出现、忽略、治理的操作和原因等,可以通过操作记录详细了解一个治理项的历史情况。

image (7).png


2、治理流程

在治理工作台中发起治理后,可以在治理流程列表中看到和自己相关的治理流程,可以在治理流程中对质量问题进行进一步处理

image (8).png

在治理流程中,可以对质量问题进行忽略、重新校验等治理操作,或者到研发模块,修改数据产出流程。完成治理后,治理人可以发起验收,提交整个治理流程到验收人处理。image (9).png

验收人可以查看治理流程中每个问题的状态,可以根据问题的治理状态和发起治理时的说明,决定是否通过验收。

image (10).png

验收人验收通过之后,当前治理流程变为验收通过状态,本次治理流程正式结束。

image (11).png

治理流程的关键环节(发起治理、提交验收、验收通过等)会发送消息给相关人,协助相关人快速处理相关流程。

image (12).png


3、治理白名单

对于暂时不需要治理的治理项, 可以放入白名单进行统一管理,在白名单有效期内,质量校验仍会正常执行,但不会生成治理项。

在治理白名单页面,可以针对白名单进行统一管理,如修改白名单生效时间和删除白名单等。

image (13).png



三、结语

以上就是关于质量治理工作台的全部介绍。通过治理工作台,可以实现对质量问题处理流程的跟踪,从而更好管理质量问题出现后的整个治理流程。

到Dataphin的3.10版本,质量模块实现了从事前的质量规则配置(在质量模块配置、结合数据标准配置、在集成任务配置),到事中的数据质量稽核校验(定时校验、任务触发校验),到事后的质量整改的流程跟踪和效果检验的整条质量提升链路,帮助客户更快更好的构建高质量数据。


更多历史内容详见:

Dataphin数据治理系列:基于数据质量管理,支撑业务快速发展

数据质量最佳实践(1):批量配置质量规则,快速提升质量覆盖率

数据质量最佳实践(2):通过归档和分析异常数据,快速定位质量问题

相关文章
|
存储 数据采集 数据挖掘
质量追溯系统方案
质量追溯系统方案
198 1
|
测试技术 Docker 容器
自动化质量评估维度
上篇文章讲了下关于终端自动化的一个探索《终端自动化测试探索之路》,今天来聊聊关于自动化质量评估的维度,包括UI和接口。
751 0
|
3月前
|
数据采集 存储 数据处理
数据平台问题之知识管理系统的效果如何评估
数据平台问题之知识管理系统的效果如何评估
|
2月前
|
人工智能 测试技术 云计算
探索软件测试的多维度策略
在数字化时代的浪潮中,软件质量成为企业竞争力的关键。本文将通过浅显易懂的语言和生动的比喻,带领读者了解软件测试的核心概念、方法及其在软件开发周期中的重要性。我们将一起走进软件测试的世界,看看它是如何保护我们的数字生活不受“虫子”侵扰的。
|
3月前
|
存储 数据采集 前端开发
ClkLog 实践中的挑战:如何设计和实施有效的埋点指标
前端数据埋点要怎么做才能获取到有用的数据并对运营产生积极的作用,对于首次实施埋点及数据分析的工程师来说确实是个难点。网上很多文章讲的都是方法论和理论知识,真正实践的内容比较少,我们从一个案例来描述一下埋点要如何做。
ClkLog 实践中的挑战:如何设计和实施有效的埋点指标
|
4月前
|
传感器 数据采集 存储
在环境治理领域,污染治理系统工程旨在通过系统的方法来解决环境污染问题。这通常包括污染源的识别、污染物的监测、治理技术的选择、治理效果的评估等多个环节。
在环境治理领域,污染治理系统工程旨在通过系统的方法来解决环境污染问题。这通常包括污染源的识别、污染物的监测、治理技术的选择、治理效果的评估等多个环节。
|
6月前
|
监控 数据管理
治理工作台升级,可手动录入质量问题,实现反馈有渠道、整改可跟踪
Dataphin V4.0版本升级治理工作台,支持手动录入数据质量问题,新增对“标签”对象的问题管理,并且可对问题进行分类。问题清单和整改流程也进行了优化,手动录入的问题和自动识别的问题可统一整改追踪,并提供操作记录,以增强数据质量管理的响应速度和效率。
366 2
|
6月前
|
数据采集 存储 消息中间件
数据质量监控系统设计
数据质量监控系统设计
|
6月前
|
人工智能 监控 安全
《机器人流程自动化能力评估体系 第1部分:系统和工具》行标发布
《机器人流程自动化能力评估体系 第1部分:系统和工具》(YD/T 4391.1-2023)是国内首部正式发布的RPA行业标准,标准的发布实施填补了我国RPA行业产品标准的空白,在相关行业发展中具有里程碑意义。
140 0
|
数据采集 监控 数据管理
数据质量最佳实践(5):利用质量分和排行榜提升企业数据质量【Dataphin V3.12】
在数据质量最佳实践(3):通过质量治理工作台,实现质量问题的跟踪和处理这篇文章中,我们详细的介绍了如何通过治理工作台,对系统出现的一个一个具体质量问题进行治理。 但是对于企业整体的数据质量情况,我们该如何评估呢?以及如何寻找当前企业的数据质量短板,并有针对性的进行改进和提升呢? 在Dataphin V3.12版本中,质量新增了质量分的能力,可以给数据表和质量规则配置打分权重和打分方式,从而获得全局、数据源、项目、负责人、数据表等维度的质量打分评估,帮助CDO判断企业整体的数据质量情况和数据质量问题的分布,从而有针对性的提升企业整体的数据质量水平。
745 1