数据质量最佳实践(3):通过质量治理工作台,实现质量问题的跟踪和处理

本文涉及的产品
智能数据建设与治理Dataphin,200数据处理单元
简介: 在Dataphin数据治理系列:基于数据质量管理,支撑业务快速发展这篇文章中,我们详细的介绍了Dataphin数据质量模块的产品核心能力和产品使用演示。在实际的质量管理中,做完了事前的质量规则的配置和事中的质量规则校验后,会产生大量的质量问题待治理项,这时候需要有一个完整的工作流程去管理质量问题,实现从质量规则配置,到质量问题发现,到质量治理修复问题,最终提升数据质量的完整PDCA流程。

Dataphin数据治理系列:基于数据质量管理,支撑业务快速发展这篇文章中,我们详细的介绍了Dataphin数据质量模块的产品核心能力和产品使用演示。

在实际的质量管理中,做完了事前的质量规则的配置和事中的质量规则校验后,会产生大量的质量问题待治理项,这时候需要有一个完整的工作流程去管理质量问题,实现从质量规则配置,到质量问题发现,到质量治理修复问题,最终提升数据质量的完整PDCA流程。


一、场景介绍

场景1某电商公司通过手机号进行会员广告投放,历史处理的手机号都是11位,突然有一天发现了一个新的待治理项,通过查看校验详情,发现是有一个新的采集渠道采集上来的手机号是带了国际电话区号(+86)的未处理数据,处理异常数据后,点击重新校验,校验通过即可完成该治理项。


场景2:某财务部门,发现月度财务账单核对后存在差异。通过质量校验发现,有上下游相关的5张表都出现了数据口径不一致的问题,这是可以将5张表放入一个 财务数据治理流程 中,通过流程统一跟踪和治理出现的质量的问题,治理后由财务部门进行最终的数据验收。


二、产品能力介绍

1、治理工作台

质量校验时发现的质量问题,会出现在治理工作台中,等待负责人处理。

通过治理工作台,可以通过以下治理操作:发起治理、忽略本次异常、添加白名单、重新校验、通知负责人进行具体的问题治理;或者查看问题的历史操作记录,了解历史问题和治理方案。

image.png


1.1、查看校验详情

点击校验详情,可以查看本次质量异常的校验详情信息,包括检验对象、校验时间、关键指标,用于初步判断问题原因,更详细的问题定位需要结合异常数据和数据任务等共同判断。

image (1).png


1.2、发起治理

针对需要按照完整的治理流程(先治理后验收)处理的问题,和多个同一个领域可以一起治理的问题,可以发起治理流程,在治理流程中对这些问题进行统一的处理。

image (2).png


1.3、忽略异常

针对偶尔出现的异常问题(如网络波动),如果已经修复,则可以直接忽略本次异常。image (3).png


1.4、加入白名单

对于不是核心需要治理的对象,比如临时表,可以加入白名单,有效期内出现的后续质量问题不会再出现工作台中。

image (4).png


1.5、重新校验

针对偶尔出现的异常,但是目前已经恢复的数据;或者已经在上游治理过的数据,可以执行一次重新校验,对最新的数据进行一次校验,看是否符合质量规则校验条件。

image (5).png


1.6、通知责任人

对于需要负责人重点关注的问题,或者长期未处理的问题,可以直接通知该问题的负责人加急处理。

image (6).png


1.7、查看操作记录

操作记录中保留了治理问题从出现开始的所有操作记录,包括问题的出现、忽略、治理的操作和原因等,可以通过操作记录详细了解一个治理项的历史情况。

image (7).png


2、治理流程

在治理工作台中发起治理后,可以在治理流程列表中看到和自己相关的治理流程,可以在治理流程中对质量问题进行进一步处理

image (8).png

在治理流程中,可以对质量问题进行忽略、重新校验等治理操作,或者到研发模块,修改数据产出流程。完成治理后,治理人可以发起验收,提交整个治理流程到验收人处理。image (9).png

验收人可以查看治理流程中每个问题的状态,可以根据问题的治理状态和发起治理时的说明,决定是否通过验收。

image (10).png

验收人验收通过之后,当前治理流程变为验收通过状态,本次治理流程正式结束。

image (11).png

治理流程的关键环节(发起治理、提交验收、验收通过等)会发送消息给相关人,协助相关人快速处理相关流程。

image (12).png


3、治理白名单

对于暂时不需要治理的治理项, 可以放入白名单进行统一管理,在白名单有效期内,质量校验仍会正常执行,但不会生成治理项。

在治理白名单页面,可以针对白名单进行统一管理,如修改白名单生效时间和删除白名单等。

image (13).png



三、结语

以上就是关于质量治理工作台的全部介绍。通过治理工作台,可以实现对质量问题处理流程的跟踪,从而更好管理质量问题出现后的整个治理流程。

到Dataphin的3.10版本,质量模块实现了从事前的质量规则配置(在质量模块配置、结合数据标准配置、在集成任务配置),到事中的数据质量稽核校验(定时校验、任务触发校验),到事后的质量整改的流程跟踪和效果检验的整条质量提升链路,帮助客户更快更好的构建高质量数据。


更多历史内容详见:

Dataphin数据治理系列:基于数据质量管理,支撑业务快速发展

数据质量最佳实践(1):批量配置质量规则,快速提升质量覆盖率

数据质量最佳实践(2):通过归档和分析异常数据,快速定位质量问题

相关文章
|
7月前
|
存储 数据采集 数据挖掘
质量追溯系统方案
质量追溯系统方案
107 1
|
1月前
|
监控 数据管理
治理工作台升级,可手动录入质量问题,实现反馈有渠道、整改可跟踪
Dataphin V4.0版本升级治理工作台,支持手动录入数据质量问题,新增对“标签”对象的问题管理,并且可对问题进行分类。问题清单和整改流程也进行了优化,手动录入的问题和自动识别的问题可统一整改追踪,并提供操作记录,以增强数据质量管理的响应速度和效率。
255 2
|
3月前
|
数据采集 存储 消息中间件
数据质量监控系统设计
数据质量监控系统设计
|
3月前
|
人工智能 监控 安全
《机器人流程自动化能力评估体系 第1部分:系统和工具》行标发布
《机器人流程自动化能力评估体系 第1部分:系统和工具》(YD/T 4391.1-2023)是国内首部正式发布的RPA行业标准,标准的发布实施填补了我国RPA行业产品标准的空白,在相关行业发展中具有里程碑意义。
58 0
|
7月前
|
数据采集 SQL 数据可视化
Dataphin数据探查助力快速了解数据概貌,更早识别潜在风险
在日常数据加工处理工作中,不同角色(运营、开发、数据分析师、业务人员等)尝尝会面临一个共同问题:数据是否可用?在数据量大、数据可信度不高的情况下,常常需要花费大量时间精力对数据进行校验,了解数据概貌并评估数据是否可用,也就是需要进行所谓的“数据探查”工作。因此,Dataphin 特别推出“数据探查”功能,只需要进行简单的配置,就可以周期性地执行探查任务并产出内容丰富、结果准确的可视化探查报告。此外,也可以保留历史的数据探查结果,便于结合历史数据进行对比分析,不仅降低了操作门槛,也能解放人力,提升工作效率。
236 0
|
7月前
|
数据采集 监控 数据管理
数据质量最佳实践(5):利用质量分和排行榜提升企业数据质量【Dataphin V3.12】
在数据质量最佳实践(3):通过质量治理工作台,实现质量问题的跟踪和处理这篇文章中,我们详细的介绍了如何通过治理工作台,对系统出现的一个一个具体质量问题进行治理。 但是对于企业整体的数据质量情况,我们该如何评估呢?以及如何寻找当前企业的数据质量短板,并有针对性的进行改进和提升呢? 在Dataphin V3.12版本中,质量新增了质量分的能力,可以给数据表和质量规则配置打分权重和打分方式,从而获得全局、数据源、项目、负责人、数据表等维度的质量打分评估,帮助CDO判断企业整体的数据质量情况和数据质量问题的分布,从而有针对性的提升企业整体的数据质量水平。
408 1
|
9月前
|
数据采集 监控 数据管理
数据质量最佳实践(4):支持范围和多级分区质量监控+按项目和个人管理数据质量【Dataphin V3.11】
在Dataphin数据治理系列:基于数据质量管理,支撑业务快速发展这篇文章中,我们详细的介绍了Dataphin数据质量模块的产品核心能力和产品使用演示。 在Dataphin V3.11版本中,质量新增了下面两个能力: 1、针对复杂的业务分区的校验能力 2、按照项目和个人管理数据质量
378 0
|
11月前
|
数据采集 数据管理 数据处理
数据质量最佳实践(3):通过质量治理工作台,实现质量问题的跟踪和处理
在Dataphin数据治理系列:基于数据质量管理,支撑业务快速发展这篇文章中,我们详细的介绍了Dataphin数据质量模块的产品核心能力和产品使用演示。 在实际的质量管理中,做完了事前的质量规则的配置和事中的质量规则校验后,会产生大量的质量问题待治理项,这时候需要有一个完整的工作流程去管理质量问题,实现从质量规则配置,到质量问题发现,到质量治理修复问题,最终提升数据质量的完整PDCA流程。
|
数据采集 移动开发 数据挖掘
01 埋点测试之质量保障
01 埋点测试之质量保障
|
数据采集 监控 数据管理
数据质量最佳实践(1):批量配置质量规则,快速提升质量覆盖率
在Dataphin3.9版本中,Dataphin支持了批量创建质量规则,支持选择单个规则批量应用到多张质量监控表中,提升质量整体的配置效率和监控覆盖效果。
数据质量最佳实践(1):批量配置质量规则,快速提升质量覆盖率