Dataphin功能Tips系列(10)-质量分计算口径

本文涉及的产品
智能数据建设与治理Dataphin,200数据处理单元
简介: 质量分大盘中的质量分计算口径是什么?
  • 问题

质量分大盘中的质量分计算口径是什么?

  • 质量分计算口径

Dataphin对于质量分的计算:质量分由“质量监控对象(表、数据源等)权重、质量规则权重、质量规则得分”综合统计得出,先计算出数据表的质量分,再根据数据表的质量分加权统计得到项目、数据源和个人的质量分

  1. 数据表质量分计算口径

数据表质量分由规则的质量分加权平均得到,满分100分

数据表质量分 =( A规则权重*A规则分数+B规则权重*B规则分数)/(A规则权重+B规则权重)

比如规则A的权重是1, A是50分,B的权重是10,B也是50分,表质量分=(1*50+10*50)/(50+1)

  1. 项目、数据源、个人质量分计算口径

规则大类

计算口径

项目

项目质量分基于归属每个项目的所有Dataphin表质量分进行加权统计

计算口径为: 项目质量分 = sum(表权重 * 表质量分)/ sum(表权重)

数据源

数据源质量分基于归属每个数据源的所有全域表表质量分进行加权统计

计算口径为: 数据源质量分 = sum(表权重 * 表质量分)/ sum(表权重)

个人

个人质量分基于其作为质量负责人的所有表质量分(Dataphin表+全域表)进行加权统计

计算口径为: 个人质量分 = sum(表权重 * 表质量分) / sum(表权重)

相关文章
|
27天前
|
运维 数据处理 调度
Dataphin功能Tips系列(30)-限流配置
某大型电商平台在每天的凌晨时段需要进行大量的数据处理任务,比如订单处理、库存同步、用户行为分析等。此外,平台还需要定期进行历史数据的补数据工作,以确保数据完整性和一致性。在进行补数据时,如果需要补的历史时间周期比较长,这些批处理任务会消耗大量的计算资源,导致批处理任务(如订单处理、库存同步)响应变慢甚至超时失败,这是我们应该怎么保障每天的批处理任务(订单处理、库存同步)的按时产出?
|
27天前
Dataphin功能Tips系列(27)-排他编辑锁
在实际开发中,为了避免多人同时编辑同一份代码而导致的问题,通常会采用锁机制来保护代码。然而,普通的锁机制有时并不能完全阻止其他开发人员在编辑时抢占锁,这使得用户可互相覆盖锁定状态,在dataphin中如何解决这一问题?
Dataphin功能Tips系列(27)-排他编辑锁
|
2月前
|
消息中间件 Kafka 搜索推荐
|
2月前
|
调度 存储 数据库
|
2月前
|
API 开发工具
|
27天前
|
数据处理 调度
Dataphin功能Tips系列(31)-自定义资源组
某零售企业最近在做促销活动,希望保证某些数据处理任务(订单处理、库存更新)任务能够快速按时完成,如何保证这些高优任务的调度资源不被其他任务占用,能按时执行?
|
27天前
Dataphin功能Tips系列(29)-计算任务版本对比/版本回滚
开发人员小张先前编写的一个脚本,在进行了修订之后,发现逻辑出现了偏差,但他已经不记得前一版本的具体内容了。在这种情况下,应该怎样通过版本对比来看出两版脚本之间的差别,并且回滚到之前的版本呢?
|
27天前
|
调度 Python
Dataphin功能Tips系列(28)-跨节点参数
某经销零售企业,需要每天定时查询供应商的某个服务,以确认产品目录是否有变更,如果有变更,则全量拉取最新目录数据(数据量比较大,拉取一次成本很高),如果无变更则继续沿用上一次拉取的数据,在dataphin如何实现?
|
27天前
|
数据处理 调度
Dataphin功能Tips系列(26)-事实逻辑表配置数据延迟
零售行业中,订单数据是每天晚上由pos系统同步至数据中台,但门店人员经常会没有及时将订单信息录入pos,也许隔天或是隔几天才录入,这会导致指标的不准确性,数据中台的开发人员往往需要进行批量补历史分区的数据,这时怎么才能减轻开发人员的工作,让系统能够自动补前几天分区中的事实逻辑表中的数据呢?