如何精准识别主数据?

本文涉及的产品
数据管理 DMS,安全协同 3个实例 3个月
推荐场景:
学生管理系统数据库
简介: 如何精准识别主数据?

主数据

DMBOK里的定义是这样婶儿的:

主数据是有关业务实体(如雇员、客户、产品、金融结构、资产和 位置等)的数据,这些实体为业务交易和分析提供了语境信息。实体是客观世界的对象(人、组织、地方或事物等)。实体被实体、实例以数据/记录的方式表示。

发现没有?主数据和实体有关系哟~~~所以主数据其实跟模型关系是很紧密的。其实理解主数据很简单,我之前就写过一篇文章专门解释这个东东:【戳这里查看:主数据又是啥东东?应该怎么建?】简单来说,就是核心业务中,非数值的关键数据。这个理解不精准,但是容易理解。不过这哥们的问题,显然不是这篇文章能解决的,因为他肯定是在进行主数据识别的时候遇到模棱两可的内容,无法进行区分了。


主数据识别

想要确认两个内容是否是主数据,就得从主数据的定义入手,从主数据特征入手。当然,也有一些偏门的手法可以辅助识别。石秀峰石老师在他的书《一本书讲透数据治理》里写了两个方法:1、主数据特征识别法2、业务影响和共享程度分析矩阵法主数据特征识别法顾名思义,就是对着主数据的特征比划一下就行了:

我们看看这些数据是否有以上特征,如果都有,那么是。如果缺一两个,可以考虑考虑。一般可列为6个问题:

1、是否体现业务核心价值?这一点非常非常重要!(客户信息肯定是,但是配送地址所在省份就不是核心价值数据了)

2、是否是独立的实体?(商品是独立不可拆分的实体,但是临期商品则不是)

3、是否相对稳定?(之所以加上相对,就是某些主数据是会变的,比如客户信息)

4、是否会在其他系统共享?(如果只是单个系统使用,即便是核心价值的,一般也不会列为主数据)

5、是否具有唯一性?(如果这个数据不强制唯一,全局可能重复,那么可以踢出去了)

6、是否长期有效?(如果是短期使用,一般不作为主数据。但是这个长期短期和业务有关,比如互联网的订单和造船厂的订单时效性就不一样,前者半个月后大概率就无了,后者一般都持续好几年)至于业务共享矩阵法,其实就是看这个数据的重要程度和共享程度:

按照重要程度和共享程度一分,优先级别自然就出来了。至于那些又不重要又不共享的,自然就排除在外了。


区分难题

虽然已经有方法了,但是有些时候遇到不熟悉的业务,还是会蒙圈。一般容易搞混淆的是参考数据和主数据。因为参考数据有很多特征和主数据非常类似,比如也是长期有效、跨系统共享、也很重要(价值不一定高)、非常稳定、全局唯一等。一些大家熟知的还行,但是一旦跟业务挂钩,如果你不懂业务,几乎就没办法与主数据拆分开。 DMBOK里提出了二者管理重点的区别:

对于参考数据和主数据,管理的重点是不同的:

1)参考数据管理(Reference Data Management,RDM)。需要对定义的域值及其定义进行控制。参考数据管理的目标是确保组织能够访问每个概念的一整套准确且最新的值。

2)主数据管理(Master Data Management,MDM)。需要对主数据的值和标识符进行控制,以便能够跨系统地、一致地使用核心业务实体中最准确、最及时的数据。主数据管理的目标包括确保当前值的准确性和可用性,同时降低由那些不明确的标识符所引发的相关风险(那些 被识别为具有多个实例的实体和那些涉及多个实体的实例)。

至于如何区分二者,除了分清楚数据价值之外,还有一个比较取巧的方式:看表字段多寡和数据量。一般来说,参考数据的数据集通常会比交易数据集或主数据集小,复杂程度低,拥有的列和行也更少。所以如果你看到一个3列的数据表,无法区分这是主数据还是参考数据,那么盲猜一波参考数据准没错~~~当然,更重要的区分,还是看其价值,就是参与到核心业务的程度和价值。以及该数据是否完成“识别和管理来自不同系统和流程的数据之间的关联关系”。参考数据会在核心流程里体现,比如配送地址所在省份,但是程度比较低,价值也不是特别大,丢失了甚至都没太大关系(可以通过其他数据推出来)。而且,该数据也无需识别和管理不停系统和流程的数据之间的关联关系。所以,列为参考数据是没问题的。


小结

主数据很容易与参考数据混淆。区分方式有很多种,常规方法有两个:

1、主数据特征识别法

2、业务影响和共享程度分析矩阵法非常规方法有很多:
1、管理重心区分法

2、字段、数据量判断法

3、不同系统数据关联法

4、经验判断法

相关实践学习
MySQL基础-学生管理系统数据库设计
本场景介绍如何使用DMS工具连接RDS,并使用DMS图形化工具创建数据库表。
相关文章
|
7月前
|
数据挖掘 大数据 定位技术
精准定位目标客户群市场调研
精准定位目标客户群市场调研
237 2
|
存储 数据采集 算法
数据分类分级-敏感数据识别工程实践
在《数据分类分级-结构化数据识别与分类的算法实践》这篇文章中讲到了结构化数据识别与分类的算法实践,那么这些算法能力如何以标准产品的方式落地,并帮助客户解决在数据分类分级过程中遇到的各种问题呢?本文将站在工程的视角,结合我们的思考和经验,从整体的大框架上介绍用九智汇数据分类分级产品敏感数据识别技术方案和能力,希望对大家有所帮助,想了解细节的,欢迎通过公众号联系进行线下沟通。
427 1
|
4月前
|
编解码 搜索推荐 数据挖掘
巧用商品详情数据,制定精准营销策略
在当前激烈的市场竞争中,利用京东APP商品详情数据通过API接口为企业提供宝贵支持,助力打造精准营销策略。首先,深入分析商品特点明确产品定位,并突出差异化优势以吸引目标消费群体。其次,细致分析价格信息制定合理定价及促销策略。再者,借助用户数据细分市场并提供个性化推荐增强顾客忠诚度。此外,选择合适营销渠道并不断优化提升效果。最后,通过高质量内容创作和品牌建设强化品牌形象,全面提升市场竞争力。综上所述,充分利用商品详情数据能够帮助企业制定更为精准有效的营销策略,促进可持续发展。
|
5月前
|
机器学习/深度学习 供应链 监控
ERP系统中的供应链风险识别与应对策略解析
【7月更文挑战第25天】 ERP系统中的供应链风险识别与应对策略解析
508 1
|
7月前
|
机器学习/深度学习 算法 计算机视觉
ython打造智能车牌识别系统,实现快速准确的车辆识别与追踪技术
ython打造智能车牌识别系统,实现快速准确的车辆识别与追踪技术
|
7月前
|
监控 安全 5G
UWB人员精准定位系统源码,实现实时定位、人机料配对、物料标签配置、智慧调度、轨迹追踪
人员定位管理系统通过在厂区、车间部署UWB定位基站,实时采集人员、机具、物料上定位标签回传的位置信息数据,采用多维定位模式,精确定位人、机具、物料的实时位置,实现实时定位、人机料配对、物料标签配置、智慧调度、轨迹追踪、工时统计、区域物料统计、电子围栏等应用功能。
133 1
|
机器学习/深度学习 监控 数据格式
智能零售分析:使用YOLOv5进行客流量分析、商品识别和货架分析
智能零售分析:使用YOLOv5进行客流量分析、商品识别和货架分析
309 0
|
SQL 算法 安全
基于关系的违规团伙发掘风控方案
目前很多平台方都有团伙作案的情况发生,比如团伙性薅羊毛,比如团伙性的制造一些虚假信息,团伙性发送违法广告。之所以是团伙性作案,因为作案人员之间有某种关系连接。当业务方获取了人员关系之后,能否成功挖掘出违规团伙,关系到平台的安全。
3389 0
|
大数据 BI
商业智能项目中的若干风险要素
     BI商业智能项目应在 “业务驱动,总体规划,统一设计,分期实施” 的总体设计原则下分期实施,采取Agile BI方法论迭代开展,先确保核心功能满足客户需求,在总体规划下不断完善整个系统,以提高可交付性并降低风险。
1121 1

热门文章

最新文章