数据治理必读系列(二)丨3步提升企业数据标准化程度

本文涉及的产品
数据可视化DataV,5个大屏 1个月
可视分析地图(DataV-Atlas),3 个项目,100M 存储空间
智能数据建设与治理Dataphin,200数据处理单元
简介: 数据治理必读系列(二)丨3步提升企业数据标准化程度


很多企业建设数字化转型过程中,为了让数据资产价值更充分地被挖掘和释放,数据治理因此被提上日程,瓴羊特推出数据治理系列,继
数据治理必读系列(一)|基于Dataphin,快速建设高质量数据支撑业务发展后,今天我们围绕企业数据标准化进行分享。

企业在设计、采购、生产、销售、物流、售后等业务环节,往往会存在大量的信息不规范、不统一、不及时的致数据资产无法在核心业务流程中高效流转和消费。

通过集成各系统,将数据融合打通形成数据流之外,非常重要的一环,是在企业内充分贯彻同一套数据标准,无论是后端设计研发,到前端业务运营消费,还是企业内跨部门、跨组织、跨角色协作,通过数据标准管理和实施,都能基于统一的术语和统计口径进行表单定义以及指标设计,以促进数据流通和消费。


常见的数据标准问题


根据中国信通院的定义:数据标准,是指保障数据的内外部使用与交换的一致性和准确性的规范性约束。更直接点来说,数据标准是用于描述公司层面需共同遵守的数据含义和业务规则,通常从业务、技术、管理三方面进行定义。


然而,数据标准需求缺乏统一管理、不同系统间标准制定依据各异、资产建设缺乏和标准的关联,使得数据标准的建设和应用都面临很大困难:
建设:多源异构数据整合缺乏统一的约束口径,数据开发效率低
数仓开发人员无法快速理解数据背后的实际业务含义,需要和业务人员反复沟通,理解成本高;不同业务人员对于同一个指标口径的理解不一致,容易出现认识偏差,影响分析决策结果。
管理:各系统分散管理,人工保障规范,数据质量难以提升
不同主题域由不同负责人进行开发和维护,导致规范不一致,数据可信度降低;由于缺乏有效的工具监督,规范定义和开发实现隔离,无法保证数据开发符合标准规范,数据质量难以提升,导致频繁的数据重构,管理成本高。
使用:缺少元数据信息及使用引导说明,数据消费难度大
数据的使用不仅需要明确数据详情,还需要参考元数据信息,以便数据使用方快速找到需要的数据并评估数据可用性。由于缺少必要的数据定义及使用说明,造成数据经常被误用滥用,数据消费难度大。

由此,我们需要一套功能全面、操作便捷的产品,来帮助企业中的数据标准管理人员/组织,提升企业数据标准化程度和数据资产可信度。        
Dataphin 数据标准模块在标准建设、标准管理、标准应用三大核心环节,提供了统一的产品化能力,并结合质量监控能力实现对资产对象的落标稽核,帮助企业解决数字建设管理过程中遇到的问题。02

Dataphin数据标准功能介绍

数据标准怎么建?数据标准模板,一次定义多次复用相较于传统模式下用 Excel 等线下文件管理数据标准的方式,Dataphin 支持在线创建标准集以便将规范相似、业务含义相关的数据标准进行统一管理,起到分类的作用,实现一次定义多次复用。如,某团队的基础数据标准需要具备以下属性:

  • 业务属性:标准名称、标准编码、描述
  • 技术属性:字段类型、字段长度、字段精度
  • 管理属性:标准制定部门、应用业务部门

在创建标准集模板时,我们可以将“标准制定部门”和“应用业务部门”的类型设置为“枚举单值”,且枚举值来源引用“公司部门”码表,这样在创建标准时,这两个属性会以下拉单选框的形式展示,且可选范围为“公司部门”码表配置的码值,不仅大大提升了标准填写人员的效率和体验,也避免信息来源和操作不一致造成的标准规范各异。

此外,为了更好地将历史已有标准文件导入系统进行统一管理,Dataphin 支持批量导入及更新数据标准,只需要下载标准模板并配置冲突策略,就可以实现约束一致的数据标准的批量更新。


       
如何高效管理标准?全生命周期管理,让多方协同更清晰


在Dataphin中完成数据标准创建后,会默认生成“草稿态”标准,确认填写无误后可以提交标准上线申请并生成对应的审批任务。Dataphin 支持设置标准审批模板,以适配不同管理范围下标准的审批。
标准上线后根据设置的标准生效时间,自动生成“待生效、已生效、已失效”的标准。上线后的标准支持在线修订,会生成“修订中”的版本,修订中版本再次发布前,不会影响线上已生效的标准版本。基于该流程,可以实现灵活完整的标准生命周期管理。

参考数据管理,有约束才够准确
数据标准常常需要和参考数据一起使用,才能更好地适配业务需求。常见的参考数据包括码表、词根、度量单独等等。
码表可用于约束标准属性字段的取值范围或直接作为范围值属性(如值域)的来源,提升标准定义的准确性;词根常用作词缀并作为数据表、字段等研发对象命名的参考依据,以提升命名规范性减少数据消费时的不一致性和理解误差。
Dataphin 数据标准支持码表和字根的创建和管理,通过简单的界面操作即可完成创建,并可在创建标准时引用码表作为取值范围的约束,降低了标准管理人员的操作成本。

数据标准怎么用?落标映射,将数据治理前置到研发链路


标准创建完成后,需要和对应的资产对象关联起来才能真正实现其应用价值,实现对资产的规范性约束。Dataphin 支持基于标准属性值和资产对象元数据属性值进行落标关联映射配置,以实现标准和资产的关联,作为后续落标稽核的基础。下面,我们通过一个例子来进一步理解 Dataphin 如何实现落标映射与稽核。
首先,我们需要圈选出进行映射匹配的标准和资产对象来源范围:

  • 标准:来自于“测试标准集”的所有“已生效”状态的标准
  • 资产对象:所属表名包含“test”字样的所有字段

接着,我们需要配置标准和资产对象的关联映射条件:标准名称 = 字段名称;
最后,我们需要配置该规则的执行时间和频率等信息。

基于上述配置,系统会自动执行该映射规则,圈选出相应范围的标准和资产对象并进行匹配。规则执行完成后,我们就可以在资产目录及规则执行明细页面清晰的看到某个资产关联到了哪些标准,以便参考映射到的标准定义进行开发,将数据治理前置到研发链路。                

落标评估,从源端保障数据规范统一


映射成功的资产对象是不是真正遵循了这些标准?接下来就需要我们的落标评估能力来助力。


Dataphin 支持针对资产对象的技术元数据进行落标评估,如字段类型、字段长度等。后续我们还将结合质量监控的能力,进一步拓展对值域、字段格式等内容的监控。针对不满足关联标准的资产,标准管理人员可以推动研发人员可以尽早进行整改,从源端保障数据规范性和统一性。            

03

结语

总体来说,作为资产治理的重要一环,Dataphin 数据标准功能为标准的统一管理提供了灵活的产品化能力支持,同时也能减少人工监控成本,为标准的落地执行提供了强有力的保障,以提升企业整体数字能力建设的标准化成熟和资产的健康度。

相关文章
|
29天前
|
人工智能 安全 数据管理
数据平台演进问题之为什么需要提升用户参与数据管理的程度
数据平台演进问题之为什么需要提升用户参与数据管理的程度
|
3月前
|
运维 监控 Cloud Native
如何设计与构建 FinOps 流程、团队、体系与目标
企业 FinOps 实施不是一蹴而就的项目,如果您正在推进企业云原生 FinOps 落地,除了选择合适的技术手段,企业内部的流程和体系建设也尤为重要。
163227 18
|
10月前
|
大数据
客户成功体系如何构建?请看这7步
客户成功体系如何构建?请看这7步
|
SQL 数据采集 运维
袋鼠云数栈 DataOps 数据生产力实践,实现数据流程的自动化和规范化
袋鼠云数栈在7年多的研发历程中为上千家客户提供了数据生产效率提升解决方案,也在这个过程中不断地将 DataOps 的理念融合到产品中,助力越来越多的企业成功实现数字化转型升级。本文将就数栈基于 DataOps 的敏捷、高质量数据生产力实践进行分享,希望对大家有所帮助。
392 0
|
数据管理 数据安全/隐私保护
数据治理晓说:(一)谈谈数据治理和公司治理的关系
下面内容讲的是数据治理与公司治理的关系。如何确保信息满足需求并将支持和授权管理人员正确有效的执行他们自己的角色。
数据治理晓说:(一)谈谈数据治理和公司治理的关系
|
数据采集 监控 Oracle
谈谈如何构建基于业务价值驱动的数据治理运营模式
成功的组织有各种各样的规模。这些公司的共同特点是,在优化业务流程执行的同时,通过最大化客户服务来挖掘其全部潜力。
谈谈如何构建基于业务价值驱动的数据治理运营模式
|
数据采集 分布式计算 架构师
现代数据架构的核心特征:“1个中心+10个强化”
本文总结了现代数据架构的主要特征,并为正在开发新数据战略的组织提供参考。
现代数据架构的核心特征:“1个中心+10个强化”
|
存储 数据采集 分布式计算
谈谈数据治理成熟度模型及大数据治理参考架构
数据是企业拥有的最大资产之一,但是数据也越来越难以管理和控制。干净、可信的数据能够为企业提供更好的服务,提高客户忠诚度,提高生产效率,提高决策能力。
谈谈数据治理成熟度模型及大数据治理参考架构
|
数据采集 供应链 监控
谈谈构建成功的数据治理团队的四个步骤
成功的数据治理需要与明确定义的业务需求保持一致。然而,太多的数据治理程序未能实现目标,因为它们忽略了这一先决条件。
|
数据可视化 大数据 定位技术
重点人员动态管控系统开发,合成作战平台建设方案
重点人员动态管控系统提供重点人员基于GIS的一系列应用,根据重点人员在网吧、酒店登记信息获取轨迹信息。从现有社会网点中抽取重点人员的登记信息,实现重点人员区域分布展示,在地图上提供重点人员信息空间和属性查询、统计分析和历史轨迹查询展示、及同轨重点人员分析。
188 0