阿里云数据治理系列(一):治理项目启动前的必答三问

本文涉及的产品
智能数据建设与治理Dataphin,200数据处理单元
简介: 近一年以来,越来越多的企业在考虑或正在启动数据治理的项目。作为在该领域从业多年的人士,也常会被咨询:数据治理不是很多年前就有的概念么?为什么忽然很多企业都在提及?是不是新瓶装旧酒?和数据中台之间是什么关系?本文中,小编将通过三个核心问题,帮助大家清晰上述疑问,更重要的是,这三个问题,也是一家企业启动数据治理项目前必须要想清楚的三个问题。

一问:目的,为什么要治理


这是一个数据治理项目启动前必须要拉齐认知的问题。并不是为了治理而治理,治理本身并无价值。


我们认为:治理的价值在于构建企业内一份质量可靠、安全可控、服务便捷的好数据,让数据价值得以释放。也就是说:数据治理的终极目的是为了释放数据价值,奠定数据价值释放的基础。


随着各行各业数字化转型进程的加速,业务数字化的基础日渐扎实,数据驱动业务或数据化运营,不再是传统头部企业及大型互联网公司的专利,越来越多的企业也在拥抱数据、消费数据。因此,数据治理的诉求呈现出日渐强烈的趋势。


在数据资产治理的强烈诉求之下,启动项目前,自上而下,企业必须达成一个统一的认知:数据治理的终极目的是为了驱动数据消费、释放数据价值。


二问:目标,治理实现什么


这是数据治理项目启动前,需要细化和明确答案的一个问题。数据治理并非一蹴而就,我们需要明确长期目标是什么,但同时也要明确短期项目范围和目标又是什么。


从数据治理的目的不难理解,制定数据治理项目的阶段性目标可以从终极目的的数据价值释放出发,也可以从数据体系的完善度出发。一般来说,后者是常见的直接目标。


当然,在数据领域摸爬多年的领域人士都知道,数据治理并非一蹴而就。一般围绕四大关键领域“成本、质量、安全、服务”开展工作,进行目标设定。目标设定的可以借鉴以下思路。

  1. 生产经济即成本方面,以控制甚至节约成本为目标,实际运作则需要拆解到业务线或者不同领域范围的成本控制,比如销售业务线、市场投放线等,再比如基础数据线、流量日志数据线等;
  2. 质量可靠即质量方面,以减少数据质量问题、收窄数据质量风险敞口为目标,实际运作则需要拆解到应用场景或不同数据等级,如商品数据、销售数据等,再如优先保障高管数据看板、驱动业务运行涉及的数据质量等;
  3. 安全可控即安全方面,以满足合规要求、防止数据泄漏为目标,实际运作则需要拆解到不同的数据类型或流程环节,如隐私数据、监管报送数据等,往往安全体系能力建设是其中重要的工作;
  4. 服务便捷即服务方面,以盘点供给丰富的数据、驱动数据消费为目标,实际运作则需要拆解到不同的业务线、数据类型及服务场景,如营销推广、业务决策等。


从具体的工作开展来看,成本是数据到一定体量再重点关注的领域,质量是其中最重点也是最具挑战的领域,安全是基础,服务则是需要高度重视并投入打造数据价值的关键领域。


因此,在项目启动之前,必须明确本次项目范围重点的是哪个或哪几个领域(如:成本、质量)、治理范围是什么(如:客户数据、监管报送场景、流量日志线数据)、核心目标是什么(如:3个月项目上线、XXX成本的节约、6个月P0级数据质量故障数为0、完成XXX数据的上架、数据服务体系能力建设形成XXX、XXX用户的服务)。总而言之,启动治理项目前,必须对领域、范围、核心目标进行选择和设定


三问:方法,怎么实施治理


目的目标明确,具体的数据治理应该如何实施呢?这是保障数据治理项目成功的关键问题,涉及到人员组织及权责的设计、流程规范的设计、工具选型三方面的基础工作,同时还要围绕目标设定的领域、范围及核心目标进行工作开展。

  1. 由于数据质量出现问题引发的原因很多,可能有技术层面的数据建设开发不规范,可能有业务层面的填报输入有纰漏,可能有管理层面的组织机制不健全导致无人推进等,所以要对数据质量及管理进行摸底,确定质量的水位线及风险敞口,并制定事前事中事后全链路的数据质量治理方案。
  2. 数据价值释放是数据治理项目的终极目标,所以一方面通过对企业所有数据盘点及管理,在数据供给侧汇聚全域数据,体系化地组织数据,并丰富数据信息,另一方面强化数据运营培训及推广,建立良好的资产检索和确信体验,并和取数、分析等数据服务链接,实现数据资产在需求侧消费扩大。与此同时,体系化呈现资产能力大图及资产价值评估也是必不可少的。
  3. 数据安全方面,重点是数据识别后对数据的分类分级,同时对隐私及不同安全等级的数据采取不同的授权策略。不论从源头的数据采集、授权,还是从外部引入合作,合规性都是今天数据安全范畴内非常重要的命题,因此相关流程机制及能力建设也可以是实施中的重要组成部分。
  4. 数据成本方面,重点对数据存储及计算的浪费问题进行发现和处理,通过分析、设定治理项、启动治理,实现成本的节约。


因此,启动治理项目前,必须对基本的治理实施路径进行定义,包括组织保障、流程规范、工具提效,并对涉及的领域,如质量:进行全面评估、用全链路的视角对项目范围内的数据建设进行质量风险控制、建立数据质量故障体系提升响应能力,同时重点关注价值出口,对数据资产进行盘点和运营推广,让数据被用起来。


写在最后

作为从业多年的数据人,也一直在反思,为什么数据治理提了那么多年,以前做治理项目成功的案例并不多见。而如今再次被提起,项目成功的可能性却有了很大提升,主要原因在以下几方面:

  • 数字化转型浪潮下,对数据治理都有了更客观的认知,是长期能力建设而非运动式项目;
  • 数据中台和数据治理结合,数据的统一汇聚为数据治理提供了基础,体系规范地数据建设又让数据治理前置到事前事中,全链路式的数据治理而非点状、事后的数据治理
  • 一批真正懂数据、实践过大规模数据建设和数据运营的人员为数据治理提供服务,实战沉淀而非纸上谈兵


阿里云数据资产治理解决方案,是在数据中台基础上的延展,用中台方法论,让所有的企业拥有一份企业级好数据!


了解更多阿里云数据中台相关资讯,可以前往官网:https://dp.alibaba.com/index





阿里云数据中台是阿里巴巴数据中台唯一商业化输出,以数据中台方法论为内核,构建起”快、准、全、统、通“的智能大数据体系。

阿里云数据中台产品矩阵是以Dataphin为基座,以Quick系列为业务场景化切入:

  • - Dataphin,智能数据建设与治理
  • - Quick BI,数据可视化分析
  • - Quick Audience,一站式消费者运营和管理
  • - Quick Tracking,全域行为洞察
  • - Quick Stock, 智能货品运营
  • - Quick Decision,风控决策数字引擎

目前正对外输出系列解决方案,包括通用数据中台解决方案、零售数据中台解决方案、金融数据中台解决方案、互联网数据中台解决方案等。

相关实践学习
使用CLup和iSCSI共享盘快速体验PolarDB for PostgtreSQL
在Clup云管控平台中快速体验创建与管理在iSCSI共享盘上的PolarDB for PostgtreSQL。
AnalyticDB PostgreSQL 企业智能数据中台:一站式管理数据服务资产
企业在数据仓库之上可构建丰富的数据服务用以支持数据应用及业务场景;ADB PG推出全新企业智能数据平台,用以帮助用户一站式的管理企业数据服务资产,包括创建, 管理,探索, 监控等; 助力企业在现有平台之上快速构建起数据服务资产体系
相关文章
|
6天前
|
关系型数据库 MySQL 数据挖掘
阿里云 SelectDB 携手 DTS ,一键实现 TP 数据实时入仓
DTS 作为阿里云核心的数据交互引擎,以其高效的实时数据流处理能力和广泛的数据源兼容性,为用户构建了一个安全可靠、可扩展、高可用的数据架构桥梁。阿里云数据库 SelectDB 通过与 DTS 联合,为用户提供了简单、实时、极速且低成本的事务数据分析方案。用户可以通过 DTS 数据传输服务,一键将自建 MySQL / RDS MySQL / PolarDB for MySQL 数据库,迁移或同步至阿里云数据库 SelectDB 的实例中,帮助企业在短时间内完成数据迁移或同步,并即时获得深度洞察。
阿里云 SelectDB 携手 DTS ,一键实现 TP 数据实时入仓
|
6天前
|
SQL 人工智能 数据挖掘
阿里云DMS,身边的智能化数据分析助手
生成式AI颠覆了人机交互的传统范式,赋予每个人利用AI进行低门槛数据分析的能力。Data Fabric与生成式AI的强强联合,不仅能够实现敏捷数据交付,还有效降低了数据分析门槛,让人人都能数据分析成为可能!阿里云DMS作为阿里云统一的用数平台,在2021年初就开始探索使用Data Fabric理念构建逻辑数仓来加速企业数据价值的交付,2023年推出基于大模型构建的Data Copilot,降低用数门槛,近期我们将Notebook(分析窗口)、逻辑数仓(Data Fabric)、Data Copilot(生成式AI)进行有机组合,端到端的解决用数难题,给用户带来全新的分析体验。
110266 119
阿里云DMS,身边的智能化数据分析助手
|
6天前
|
关系型数据库 Apache 流计算
手把手教你实现 OceanBase 数据到阿里云数据库 SelectDB 内核版 Apache Doris 的便捷迁移|实用指南
本文介绍了如何将数据从 OceanBase 迁移到阿里云数据库 SelectDB 内核版 Apache Doris。提供 3 种数据同步方法 1. 使用 DataX,下载 DataX 并编写配置文件,通过 OceanBaseReader 和 DorisWriter 进行数据迁移。 2. 利用 Apache Doris 的 Catalog功 能,将 OceanBase 表映射到 Doris 并插入数据。 3. 通过Flink CDC,设置 OceanBase 环境,配置 Flink 连接器,实现实时数据同步。
手把手教你实现 OceanBase 数据到阿里云数据库 SelectDB 内核版 Apache Doris 的便捷迁移|实用指南
|
6天前
|
存储 数据可视化 数据管理
基于阿里云服务的数据平台架构实践
本文主要介绍基于阿里云大数据组件服务,对企业进行大数据平台建设的架构实践。
769 2
|
6天前
|
分布式计算 大数据 BI
MaxCompute产品使用合集之MaxCompute项目的数据是否可以被接入到阿里云的Quick BI中
MaxCompute作为一款全面的大数据处理平台,广泛应用于各类大数据分析、数据挖掘、BI及机器学习场景。掌握其核心功能、熟练操作流程、遵循最佳实践,可以帮助用户高效、安全地管理和利用海量数据。以下是一个关于MaxCompute产品使用的合集,涵盖了其核心功能、应用场景、操作流程以及最佳实践等内容。
|
6天前
|
机器学习/深度学习 存储 分布式计算
机器学习PAI常见问题之DLC的数据写入到另外一个阿里云主账号的OSS中如何解决
PAI(平台为智能,Platform for Artificial Intelligence)是阿里云提供的一个全面的人工智能开发平台,旨在为开发者提供机器学习、深度学习等人工智能技术的模型训练、优化和部署服务。以下是PAI平台使用中的一些常见问题及其答案汇总,帮助用户解决在使用过程中遇到的问题。
|
6天前
|
监控 Java 测试技术
阿里云推出 3.x Java 探针,解锁应用观测与治理的全新姿势
阿里云推出 3.x Java 探针,解锁应用观测与治理的全新姿势
174264 4
|
1天前
|
存储 人工智能 数据管理
【云故事探索】基于阿里云助力地理产业2.0落地,实现遥感数据智能化管理
中国某遥感数据服务中心借助阿里云ECS、GPU和OSS服务,成功实现了地理信息产业升级。此前,中心面临数据管理混乱、服务响应慢等问题。通过阿里云的解决方案,构建了全生命周期管理的遥感数据平台,强化了自动化、智能化的数据生产能力,提升了数据服务的准确性和及时性。此外,平台还增强了数据共享,扩大了应用范围。未来,中心计划结合AI技术,探索地理信息3.0时代,利用阿里云的人工智能平台进一步提升数据管理和应用能力。
45 1
|
1天前
|
存储 弹性计算 数据库
阿里云oss备份网站数据的详细步骤
该教程指导如何使用阿里云OSS备份网站数据。首先,注册阿里云账号并购买40GB的OSS存储空间。创建Bucket,选择与服务器相同的区域和私有权限。安装阿里云OSS插件,获取AccessKey信息。在宝塔面板中设置计划任务进行网站或数据库备份,选择内网域名以节省流量。备份完成后,通过文件管理器检查OSS中是否有备份文件。下载备份文件需点击文件名,然后打开文件URL。
|
6天前
|
关系型数据库 分布式数据库 数据库
开源之夏2024学生报名启动!阿里云PolarDB社区项目期待你的参与!
开源之夏2024学生报名启动!阿里云PolarDB社区带你变得更强!
开源之夏2024学生报名启动!阿里云PolarDB社区项目期待你的参与!

热门文章

最新文章