阿里云数据治理系列(一):治理项目启动前的必答三问

本文涉及的产品
智能数据建设与治理Dataphin,200数据处理单元
简介: 近一年以来,越来越多的企业在考虑或正在启动数据治理的项目。作为在该领域从业多年的人士,也常会被咨询:数据治理不是很多年前就有的概念么?为什么忽然很多企业都在提及?是不是新瓶装旧酒?和数据中台之间是什么关系?本文中,小编将通过三个核心问题,帮助大家清晰上述疑问,更重要的是,这三个问题,也是一家企业启动数据治理项目前必须要想清楚的三个问题。

一问:目的,为什么要治理


这是一个数据治理项目启动前必须要拉齐认知的问题。并不是为了治理而治理,治理本身并无价值。


我们认为:治理的价值在于构建企业内一份质量可靠、安全可控、服务便捷的好数据,让数据价值得以释放。也就是说:数据治理的终极目的是为了释放数据价值,奠定数据价值释放的基础。


随着各行各业数字化转型进程的加速,业务数字化的基础日渐扎实,数据驱动业务或数据化运营,不再是传统头部企业及大型互联网公司的专利,越来越多的企业也在拥抱数据、消费数据。因此,数据治理的诉求呈现出日渐强烈的趋势。


在数据资产治理的强烈诉求之下,启动项目前,自上而下,企业必须达成一个统一的认知:数据治理的终极目的是为了驱动数据消费、释放数据价值。


二问:目标,治理实现什么


这是数据治理项目启动前,需要细化和明确答案的一个问题。数据治理并非一蹴而就,我们需要明确长期目标是什么,但同时也要明确短期项目范围和目标又是什么。


从数据治理的目的不难理解,制定数据治理项目的阶段性目标可以从终极目的的数据价值释放出发,也可以从数据体系的完善度出发。一般来说,后者是常见的直接目标。


当然,在数据领域摸爬多年的领域人士都知道,数据治理并非一蹴而就。一般围绕四大关键领域“成本、质量、安全、服务”开展工作,进行目标设定。目标设定的可以借鉴以下思路。

  1. 生产经济即成本方面,以控制甚至节约成本为目标,实际运作则需要拆解到业务线或者不同领域范围的成本控制,比如销售业务线、市场投放线等,再比如基础数据线、流量日志数据线等;
  2. 质量可靠即质量方面,以减少数据质量问题、收窄数据质量风险敞口为目标,实际运作则需要拆解到应用场景或不同数据等级,如商品数据、销售数据等,再如优先保障高管数据看板、驱动业务运行涉及的数据质量等;
  3. 安全可控即安全方面,以满足合规要求、防止数据泄漏为目标,实际运作则需要拆解到不同的数据类型或流程环节,如隐私数据、监管报送数据等,往往安全体系能力建设是其中重要的工作;
  4. 服务便捷即服务方面,以盘点供给丰富的数据、驱动数据消费为目标,实际运作则需要拆解到不同的业务线、数据类型及服务场景,如营销推广、业务决策等。


从具体的工作开展来看,成本是数据到一定体量再重点关注的领域,质量是其中最重点也是最具挑战的领域,安全是基础,服务则是需要高度重视并投入打造数据价值的关键领域。


因此,在项目启动之前,必须明确本次项目范围重点的是哪个或哪几个领域(如:成本、质量)、治理范围是什么(如:客户数据、监管报送场景、流量日志线数据)、核心目标是什么(如:3个月项目上线、XXX成本的节约、6个月P0级数据质量故障数为0、完成XXX数据的上架、数据服务体系能力建设形成XXX、XXX用户的服务)。总而言之,启动治理项目前,必须对领域、范围、核心目标进行选择和设定


三问:方法,怎么实施治理


目的目标明确,具体的数据治理应该如何实施呢?这是保障数据治理项目成功的关键问题,涉及到人员组织及权责的设计、流程规范的设计、工具选型三方面的基础工作,同时还要围绕目标设定的领域、范围及核心目标进行工作开展。

  1. 由于数据质量出现问题引发的原因很多,可能有技术层面的数据建设开发不规范,可能有业务层面的填报输入有纰漏,可能有管理层面的组织机制不健全导致无人推进等,所以要对数据质量及管理进行摸底,确定质量的水位线及风险敞口,并制定事前事中事后全链路的数据质量治理方案。
  2. 数据价值释放是数据治理项目的终极目标,所以一方面通过对企业所有数据盘点及管理,在数据供给侧汇聚全域数据,体系化地组织数据,并丰富数据信息,另一方面强化数据运营培训及推广,建立良好的资产检索和确信体验,并和取数、分析等数据服务链接,实现数据资产在需求侧消费扩大。与此同时,体系化呈现资产能力大图及资产价值评估也是必不可少的。
  3. 数据安全方面,重点是数据识别后对数据的分类分级,同时对隐私及不同安全等级的数据采取不同的授权策略。不论从源头的数据采集、授权,还是从外部引入合作,合规性都是今天数据安全范畴内非常重要的命题,因此相关流程机制及能力建设也可以是实施中的重要组成部分。
  4. 数据成本方面,重点对数据存储及计算的浪费问题进行发现和处理,通过分析、设定治理项、启动治理,实现成本的节约。


因此,启动治理项目前,必须对基本的治理实施路径进行定义,包括组织保障、流程规范、工具提效,并对涉及的领域,如质量:进行全面评估、用全链路的视角对项目范围内的数据建设进行质量风险控制、建立数据质量故障体系提升响应能力,同时重点关注价值出口,对数据资产进行盘点和运营推广,让数据被用起来。


写在最后

作为从业多年的数据人,也一直在反思,为什么数据治理提了那么多年,以前做治理项目成功的案例并不多见。而如今再次被提起,项目成功的可能性却有了很大提升,主要原因在以下几方面:

  • 数字化转型浪潮下,对数据治理都有了更客观的认知,是长期能力建设而非运动式项目;
  • 数据中台和数据治理结合,数据的统一汇聚为数据治理提供了基础,体系规范地数据建设又让数据治理前置到事前事中,全链路式的数据治理而非点状、事后的数据治理
  • 一批真正懂数据、实践过大规模数据建设和数据运营的人员为数据治理提供服务,实战沉淀而非纸上谈兵


阿里云数据资产治理解决方案,是在数据中台基础上的延展,用中台方法论,让所有的企业拥有一份企业级好数据!


了解更多阿里云数据中台相关资讯,可以前往官网:https://dp.alibaba.com/index





阿里云数据中台是阿里巴巴数据中台唯一商业化输出,以数据中台方法论为内核,构建起”快、准、全、统、通“的智能大数据体系。

阿里云数据中台产品矩阵是以Dataphin为基座,以Quick系列为业务场景化切入:

  • - Dataphin,智能数据建设与治理
  • - Quick BI,数据可视化分析
  • - Quick Audience,一站式消费者运营和管理
  • - Quick Tracking,全域行为洞察
  • - Quick Stock, 智能货品运营
  • - Quick Decision,风控决策数字引擎

目前正对外输出系列解决方案,包括通用数据中台解决方案、零售数据中台解决方案、金融数据中台解决方案、互联网数据中台解决方案等。

相关实践学习
使用CLup和iSCSI共享盘快速体验PolarDB for PostgtreSQL
在Clup云管控平台中快速体验创建与管理在iSCSI共享盘上的PolarDB for PostgtreSQL。
AnalyticDB PostgreSQL 企业智能数据中台:一站式管理数据服务资产
企业在数据仓库之上可构建丰富的数据服务用以支持数据应用及业务场景;ADB PG推出全新企业智能数据平台,用以帮助用户一站式的管理企业数据服务资产,包括创建, 管理,探索, 监控等; 助力企业在现有平台之上快速构建起数据服务资产体系
相关文章
|
1月前
|
关系型数据库 MySQL 数据挖掘
阿里云 SelectDB 携手 DTS ,一键实现 TP 数据实时入仓
DTS 作为阿里云核心的数据交互引擎,以其高效的实时数据流处理能力和广泛的数据源兼容性,为用户构建了一个安全可靠、可扩展、高可用的数据架构桥梁。阿里云数据库 SelectDB 通过与 DTS 联合,为用户提供了简单、实时、极速且低成本的事务数据分析方案。用户可以通过 DTS 数据传输服务,一键将自建 MySQL / RDS MySQL / PolarDB for MySQL 数据库,迁移或同步至阿里云数据库 SelectDB 的实例中,帮助企业在短时间内完成数据迁移或同步,并即时获得深度洞察。
阿里云 SelectDB 携手 DTS ,一键实现 TP 数据实时入仓
|
1月前
|
SQL 人工智能 数据挖掘
阿里云DMS,身边的智能化数据分析助手
生成式AI颠覆了人机交互的传统范式,赋予每个人利用AI进行低门槛数据分析的能力。Data Fabric与生成式AI的强强联合,不仅能够实现敏捷数据交付,还有效降低了数据分析门槛,让人人都能数据分析成为可能!阿里云DMS作为阿里云统一的用数平台,在2021年初就开始探索使用Data Fabric理念构建逻辑数仓来加速企业数据价值的交付,2023年推出基于大模型构建的Data Copilot,降低用数门槛,近期我们将Notebook(分析窗口)、逻辑数仓(Data Fabric)、Data Copilot(生成式AI)进行有机组合,端到端的解决用数难题,给用户带来全新的分析体验。
110139 118
阿里云DMS,身边的智能化数据分析助手
|
2月前
|
存储 数据可视化 数据管理
基于阿里云服务的数据平台架构实践
本文主要介绍基于阿里云大数据组件服务,对企业进行大数据平台建设的架构实践。
718 2
|
4月前
|
Java
dockerfile打包阿里云镜像 springboot实战项目(阿里云镜像仓失败 处理)
dockerfile打包阿里云镜像 springboot实战项目(阿里云镜像仓失败 处理)
|
3月前
|
存储 固态存储 大数据
阿里云服务器各收费项目最新收费标准与活动报价参考
阿里云服务器收费项目有实例价格、预留实例券、专有宿主机、块存储价格、存储容量单位包、带宽价格和快照服务价格,收费模式有包年包月和按量付费模式。2024年,阿里云继续推出各种云服务器的优惠,其中轻量应用服务器最低61元/1年,经济型e实例云服务器最低99元/1年,2核4G轻量应用服务器165元/1年,4核8G配置云服务器按量付费带宽模式最低299元/1年。本文为大家汇总了2024年阿里云服务器各个收费项目的最新收费标准与云服务器的最新活动报价,以供参考和了解。
阿里云服务器各收费项目最新收费标准与活动报价参考
|
2月前
|
监控 Java 测试技术
阿里云推出 3.x Java 探针,解锁应用观测与治理的全新姿势
阿里云推出 3.x Java 探针,解锁应用观测与治理的全新姿势
174253 5
|
10天前
|
NoSQL 关系型数据库 MySQL
阿里云服务器部署项目流程
本文主要讲解阿里云服务器的部署,如何选择配置等
|
1月前
|
消息中间件 编解码 运维
阿里云 Serverless 异步任务处理系统在数据分析领域的应用
本文主要介绍异步任务处理系统中的数据分析,函数计算异步任务最佳实践-Kafka ETL,函数计算异步任务最佳实践-音视频处理等。
175311 348
|
1月前
|
存储 数据采集 Apache
众安保险 CDP 平台:借助阿里云数据库 SelectDB 版内核 Apache Doris 打破数据孤岛,人群圈选提速4倍
随着业务在金融、保险和商城领域的不断扩展,众安保险建设 CDP 平台以提供自动化营销数据支持。早期 CDP 平台依赖于 Spark + Impala + Hbase + Nebula 复杂的技术组合,这不仅导致数据分析形成数据孤岛,还带来高昂的管理及维护成本。为解决该问题,众安保险引入 Apache Doris,替换了早期复杂的技术组合,不仅降低了系统的复杂性,打破了数据孤岛,更提升了数据处理的效率。
众安保险 CDP 平台:借助阿里云数据库 SelectDB 版内核 Apache Doris 打破数据孤岛,人群圈选提速4倍
|
3月前
|
NoSQL Java 微服务
前后端分离项目知识汇总(阿里云Oss,EasyExcel,视频点播,SpringCloud,Redis,Nuxt)-3
前后端分离项目知识汇总(阿里云Oss,EasyExcel,视频点播,SpringCloud,Redis,Nuxt)
123 1

热门文章

最新文章