阿里云数据治理系列(一):治理项目启动前的必答三问

本文涉及的产品
智能数据建设与治理Dataphin,200数据处理单元
简介: 近一年以来,越来越多的企业在考虑或正在启动数据治理的项目。作为在该领域从业多年的人士,也常会被咨询:数据治理不是很多年前就有的概念么?为什么忽然很多企业都在提及?是不是新瓶装旧酒?和数据中台之间是什么关系?本文中,小编将通过三个核心问题,帮助大家清晰上述疑问,更重要的是,这三个问题,也是一家企业启动数据治理项目前必须要想清楚的三个问题。

一问:目的,为什么要治理


这是一个数据治理项目启动前必须要拉齐认知的问题。并不是为了治理而治理,治理本身并无价值。


我们认为:治理的价值在于构建企业内一份质量可靠、安全可控、服务便捷的好数据,让数据价值得以释放。也就是说:数据治理的终极目的是为了释放数据价值,奠定数据价值释放的基础。


随着各行各业数字化转型进程的加速,业务数字化的基础日渐扎实,数据驱动业务或数据化运营,不再是传统头部企业及大型互联网公司的专利,越来越多的企业也在拥抱数据、消费数据。因此,数据治理的诉求呈现出日渐强烈的趋势。


在数据资产治理的强烈诉求之下,启动项目前,自上而下,企业必须达成一个统一的认知:数据治理的终极目的是为了驱动数据消费、释放数据价值。


二问:目标,治理实现什么


这是数据治理项目启动前,需要细化和明确答案的一个问题。数据治理并非一蹴而就,我们需要明确长期目标是什么,但同时也要明确短期项目范围和目标又是什么。


从数据治理的目的不难理解,制定数据治理项目的阶段性目标可以从终极目的的数据价值释放出发,也可以从数据体系的完善度出发。一般来说,后者是常见的直接目标。


当然,在数据领域摸爬多年的领域人士都知道,数据治理并非一蹴而就。一般围绕四大关键领域“成本、质量、安全、服务”开展工作,进行目标设定。目标设定的可以借鉴以下思路。

  1. 生产经济即成本方面,以控制甚至节约成本为目标,实际运作则需要拆解到业务线或者不同领域范围的成本控制,比如销售业务线、市场投放线等,再比如基础数据线、流量日志数据线等;
  2. 质量可靠即质量方面,以减少数据质量问题、收窄数据质量风险敞口为目标,实际运作则需要拆解到应用场景或不同数据等级,如商品数据、销售数据等,再如优先保障高管数据看板、驱动业务运行涉及的数据质量等;
  3. 安全可控即安全方面,以满足合规要求、防止数据泄漏为目标,实际运作则需要拆解到不同的数据类型或流程环节,如隐私数据、监管报送数据等,往往安全体系能力建设是其中重要的工作;
  4. 服务便捷即服务方面,以盘点供给丰富的数据、驱动数据消费为目标,实际运作则需要拆解到不同的业务线、数据类型及服务场景,如营销推广、业务决策等。


从具体的工作开展来看,成本是数据到一定体量再重点关注的领域,质量是其中最重点也是最具挑战的领域,安全是基础,服务则是需要高度重视并投入打造数据价值的关键领域。


因此,在项目启动之前,必须明确本次项目范围重点的是哪个或哪几个领域(如:成本、质量)、治理范围是什么(如:客户数据、监管报送场景、流量日志线数据)、核心目标是什么(如:3个月项目上线、XXX成本的节约、6个月P0级数据质量故障数为0、完成XXX数据的上架、数据服务体系能力建设形成XXX、XXX用户的服务)。总而言之,启动治理项目前,必须对领域、范围、核心目标进行选择和设定


三问:方法,怎么实施治理


目的目标明确,具体的数据治理应该如何实施呢?这是保障数据治理项目成功的关键问题,涉及到人员组织及权责的设计、流程规范的设计、工具选型三方面的基础工作,同时还要围绕目标设定的领域、范围及核心目标进行工作开展。

  1. 由于数据质量出现问题引发的原因很多,可能有技术层面的数据建设开发不规范,可能有业务层面的填报输入有纰漏,可能有管理层面的组织机制不健全导致无人推进等,所以要对数据质量及管理进行摸底,确定质量的水位线及风险敞口,并制定事前事中事后全链路的数据质量治理方案。
  2. 数据价值释放是数据治理项目的终极目标,所以一方面通过对企业所有数据盘点及管理,在数据供给侧汇聚全域数据,体系化地组织数据,并丰富数据信息,另一方面强化数据运营培训及推广,建立良好的资产检索和确信体验,并和取数、分析等数据服务链接,实现数据资产在需求侧消费扩大。与此同时,体系化呈现资产能力大图及资产价值评估也是必不可少的。
  3. 数据安全方面,重点是数据识别后对数据的分类分级,同时对隐私及不同安全等级的数据采取不同的授权策略。不论从源头的数据采集、授权,还是从外部引入合作,合规性都是今天数据安全范畴内非常重要的命题,因此相关流程机制及能力建设也可以是实施中的重要组成部分。
  4. 数据成本方面,重点对数据存储及计算的浪费问题进行发现和处理,通过分析、设定治理项、启动治理,实现成本的节约。


因此,启动治理项目前,必须对基本的治理实施路径进行定义,包括组织保障、流程规范、工具提效,并对涉及的领域,如质量:进行全面评估、用全链路的视角对项目范围内的数据建设进行质量风险控制、建立数据质量故障体系提升响应能力,同时重点关注价值出口,对数据资产进行盘点和运营推广,让数据被用起来。


写在最后

作为从业多年的数据人,也一直在反思,为什么数据治理提了那么多年,以前做治理项目成功的案例并不多见。而如今再次被提起,项目成功的可能性却有了很大提升,主要原因在以下几方面:

  • 数字化转型浪潮下,对数据治理都有了更客观的认知,是长期能力建设而非运动式项目;
  • 数据中台和数据治理结合,数据的统一汇聚为数据治理提供了基础,体系规范地数据建设又让数据治理前置到事前事中,全链路式的数据治理而非点状、事后的数据治理
  • 一批真正懂数据、实践过大规模数据建设和数据运营的人员为数据治理提供服务,实战沉淀而非纸上谈兵


阿里云数据资产治理解决方案,是在数据中台基础上的延展,用中台方法论,让所有的企业拥有一份企业级好数据!


了解更多阿里云数据中台相关资讯,可以前往官网:https://dp.alibaba.com/index





阿里云数据中台是阿里巴巴数据中台唯一商业化输出,以数据中台方法论为内核,构建起”快、准、全、统、通“的智能大数据体系。

阿里云数据中台产品矩阵是以Dataphin为基座,以Quick系列为业务场景化切入:

  • - Dataphin,智能数据建设与治理
  • - Quick BI,数据可视化分析
  • - Quick Audience,一站式消费者运营和管理
  • - Quick Tracking,全域行为洞察
  • - Quick Stock, 智能货品运营
  • - Quick Decision,风控决策数字引擎

目前正对外输出系列解决方案,包括通用数据中台解决方案、零售数据中台解决方案、金融数据中台解决方案、互联网数据中台解决方案等。

相关实践学习
AnalyticDB PostgreSQL 企业智能数据中台:一站式管理数据服务资产
企业在数据仓库之上可构建丰富的数据服务用以支持数据应用及业务场景;ADB PG推出全新企业智能数据平台,用以帮助用户一站式的管理企业数据服务资产,包括创建, 管理,探索, 监控等; 助力企业在现有平台之上快速构建起数据服务资产体系
相关文章
|
存储 大数据
亚信AISWare DataOS大数据中台套件介绍03——dataos开发目录配置
DataOS是一款汇总大部分大数据套件的企业型中台,可以满足企业大部分对大数据存储、计算、稽核的需求。但是平台使用体检并不好,所以有条件还是推荐使用阿里云的大数据组件
1033 0
|
2月前
|
SQL 机器学习/深度学习 人工智能
从“写SQL”到“聊数据”:NL2SQL如何用自然语言解锁数据库?
本文系统性地阐述了自然语言转SQL(NL2SQL) 技术如何让非技术背景的业务分析师实现数据自助查询,从而提升数据驱动决策的效率与准确性。
从“写SQL”到“聊数据”:NL2SQL如何用自然语言解锁数据库?
|
7月前
|
SQL 关系型数据库 MySQL
seatunnel配置mysql2hive
本文介绍了SeaTunnel的安装与使用教程,涵盖从安装、配置到数据同步的全过程。主要内容包括: 1. **SeaTunnel安装**:详细描述了下载、解压及配置连接器等步骤。 2. **模拟数据到Hive (fake2hive)**:通过编辑测试脚本,将模拟数据写入Hive表。 3. **MySQL到控制台 (mysql2console)**:创建配置文件并执行命令,将MySQL数据输出到控制台。 4. **MySQL到Hive (mysql2hive)**:创建Hive表,配置并启动同步任务,支持单表和多表同步。
|
10月前
|
安全 Docker 容器
docker的默认网络模式有哪些
Docker 默认网络模式包括:1) bridge:默认模式,各容器分配独立IP,可通过名称或IP通信;2) host:容器与宿主机共享网络命名空间,性能最优但有安全风险;3) none:容器隔离无网络配置,适用于仅需本地通信的场景。
410 6
|
10月前
|
Prometheus Cloud Native Linux
Prometheus+Grafana新手友好教程:从零开始搭建轻松掌握强大的警报系统
本文介绍了使用 Prometheus 和 Grafana 实现邮件报警的方案,包括三种主要方法:1) 使用 Prometheus 的 Alertmanager 组件;2) 使用 Grafana 的内置告警通知功能;3) 使用第三方告警组件如 OneAlert。同时,详细描述了环境准备、Grafana 安装配置及预警设置的步骤,确保用户能够成功搭建并测试邮件报警功能。通过这些配置,用户可以在系统或应用出现异常时及时收到邮件通知,保障系统的稳定运行。
1027 1
|
安全 数据安全/隐私保护
Burpsuite Proxy代理功能
Burpsuite Proxy代理功能
|
10月前
|
Nacos 微服务
Nacos与Eureka的区别
Eureka和Nacos均支持服务注册发现、基于心跳的健康检查及AP模式下的集群数据同步。主要区别在于:心跳频率、服务剔除机制、服务检测与清理周期不同,Nacos还额外提供配置管理功能。
321 0
|
域名解析 网络协议 安全
DNS隧道
【8月更文挑战第20天】
498 1
|
运维 网络安全 网络虚拟化
2024网络建设与运维赛题-交换配置教程
SW1, SW2, SW3作为核心交换机,配置了多个VLAN以隔离不同部门的网络,如产品、营销、财务和行政。配置中还包括启用VLAN访问控制,允许特定VLAN通过二层链路,并设置了链路聚合(LACP)以增强SW1和SW2之间的连接可靠性。此外,所有交换机都配置了IP VRF来支持分公司(Branch,RD 1:1)和Internet(RD 2:2)的虚拟专用网络。
2024网络建设与运维赛题-交换配置教程
|
机器学习/深度学习 人工智能 大数据
阿里云大数据&AI 2022案例合集
阿里云2022大数据&AI精选产品案例合集,了解产品最新及最佳实践,助力企业实现降本增效。
阿里云大数据&AI 2022案例合集