概要可以分为现状评估、治理实施和治理运营&成 效查看三个环节:
数据治理现状评估 数据治理中心提供了内置的模板功能,将在阿里巴巴内部的实践和服务外 部客户过程沉淀下来的最佳实践,以模板的方式封装,提供开箱即用的能 力。选定模板、开启产品模块后,即可使用数十种丰富的治理项和检查项, 并查看整体的治理评估报告,也就是治理的健康分评估。 开启产品模块之后,可以看到治理的评估报告。数据治理中心会提供租户 全局、单个工作空间以及具体个人三个视角的报告,覆盖研发、质量、安全、计算和存储五个维度,给出量化的具体评估。最关键的一点,对于不 同的工作空间、不同的个体,这个评估模型采用的是同一套标准,保证评 估的客观一致性。这份报告,可以作为治理工作正式开始实施前的一个基 础参照。
数据治理实施:问题预防、发现和优化 需要使用到检查项和治理项,检查项面向事前治理问题预防,它会侵入日 常任务的提交、发布等环节,如果检测不通过会阻塞流程,这个功能是默 认是不开启的,需要按需开启,并可以控制特定的工作空间启用特定的检 查项。治理项面向事后治理问题发现,这个功能不需额外设置、启用模板 后即可生效。 数据治理的长效运营机制 在阿里巴巴内部数据治理的演进中,能看到三个明显的方向,分别从组织、 平台、业务三个方向来描述。
首先,数据治理不单纯是大数据团队一直在搞技术、建平台,它更多的是 一个组织协同的问题,会跨越过原先单技术团队,到影响到公司整体的架 构设计,有数据平台团队,有业务团队,还有财务、风控等 协同团队。
涉及到跨团队,对于整个组织来说,一个很头疼的问题就是如何来衡量效 果?如何更好地发挥组织的主动性?在企业内部做治理,经常会发现,有 一个很好的规范,但是没有平台来落地。在阿里巴巴内部,这是设计治理 健康分一个很大的出发点。对于某个 BU 来说,比如今年的目标之一,就 是把健康分从 70 分提升到 80 分,可以从计算、存储、研发、治理、安全 等各个方面入手,有什么需求可以提给数据平台团队,将这些能力都沉淀 到平台上,目标大家一起来共背。
通过这种方式,各个团队就会有一个统一的考核指标来指引进行数据治理 的工作。在长效推进上,会启动各类的数据治理战役,各个业务团队之间 的治理成效比武等等长效的运营工作,也可以通过健康分做不断地延展, 达到组织数据的协同目的,发挥数据治理组织的主动性。
以上内容摘自《阿里云云原生一体化数仓新能力解读》电子书,点击https://developer.aliyun.com/ebook/download/7725 可下载完整版
版权声明:本文内容由阿里云实名注册用户自发贡献,版权归原作者所有,阿里云开发者社区不拥有其著作权,亦不承担相应法律责任。具体规则请查看《阿里云开发者社区用户服务协议》和《阿里云开发者社区知识产权保护指引》。如果您发现本社区中有涉嫌抄袭的内容,填写侵权投诉表单进行举报,一经查实,本社区将立刻删除涉嫌侵权内容。
MaxCompute(原ODPS)是一项面向分析的大数据计算服务,它以Serverless架构提供快速、全托管的在线数据仓库服务,消除传统数据平台在资源扩展性和弹性方面的限制,最小化用户运维投入,使您经济并高效的分析处理海量数据。