带你读《数据自治》第二章数据治理2.4数据治理应用与发展(一)

简介: 《数据自治》第二章数据治理2.4数据治理应用与发展

2.4       数据治理应用与发展

 

2.4.1         数据治理的应用

 

在以大数据广泛落地和深度应用为主要特征的信息技术革命高速发展的背景下,数据治理是一种有效的建设和完善开放数据的务实模式。从本质上说,数据治理应用与发展必须解决如何控制数据使用者传播或滥用数据的问题,即做到数据既能自治,又能开放,保护数据稀缺性不丧失,保障数据安全和隐私。

(1)数据治理与数据资产

高质量的数据对于任何企业都是战略性资产,随着企业数字化转型进程的推进,有效数据正迅速成为关键的业务差异,但要使数据具有价值,需确保数据的可信任、安全性、可访问性、准确性、共享性和及时性。数据治理有助于增强企业的灵活性,进而最小化决策成本和风险,特别是在数字经济中,数据治理比以往任何时候都显得更重要。数据治理的研究主要源于 IT服务和大数据两个方面。在 IT服务方面,人们在 IT服务管理、IT治理等基础上开展了数据治理相关研究;在大数据方面,人们在大数据参考架构、大数据技术、产品等标准基础上推进了数据交易流通、数据开放共享相关研究。近年来,IT服务方面和大数据方面在数据治理与数据资产方向的研究逐渐融合。

数据资产研究与数据治理、数据开放共享、数据流通交易等有紧密的联系,如2-7所示。数据资产是经过确权和资产化等治理后的有价值数据,具有资产的属性,数据资产相关研究需要参考和引用数据治理的相关研究。数据治理有助于数据的融合应用、开放共享、资产化运营管理。在数据要素的基础上,数据资产管理更强调其资产视角,重点关注成本、定价、收益、价值等维度,数据资产的标准化更加有益于交易流通。

image.png

2-7数据资产研究与数据治理、数据开放共享、数据流通交易的关系

 

数据资产离不开数据治理,数据资产的管理实施分为 3个阶段,每个阶段都需要数据治理进行规范和管控。

•  初级治理:数据质量治理。首先,对数据进行数据标准化、质量管理、元数据管理等处理,提升数据质量,形成数据资产原料。

•  中级治理:数据资产治理。其次,通过数据合规、分类分级、安全管理、共享应用等处理,对数据资产原料进行加工,形成数据资产,此时数据具有可流通、可交易等数据资产的商品属性。

•  高级治理:数据价值治理。最后,通过数据交易、服务、洞察和模式创新等处理方式,促进数据流通,产生数据价值。

(2)数据治理与数据主权

随着信息技术、互联网络的不断发展,地域不再是信息传递的阻碍,数据流动成为信息世界的常态。数据流动有利于数据价值的挖掘,提升了数据的变现能力,为产业带来创新的资源环境,但也会造成数据主体权利的弱化,甚至是数据主体的不明确,尤其是数据的跨境流动,可能会导致数据的提供、管理和使用跨越国家和地区,处于不同的数据管辖体系,造成数据控制上的权利交叉,对数据主权造成巨大威胁。

大数据时代,数据已经成为国家的战略资源,数据主权也成为与军事、国防同样重要的大国博弈的空间,是国家竞争力的重要体现,数据主权的维护势在必行。而作为管理数据跨境流动的重要手段,数据治理也越来越被提升到维护数据主权的高度。

因此,很多国家结合本国国情,建立了有利于本国数据发展的数据治理体系,对数据跨境流动做出了规范和限制,强制企业在特定边界内存储数据或对要传输到境外的数据施加额外要求,以实现其关于数据传输的监管目标。如俄罗斯、澳大利亚等国为了保障数据的最高控制权,严格限制数据出境;欧盟等数据强严管地区,对数据出境目的国的数据监管水平提出了较高的要求[24]。据统计,全球范围内正在实施的关于数据的政策法规已超过 200项,而根据欧洲国际政治经济中心(ECIPE

的数据限制指数测算,全球对数据流动的总体限制在过去10年中翻了一番。

虽然限制数据的流动可能为一个国家或企业带来收益,但收益并没有那么普遍,限制可能不是实现一系列预期监管目标的最佳选择。允许数据流动和实现合法的监管目标之间不一定是零和博弈的关系,使用限制性措施前应更广泛地进行经济、法律和技术等方面的分析,通过构建完善的数据治理体系,从法律体制、经济环境、技术水平等多方面进行规范,实现数据自由流动与保护个人信息、维护网络安全以及保障执法部门基于正当程序访问数据等问题之间的平衡。

(3)数据治理与数据安全

信息技术和大数据应用的发展便捷了人们的工作和生活,但是大数据的广泛传播也带来了一定的风险,推销电话、电信诈骗层出不穷也都是由大家的私人数据被泄露导致的。2019年,Elasticsearch数据库 27亿个电子邮件地址被泄露,是目前网络安全历史上泄露数据规模最大的一次事故,仅在20191月,Elasticsearch数据

库就发生了5起数据泄露事件。数据安全成为大数据时代亟待解决的问题。

要保障数据安全,不仅要提高信息技术水平,还要在数据全生命周期对数据安全进行管理,这就需要构建完善的数据治理体系,从数据采集、治理、应用、运营各个阶段降低数据风险。数据安全管理流程如图 2-8所示。

image.png


2-8数据安全管理流程

 

数据治理通过数据的分类分级管控、严格的权限管理机制、完善的组织架构和监督评估体系,在数据的全生命周期,对数据风险进行评估和防控,完善数据

安全管理体系,提升数据安全管控水平,为数据应用和价值实现提供健康良好的管控环境。

(4)数据治理与共享开放

推动数据开放共享是国家大数据战略的核心内容。但在实施过程中,数据资源的价值具有隐藏性,研究人员需进行深度分析和挖掘,方能发现其潜在的价值。然而目前这一过程受到数据的完整性以及数据的访问权限等条件的制约,使得数据的应用价值受到极大的限制。很明显,只有开放的数据资源才能释放数据的价值。数据开放是大数据发挥其作用的基础。

数据开放共享面临着数据拥有者不愿、不敢、不会开放共享的问题[25]。这里面有政策的原因,更有技术的问题。截至 20144 月,已有 63个国家制定了政府数

据的开放计划,如美国、英国、法国等8个国家签署的《开放数据宪章》。我国国务

2015年印发《促进大数据发展行动纲要》,明确将政府数据的开放排在首位。然而数据开放带来的数据安全和隐私泄露的风险使得数据资源的开放变得越来

越困难。现行的数据管理技术是面向封闭式的数据自治的,不适合数据开放共享,急需开发面向数据开放共享的技术。数据自治开放为数据开放提供了新思路和新的解决办法。数据管理方式的变化将带来数据应用技术的巨大变革。

相关实践学习
简单用户画像分析
本场景主要介绍基于海量日志数据进行简单用户画像分析为背景,如何通过使用DataWorks完成数据采集 、加工数据、配置数据质量监控和数据可视化展现等任务。
SaaS 模式云数据仓库必修课
本课程由阿里云开发者社区和阿里云大数据团队共同出品,是SaaS模式云原生数据仓库领导者MaxCompute核心课程。本课程由阿里云资深产品和技术专家们从概念到方法,从场景到实践,体系化的将阿里巴巴飞天大数据平台10多年的经过验证的方法与实践深入浅出的讲给开发者们。帮助大数据开发者快速了解并掌握SaaS模式的云原生的数据仓库,助力开发者学习了解先进的技术栈,并能在实际业务中敏捷的进行大数据分析,赋能企业业务。 通过本课程可以了解SaaS模式云原生数据仓库领导者MaxCompute核心功能及典型适用场景,可应用MaxCompute实现数仓搭建,快速进行大数据分析。适合大数据工程师、大数据分析师 大量数据需要处理、存储和管理,需要搭建数据仓库?学它! 没有足够人员和经验来运维大数据平台,不想自建IDC买机器,需要免运维的大数据平台?会SQL就等于会大数据?学它! 想知道大数据用得对不对,想用更少的钱得到持续演进的数仓能力?获得极致弹性的计算资源和更好的性能,以及持续保护数据安全的生产环境?学它! 想要获得灵活的分析能力,快速洞察数据规律特征?想要兼得数据湖的灵活性与数据仓库的成长性?学它! 出品人:阿里云大数据产品及研发团队专家 产品 MaxCompute 官网 https://www.aliyun.com/product/odps 
相关文章
|
数据采集 存储 前端开发
关于数仓建设及数据治理的超全概括 (一)
本文分为两大节介绍,第一节是数仓建设,第二节是数据治理,内容较长,还请耐心阅读!
604 0
关于数仓建设及数据治理的超全概括 (一)
|
7月前
|
传感器 供应链 算法
数据管理如何实现可持续发展?
数据管理如何实现可持续发展?
|
11月前
带你读《构建企业级好数据(Dataphin智能数据建设与治理白皮书)》——(一)规划:数据体系(1)
带你读《构建企业级好数据(Dataphin智能数据建设与治理白皮书)》——(一)规划:数据体系(1)
285 0
|
11月前
|
存储 供应链 Java
带你读《构建企业级好数据(Dataphin智能数据建设与治理白皮书)》——(一)规划:数据体系(2)
带你读《构建企业级好数据(Dataphin智能数据建设与治理白皮书)》——(一)规划:数据体系(2)
277 0
|
11月前
|
供应链 数据库
带你读《构建企业级好数据(Dataphin智能数据建设与治理白皮书)》——(一)规划:数据体系(3)
带你读《构建企业级好数据(Dataphin智能数据建设与治理白皮书)》——(一)规划:数据体系(3)
242 0
|
数据管理 数据安全/隐私保护
数据治理晓说:(一)谈谈数据治理和公司治理的关系
下面内容讲的是数据治理与公司治理的关系。如何确保信息满足需求并将支持和授权管理人员正确有效的执行他们自己的角色。
数据治理晓说:(一)谈谈数据治理和公司治理的关系
|
存储 机器学习/深度学习 数据采集
谈谈数据湖分布式数据治理的数据目录应具备的四大能力【数据发现】
在过去几年中,数据湖已成为现代数据堆栈的必备要素。但是,虽然支持我们访问和分析数据的技术已经成熟,但在分布式环境中理解和信任这些数据的机制却落后了。
谈谈数据湖分布式数据治理的数据目录应具备的四大能力【数据发现】
|
数据采集 存储 监控
数据治理晓说:(三)谈谈“十四五”期间数据治理需要关注的六大趋势
数据治理的概念较早的起源于国外,近些年随着国内信息化的发展,逐步重视数据的共享和应用,随之发现了经常被提及的数据质量问题,从而也逐步开展起了数据治理项目。
数据治理晓说:(三)谈谈“十四五”期间数据治理需要关注的六大趋势
|
安全 大数据
带你读《数据自治》第二章数据治理2.4数据治理应用与发展(一)
带你读《数据自治》第二章数据治理2.4数据治理应用与发展
|
数据采集 大数据 数据安全/隐私保护
带你读《数据自治》第二章数据治理2.2数据治理体系(三)
带你读《数据自治》第二章数据治理2.2数据治理体系
带你读《数据自治》第二章数据治理2.2数据治理体系(三)