带你读《数据自治》第二章数据治理2.1数据治理概述(一)

简介: 《数据自治》第二章数据治理2.1数据治理概述

2.1      数据治理概述

 


大数据时代的到来为各行各业带来的不仅仅是对大数据技术和设施的需求,更重要的是带来了基于数据资源进行业务创新、管理创新和服务创新的契机,但如果缺乏有效的治理,海量数据只会成为负担。各行各业都面临着数据治理体系构建困难、数据标准体系不够完善、数据安全及质量管理有待深入、数据共享应用水平较低等多种问题。目前,世界各国在数据治理领域开展了大量有意义的工作,并已取得了一定成效。我国也积极开展数据治理建设,通过立法和市场引导,推进各领域数据的规范和治理,深化数据应用,发挥数据的潜在价值。

 

2.1.1         数字全球化面临的挑战

 

伴随着现实世界的数字化变革,政治、经济、文化、社会等各方面的全球化进程不断加速。数据的开放、流动、共享、融合颠覆了传统的产业形态和边界,改变了多个行业和领域的关键流程,推动了大规模跨产业、跨地域的协同和创新,创造出了更多的战略选择空间。越来越多的机构将与境外机构在技术、产业、商务领域进行深度合作,这些都涉及大量的跨境数据交换和应用,物理距离已不再是社会经济发展的障碍。数字全球化推动了各个领域的发展,创造出了巨大的经济利益和文化价值。


大数据蕴含的价值引起了各国政府的高度关注,开发利用大数据蕴含的价值成为国家战略的新内容,各国围绕网络空间和数据资源展开了战略竞争。同时,由于各国相关法律制度体系尚未健全,数字全球化发展过程中遇到了许多的挑战和问题,其中数据主权保护、数据生产要素价值实现、数据安全和个人隐私保护是非常重要和常见的 4 个问题。

(1)数据主权保护

丰富的数据资源蕴含着科技动态、社会动态、市场变化、国家安全威胁预警和军事行动等各种信息,成为与土地、资本、人力同样重要的战略资源。一个国家拥有的数据规模及对数据的运用能力是其综合国力的重要体现,数据主权成为国家整体主权必不可少的一部分。

大数据时代的数据不再像传统技术时代那样在数据拥有者的可控范围之内,各国政府出于国家利益需要而大量获取数据,有些国家甚至立法授权跨国数据获取,数据强国和数据弱国之间存在明显的权力差异。面向全球范围的云计算也增加了数据泄露和转移的风险,虽然很多国家对一些重要数据的境外存储和跨国传输有规定,然而云计算使这些规定难以执行,数据可能会在不同国家的云之间进行传输,数据存储的地点往往也难以确定。数据主权保护面临着严峻挑战,这些挑战对国家安全与国家主权保护造成了严重威胁。当数据主权无法得到保护时,个人、组织、国家的秘密与利益将受到严重的侵害,数字化也将失去其发展的沃土,甚至可能造成多方争端,引发新一轮的信息化战争。


(2)数据生产要素价值实现

在信息化发展的过程中,互联网、大数据、物联网、人工智能等新兴信息技术成为社会生产发展的主要引擎,数据作为信息技术的基础,数据资源及对其利用的能力逐渐成为提升核心竞争力的关键要素。202049日,国务院在《关于构建更加完善的要素市场化配置体制机制的意见》中首次将数据纳入生产要素范畴,数据价值的实现关系到社会经济发展的进程。

目前对数据价值的挖掘必须建立在质量可靠的数据之上,建立在低质量甚至错误数据之上的应用有可能与其初心背道而驰。因此,数据质量成为实现数据价值的决定性因素之一。影响数据质量的因素包括管理和技术两个方面,数据生命周期的每个阶段都有可能产生数据质量问题,特别是数据采集和整合阶段。

     在数据质量管理方面,缺乏完善的数据质量管理体系使组织无法规范化、常态化地开展数据质量提升工作,不能从评估数据质量管理能力、指导数据质量管理体系的运行、监督数据质量问题的发现和改进等方面为信息系统提供高质量的数据支持。在数据质量提升技术方面,缺乏有效的数据质量提升技术和工具,这将会影响数据质量提升模型的构建及数据质量规则算法的配置,无法实现具体数据处理算法对应的质量评估、规则集合、扫描诊断、数据修复等功能,影响数据质量提升的水平和效率。数据质量的不稳定将使数据的可信度大大降低,失去数据的应用价值。因此,如何提升数据质量,发挥数据要素在社会生产中的作用,成为数字全球化浪潮中必须解决的问题。


(3)数据安全

从计算机病毒到网络黑客,从技术性故障到有组织攻击,从窃取个人数据到大规模数据泄露,大数据时代的信息安全问题依然存在,并更加聚焦于数据安全领域。数据将现实社会与虚拟社会连接在一起,将传统安全与非传统安熔为一炉导致数据安全面临前所未有的挑战。

大数据成为黑客攻击的显著目标。一方面,大数据意味着大规模的数据,也意味着更复杂、更敏感的数据,通过对数据进行融合分析可以获得一些敏感和有价值的数据,这些数据会吸引更多的潜在攻击者;另一方面,数据的大量汇集导致黑客在将数据攻破之后会以此为突破口获取更多有价值的信息,这无形中降低了黑客的进攻成本,提高了性价比

大数据的多源异构和动态应用增大了数据保护的难度。大数据平台通常建立各自独立的数据管理机制,众多分散的数据源无法进行相对集中的安全域管理,需要投入大量的安全保护资源。同时,数据的动态利用使得数据利益相关者增多,数据的全生命周期运转也使得数据流经的组织增多,涉及数据采集者、数据控制者、数据处理者、数据主体等,一旦出现数据安全问题,难以快速辨识责任主体,并采取有效的处理措施,带来的损失可能无法弥补。


(4)个人隐私保护

信息技术的发展使得数据资源的经济价值不断提升,尤其是个人数据,包括个人的基本信息、标签信息、消费数据等。个人数据能为组织带来巨大的经济利益,也是国家公民基础信息资源的重要组成部分。个人数据的重要性和数据流动的广泛性使得个人数据面临着极高的风险,而针对个人数据保护的相关法律法规并不健全,同时现有法规的落地实施存在监管困难的问题。当前社会通用的传统收集公开原则

和安全保障原则过于泛化,并不能对个人隐私数据起到有效、全面的保护作用[1]。数据主体对数据的控制权严重被削弱[2],主要表现为数据主体在接收信息上的不对称。在信息技术的催化下,数据主体对于数据何时、何地、被何人、以何种方式获取并利用可能毫不知情。近年来,较多地区和国家对个人数据权属进行了法律上的保护,如欧盟的《通用数据保护条例》(General Data Protection RegulationGDPR、美国的《加利福尼亚州消费者隐私法案》等,我国也将在2020年制定《个人信息保护法》。但是总体来看,较多国家和地区仍旧缺乏对数据主体权利的立法保护,数据权属的纠纷层出不穷。

通知同意规则难以有效执行。通知同意规则是指在收集、处理数据时须事先告知用户,并得到用户的明示或者默示的许可。虽然当前个人数据保护立法的核心规则都含有通知同意规则,但是规则的执行情况并不尽如人意。移动应用在便捷人们生活的同时,默认征询个人数据、过度索取个人权限、明文存储个人信息、私自共享用户数据和设置注销限制条件等行为[3]都是对个人数据权利的侵犯,威胁着个人数据安全。

相关实践学习
简单用户画像分析
本场景主要介绍基于海量日志数据进行简单用户画像分析为背景,如何通过使用DataWorks完成数据采集 、加工数据、配置数据质量监控和数据可视化展现等任务。
SaaS 模式云数据仓库必修课
本课程由阿里云开发者社区和阿里云大数据团队共同出品,是SaaS模式云原生数据仓库领导者MaxCompute核心课程。本课程由阿里云资深产品和技术专家们从概念到方法,从场景到实践,体系化的将阿里巴巴飞天大数据平台10多年的经过验证的方法与实践深入浅出的讲给开发者们。帮助大数据开发者快速了解并掌握SaaS模式的云原生的数据仓库,助力开发者学习了解先进的技术栈,并能在实际业务中敏捷的进行大数据分析,赋能企业业务。 通过本课程可以了解SaaS模式云原生数据仓库领导者MaxCompute核心功能及典型适用场景,可应用MaxCompute实现数仓搭建,快速进行大数据分析。适合大数据工程师、大数据分析师 大量数据需要处理、存储和管理,需要搭建数据仓库?学它! 没有足够人员和经验来运维大数据平台,不想自建IDC买机器,需要免运维的大数据平台?会SQL就等于会大数据?学它! 想知道大数据用得对不对,想用更少的钱得到持续演进的数仓能力?获得极致弹性的计算资源和更好的性能,以及持续保护数据安全的生产环境?学它! 想要获得灵活的分析能力,快速洞察数据规律特征?想要兼得数据湖的灵活性与数据仓库的成长性?学它! 出品人:阿里云大数据产品及研发团队专家 产品 MaxCompute 官网 https://www.aliyun.com/product/odps 
相关文章
|
数据采集 存储 分布式计算
一篇文章搞懂数据仓库:数据治理(目的、方法、流程)
一篇文章搞懂数据仓库:数据治理(目的、方法、流程)
一篇文章搞懂数据仓库:数据治理(目的、方法、流程)
|
数据采集 监控 数据管理
《阿里云数据治理方案及案例分享》|学习笔记
快速学习《阿里云数据治理方案及案例分享》
1504 0
|
10月前
|
数据采集 存储 监控
数据治理:管理和保护数据的最佳实践
随着企业日益依赖数据来驱动业务决策和创新,数据治理成为一个至关重要的话题。数据治理是指规范、管理和保护数据资产的过程,以确保数据质量、合规性和安全性。在本文中,我们将探讨数据治理的重要性以及一些实施数据治理的最佳实践。
222 0
|
11月前
|
网络虚拟化
带你读《全链路数据治理-全域数据集成》之20:6. 附录
带你读《全链路数据治理-全域数据集成》之20:6. 附录
122 0
|
11月前
|
弹性计算 数据库
带你读《全链路数据治理-全域数据集成》之21:7. 后续步骤
带你读《全链路数据治理-全域数据集成》之21:7. 后续步骤
109 0
|
11月前
|
数据采集 架构师 数据管理
「数据架构」:建立企业数据管理的综合策略 执行概述
「数据架构」:建立企业数据管理的综合策略 执行概述
|
存储 数据采集 编解码
谈谈数据管理中的数据治理和元数据
数据治理是数据管理策略中最基本的功能,因为它是其他功能的中心和领导。在这里,我们应该对两个经常被误解的概念进行区分:
谈谈数据管理中的数据治理和元数据
|
存储 机器学习/深度学习 数据采集
谈谈数据湖分布式数据治理的数据目录应具备的四大能力【数据发现】
在过去几年中,数据湖已成为现代数据堆栈的必备要素。但是,虽然支持我们访问和分析数据的技术已经成熟,但在分布式环境中理解和信任这些数据的机制却落后了。
谈谈数据湖分布式数据治理的数据目录应具备的四大能力【数据发现】
|
数据管理 大数据
带你读《数据自治》第二章数据治理2.1数据治理概述(三)
带你读《数据自治》第二章数据治理2.1数据治理概述(三)
带你读《数据自治》第二章数据治理2.1数据治理概述(三)
|
数据采集 传感器 城市大脑
带你读《数据自治》第二章数据治理2.1数据治理概述(二)
《数据自治》第二章数据治理2.1数据治理概述(二)
带你读《数据自治》第二章数据治理2.1数据治理概述(二)