大数据陷阱:谁有权享有大数据,谁有权分析大数据

本文涉及的产品
云原生大数据计算服务 MaxCompute,5000CU*H 100GB 3个月
云原生大数据计算服务MaxCompute,500CU*H 100GB 3个月
简介:

既要保持数据的自由流动性,又要维护每个主体在数据上的权益,这是个空前的法律难题。而创制和维护这样的数据利用秩序却是大数据应用的前提,是大数据战略得以实施的根本保证

中国信息通信研究院在第十六届中国互联网大会上发布的《中国数字经济发展白皮书(2017)》指出,2016年中国数字经济总量达到22.6万亿元,同比名义增长接近19%,占GDP的比重超过30%,同比提升2.8个百分点。数字经济已成为近年来带动经济增长的重要动力。

人类已经进入到了一个无商不利用数据,无领域(包括政府)不利用数据的时代。无论你利用数据赚钱也好,还是希望改善公共服务和社会治理也好,大家共同面临一个法律上难题:谁有权享有数据?享有什么内容和程度的数据权利?如何保护数据?数据的权益属性?类似的问题,还没有得到很好的智库研究,也未能提供很好的有效政策建议。本文提出五个智库观点,供决策依据考虑。

经过处理的大数据才有价值

大数据是来源于网络和各种传感器对特定对象的记录,它是关于人、组织和物(机器和自然界)在特定时间、地点的行为、过程、事件的事实数据。作为技术,大数据是抓取和分析世界和人们生活的一种数据技术,它使人类具有全过程、全方位记录各种事件和行为的能力,具有透析过去和预测未来的能力。

在大数据时代,任何数据均具有潜在的价值。在过去人们重复利用的数据资源主要是人类观察、思考、创作完成的成果,比如文章、文件、论文、著作等,而如今人类可以利用各种机器运行轨迹、人类活动记录、自然界变化观测等信息,过去需要大量观察访谈、调查统计、测量等完成的,现在可以借助计算机系统、各种数据采集器完成,并通过大数据分析工具实现全样本、自动化处理和分析。在过去,没有人在意我们自己的行为轨迹,也无法记录大量的事件和过程,可以说作为“垃圾”自觉或不自觉地扔掉了,而现在的数据技术使我们具有变废为宝的能力,因而大数据技术可以说是一种在浩瀚的数据海洋中发现“宝贝”的技术。

正因此,数据正在成为人类可拥有和控制的资源。我们已经进入到数据生存时代,大数据正在提供新的研究范式,重新认识宇宙、物质、生命和社会,并在此基础上带来科技技术、管理决策、社会发展的巨大变革。如今我们提到的智能制造、人工智能、机器学习、分享经济、个人性化定制或服务等技术和商业模式的创新无不建立在数据资源基础上。著名大数据公司Gartner认为,大数据是需要新处理模式才能具有更强的决策力、洞察发现力和流程优化能力的海量、高增长率和多样化的信息资产。可以毫不夸张地说,未来经济和社会发展是建立在大数据技术普遍应用基础上,数据不仅成为经济创新转型发展的引擎,而且是所有企业市场竞争的重要资源。因而,数据利用秩序成为未来社会的第一秩序。

传统的财产权不适合大数据

如果说所有权(排他支配权)是构筑物质资源利用秩序的法律工具的话,那么它是否可以移植到数据世界,建构数据的利用秩序呢?答案是否定的。这是因为数据的非物质性,很难实现排他使用。其一,数据使用的非排他性,一个占有使用并不妨害他人占有使用;其二,数据使用具有非消耗性,数据的使用不消耗本体,反而丰富数据,使数据具有新含义或增值。因而数据天然地不适合于所有权体系,通过数据上设置排他支配权不适用于大数据时代。

在《民法总则》制定过程中,数据信息曾被纳入知识产权的客体,试图设立类似知识产权的专有权,但最终出台的《民法总则》并没有将数据信息列为知识产权的客体。这是因为,大数据背景下的数据更多的是事实记录,其数据的收集(采集)和聚合本身并不能实质性改变数据的价值。数据具有价值或者能够实现价值需要一系列的筛选、分类、处理、合并,形成主体数据、专题数据,使数据变成可用的数据产品,通过数据产品交易或服务,实现数据的价值。那么,数据产品化或商品化的过程,是否可以被赋予类似于知识产权的专有权呢?

知识产权是保护创造性劳动成果的一种制度,而创新劳动成果多表现为思想、技术方法、标识等,而这些离不开信息或数据。不过,知识产权并没有建立对创新成果(思想或信息)本身的支配权,而是将思想或信息置于公共领域,仅赋予权利人一定期间的商业化使用创新成果的专有权。也就是说,在知识产权体系下,仍然坚持信息(思想)公开和自由原则,数据及其所承载的科学文化成果被认为是社会活动的公共要素,置于公共领域。

显然,在大数据时代,我们仍然应当坚持将数据产品或信息视为公共资源的原则,而不允许信息私权化或成为私权客体。因为这样会妨碍科学文化进步,妨碍社会正常交往和运行。数据赋权仍然应当坚持数据的公共资源属性,不应当赋予数据持有者对数据的所有权,我们也不应当突破知识产权制度理念和框架,赋予数据持有人对数据本身的某种支配权。

因此,无论以有形物为基础财产权,还是以无形物为基础财产权体系,均难以解决数据时代的数据利用秩序问题。

数据该如何赋权

数据从原生数据到有价值的数据产品需要投入,这不仅仅是劳动投入,而且还有资本投入,而只有当这些投入得到足够的回报时,才有人从事数据的收集、处理和加工,将数据转化为产品或服务。解决数据产品制作者激励是数据赋权要解决的核心问题。

根据前面的论述,即使是数据产品,也要保持社会公众对该产品的可接触或可学习的公共属性,仅仅赋予数据产品制作者以商业化使用数据产品的权利。数据产品的制作者权利应当包括自己使用和许可他人使用的权利,或者利用数据提供服务的权利,同时有权制止他人商业目的的使用该数据产品的权利。这种基于对于数据分析加工劳动而取得的数据使用,属于一种新类型财产权,不妨可以称为数据使用权。它区别于传统的物权之处,在于它不是对数据的支配权,而区别于传统知识产权之处在于,它并不要求独创性或创新性。这样,可以给数据产品制作者实现其收集和加工数据的激励,促进数据产品的生产和流通,满足社会对数据产品的需要。这里赋权的正当性在于保护数据上存在合法利益,使数据产品持有人可以收回劳动投入甚至获取利润,但并不能绝对地排除他人使用相同的数据。当然,如何确保数据产品制作者商业化使用权,又使数据保持一定的开放性,使公众可获取性,需要精细的法律制度设计。

数据主体利益的保护原则

在大数据环境下,一切数据皆有源。当数据来源于个人或者是对个人的描述时,就落入个人数据(又称个人信息)范畴。个人数据包含隐私信息(个人的私密信息),隐私保护成为个人数据保护的重要组成部分。在这方面,国际社会关于个人数据使用的总体原则是合法、正当和必要原则,以不侵犯个人尊严或自由等基本权益,尤其是隐私利益为基本限制,只有法律规定的敏感信息需要征得个人的同意,而一般的个人信息则并不需要个人同意。我国现行规则为,除遵循合法、正当和必要原则外,还必须征得个人的同意,似乎给了个人对个人信息的控制权。这与个人信息的多样化或多种法律属性(许多个人信息是可以公开的并为企业组织使用的)事实不吻合。其实,仅仅识别特定个人并不足以给个人以对该信息享有支配权,个人信息仍然是社会交往的工具。但是,个人信息的收集和使用必须尊重个人权利,必须确保个人知情和在必要时的干预(更正、删除等)。

除了来源于个人外,企业数据还需要获得其他企业和社会组织的数据。除非这些数据是置公开的可供他人自由获取的状态(成为公共数据),那么取得这些组织的数据也需要获得数据实际控制人的同意,而不能够随意抓取、窃取或采取其他非法手段获得。数据产品制作者权益的保护是建立在合法取得数据的基础上。这种合法取得实际上也意味着法律对数据来源者利益的保护。在此方面除了保护个人信息外,还有企业信息的保护问题。

大数据应用最关键的是取得尽可能大而全的数据,而为取得他人的数据就必须合法合规,其中最为重要的是尊重和保护个人信息权益。由此,数据利用秩序归根结底是要建立数据来源方(原材料提供者)到收集加工制作方(制作者)再到数据方(消费者)有关于数据权利和义务配置秩序,在保护各方权益的前提下,保持数据开放性和流通性,使数据得到社会化的利用,实现数据的价值。

数据利用秩序关系大数据战略

在过去,数据被作为公共资源,甚至许多数据被作为垃圾随意地丢弃了,没有讨论数据产权问题。但是,随着数据价值的重新发现,随着人们对数据掌控能力的提高,数据逐渐地成为可控制的对象了。在数据可控制的情形下,要让人们掌握的数据拿出来分享和利用就必须要有激励,就必须创制数据社会化利用的秩序。《国家信息化发展战略纲要》明确提出要“探索建立信息资产权益保护制度”。由于数据本身仍然需要保持一定公共性,赋予任何主体对数据和数据产品的绝对支配权,都背离人类社会发展的基本理念,因而数据赋权,仍然应当坚持信息自由原则。

数据总是处于不断地脱离原来主体而流动,而正因为这样的流动,才使数据产生价值,但脱离主体也意味着原主体丧失对数据的控制。既要保持数据的自由流动性,又要维护每个主体在数据上的权益,这是个空前的法律难题。而创制和维护这样的数据利用秩序却是大数据应用的前提,是大数据战略得以实施的根本保证。

本文转自d1net(转载)

相关实践学习
基于MaxCompute的热门话题分析
本实验围绕社交用户发布的文章做了详尽的分析,通过分析能得到用户群体年龄分布,性别分布,地理位置分布,以及热门话题的热度。
SaaS 模式云数据仓库必修课
本课程由阿里云开发者社区和阿里云大数据团队共同出品,是SaaS模式云原生数据仓库领导者MaxCompute核心课程。本课程由阿里云资深产品和技术专家们从概念到方法,从场景到实践,体系化的将阿里巴巴飞天大数据平台10多年的经过验证的方法与实践深入浅出的讲给开发者们。帮助大数据开发者快速了解并掌握SaaS模式的云原生的数据仓库,助力开发者学习了解先进的技术栈,并能在实际业务中敏捷的进行大数据分析,赋能企业业务。 通过本课程可以了解SaaS模式云原生数据仓库领导者MaxCompute核心功能及典型适用场景,可应用MaxCompute实现数仓搭建,快速进行大数据分析。适合大数据工程师、大数据分析师 大量数据需要处理、存储和管理,需要搭建数据仓库?学它! 没有足够人员和经验来运维大数据平台,不想自建IDC买机器,需要免运维的大数据平台?会SQL就等于会大数据?学它! 想知道大数据用得对不对,想用更少的钱得到持续演进的数仓能力?获得极致弹性的计算资源和更好的性能,以及持续保护数据安全的生产环境?学它! 想要获得灵活的分析能力,快速洞察数据规律特征?想要兼得数据湖的灵活性与数据仓库的成长性?学它! 出品人:阿里云大数据产品及研发团队专家 产品 MaxCompute 官网 https://www.aliyun.com/product/odps 
相关文章
|
2月前
|
机器学习/深度学习 算法 搜索推荐
从理论到实践,Python算法复杂度分析一站式教程,助你轻松驾驭大数据挑战!
【10月更文挑战第4天】在大数据时代,算法效率至关重要。本文从理论入手,介绍时间复杂度和空间复杂度两个核心概念,并通过冒泡排序和快速排序的Python实现详细分析其复杂度。冒泡排序的时间复杂度为O(n^2),空间复杂度为O(1);快速排序平均时间复杂度为O(n log n),空间复杂度为O(log n)。文章还介绍了算法选择、分而治之及空间换时间等优化策略,帮助你在大数据挑战中游刃有余。
67 4
|
27天前
|
存储 机器学习/深度学习 SQL
大数据处理与分析技术
大数据处理与分析技术
93 2
|
2月前
|
SQL 消息中间件 分布式计算
大数据-124 - Flink State 01篇 状态原理和原理剖析:状态类型 执行分析
大数据-124 - Flink State 01篇 状态原理和原理剖析:状态类型 执行分析
72 5
|
16天前
|
机器学习/深度学习 存储 大数据
在大数据时代,高维数据处理成为难题,主成分分析(PCA)作为一种有效的数据降维技术,通过线性变换将数据投影到新的坐标系
在大数据时代,高维数据处理成为难题,主成分分析(PCA)作为一种有效的数据降维技术,通过线性变换将数据投影到新的坐标系,保留最大方差信息,实现数据压缩、去噪及可视化。本文详解PCA原理、步骤及其Python实现,探讨其在图像压缩、特征提取等领域的应用,并指出使用时的注意事项,旨在帮助读者掌握这一强大工具。
33 4
|
17天前
|
关系型数据库 分布式数据库 数据库
PolarDB 以其出色的性能和可扩展性,成为大数据分析的重要工具
在数字化时代,企业面对海量数据的挑战,PolarDB 以其出色的性能和可扩展性,成为大数据分析的重要工具。它不仅支持高速数据读写,还通过数据分区、索引优化等策略提升分析效率,适用于电商、金融等多个行业,助力企业精准决策。
30 4
|
18天前
|
机器学习/深度学习 分布式计算 算法
【大数据分析&机器学习】分布式机器学习
本文主要介绍分布式机器学习基础知识,并介绍主流的分布式机器学习框架,结合实例介绍一些机器学习算法。
111 5
|
1月前
|
存储 监控 数据挖掘
【Clikhouse 探秘】ClickHouse 物化视图:加速大数据分析的新利器
ClickHouse 的物化视图是一种特殊表,通过预先计算并存储查询结果,显著提高查询性能,减少资源消耗,适用于实时报表、日志分析、用户行为分析、金融数据分析和物联网数据分析等场景。物化视图的创建、数据插入、更新和一致性保证通过事务机制实现。
113 14
|
1月前
|
消息中间件 分布式计算 大数据
数据为王:大数据处理与分析技术在企业决策中的力量
【10月更文挑战第29天】在信息爆炸的时代,大数据处理与分析技术为企业提供了前所未有的洞察力和决策支持。本文探讨了大数据技术在企业决策中的重要性和实际应用,包括数据的力量、实时分析、数据驱动的决策以及数据安全与隐私保护。通过这些技术,企业能够从海量数据中提取有价值的信息,预测市场趋势,优化业务流程,从而在竞争中占据优势。
85 2
|
1月前
|
数据采集 机器学习/深度学习 搜索推荐
大数据与社交媒体:用户行为分析
【10月更文挑战第31天】在数字化时代,社交媒体成为人们生活的重要部分,大数据技术的发展使其用户行为分析成为企业理解用户需求、优化产品设计和提升用户体验的关键手段。本文探讨了大数据在社交媒体用户行为分析中的应用,包括用户画像构建、情感分析、行为路径分析和社交网络分析,以及面临的挑战与机遇。
|
1月前
|
机器学习/深度学习 搜索推荐 大数据
大数据与教育:学生表现分析的工具
【10月更文挑战第31天】在数字化时代,大数据成为改善教育质量的重要工具。本文探讨了大数据在学生表现分析中的应用,介绍学习管理系统、智能评估系统、情感分析技术和学习路径优化等工具,帮助教育者更好地理解学生需求,制定个性化教学策略,提升教学效果。尽管面临数据隐私等挑战,大数据仍为教育创新带来巨大机遇。