开放数据:数据也可以实行共产主义

本文涉及的产品
云原生大数据计算服务MaxCompute,500CU*H 100GB 3个月
简介:

大数据与开放数据有着千丝万缕的联系,但两者并不是一回事儿。开放数据为大数据的合理开发利用提供了一个新途径,并在一定程度上降低了大数据的风险。

  大数据是根据其体量来界定的,而开放数据的界定则是根据其用途。大数据指体量巨大、种类复杂,同时又在迅速变化的数据集。但这些关于大数据的评定具有很强的主观性,受限于人类现有的技术:随着数据分析和计算技术水平的发展,几年之后,我们现在所谓的大数据也就称不上是大数据了。

  开放数据是可利用的公共数据,个体、公司和机构都能根据这些数据进行投融资,分析其中的模式与趋势,根据数据进行决策,解决复杂棘手的问题。开放数据的定义有两个维度:一是数据对任何人公开,二是通过某种方式授权数据的再利用。除了“开放性”之外,开放数据的使用门槛也要相对降低。同时,人们就开放数据的费用问题已达成了基本共识,即免费或是尽量低的价格。

  大数据与开放数据的关联

  上面的维恩图展现了大数据与公开数据之间的关联,以及它们与广义上的政府公开数据之间的关系。这其中有几点需要重点介绍一下。

  只有开放的大数据才能称之为大众化、民主化的数据:其中的第一点包括了所有未公开的大数据--如零售巨头保留的顾客数据,或是NSA收集的国家安全数据。拥有此类数据的机构具有非对称的优势,却可能使剩下的我们毫无安全感可言。这一类数据所引起的争议也愈来愈大。

  开放数据不一定是大数据:正如图表中的第四点所示,公开化的少量数据也可能带来巨大的影响力。例如,地方政府公开的数据有助于公民更多地了解参与地方预算,选择医保方案,权衡地方服务水平,或是据此开发公共交通辅助app.

  大数据和开放数据并不一定来自于政府公开数据:如第三点所示,越来越多的科学家开始将航天、地理或其他领域的成果以一种新的,合作研究的方式共享。另外还有其他一些研究人员利用社交媒体上的数据--其中大部分都是公开的--分析舆情和市场趋势。

  政府一旦把它所掌握的大数据公开化,这将会给整个社会带来不可估量的影响:政府机构有足够的能力和资金收集大量数据(如图表中的第六点所示),此类数据库的公开将会带来巨大的经济效益。根据现有的资料,在美国,大约有500家企业利用政府公开数据进行商业运作,而其中的多数数据是大数据。

  利用开放数据的原则去开发大数据可以解决大数据所面临的很多问题。其中最重要的一点便是隐私性个人化数据的开发利用可能难以得到数据主体,亦即我们自身的许可和认可。而将敏感数据以特定方式,或可控的方式公开化,可能会在一定程度上提高数据的安全性。

  因此,目前的问题不仅是政府和某些商业机构一直在收集个人信息,而更严峻的是,我们对于自身的哪些数据被收集一无所知,也无权查看被收集的数据。如果我们了解得更多,我们可控的也就更多。英国政府制定的midata计划,鼓励大型商业机构与顾客共享其用户数据,这不失为开放数据的创新性举措。美国也有类似的项目,如Blue Button医疗数据公开方案,以及Green Button能源使用数据方案,这些都收到了积极效果。

  大数据与开放数据都将会对商业、政府和社会带来革命性的影响,而两者相结合的潜力更是不可估量。大数据赋予我们理解分析,并最终改变世界的能力。开放数据将这种能力公开共享--被我们所改变的世界将朝着更加公平、更加民主的方向发展。


原文发布时间为:2014-05-05


本文来自云栖社区合作伙伴“大数据文摘”,了解相关信息可以关注“BigDataDigest”微信公众号

相关实践学习
基于Hologres轻松玩转一站式实时仓库
本场景介绍如何利用阿里云MaxCompute、实时计算Flink和交互式分析服务Hologres开发离线、实时数据融合分析的数据大屏应用。
基于MaxCompute的热门话题分析
Apsara Clouder大数据专项技能认证配套课程:基于MaxCompute的热门话题分析
相关文章
|
10月前
太便利了 !通义灵码方便生成html页面
太便利了 !通义灵码方便生成html页面
255 0
|
11月前
|
SQL 大数据
大数据-141 - ClickHouse 集群 副本和分片 Zk 的配置 Replicated MergeTree原理详解(二)
大数据-141 - ClickHouse 集群 副本和分片 Zk 的配置 Replicated MergeTree原理详解(二)
260 0
|
Nacos 开发者
nacos报错 Server check fail, please check server 127.0.0.1 ,port 9848 is available , error ={}
在配置文件中指定的Nacos服务器地址未被项目使用,程序仍尝试连接到127.0.0.1。开发者寻求帮助排查问题,已花费多天未果。
|
存储 机器学习/深度学习 人工智能
未来已来:AI技术的最新趋势与前沿探索
【7月更文第20天】在这个日新月异的时代,人工智能(AI)已经从科幻概念逐渐深入到我们日常生活的方方面面,其发展速度之快超乎想象。从基础的语音识别、图像分析到复杂的决策制定、自动驾驶,AI技术正以前所未有的力量推动着社会进步。本文将带您一同展望AI技术的未来发展方向,深入探讨量子计算、生物计算等新兴领域的前沿探索,以及它们如何重新定义AI的边界。
721 0
|
关系型数据库 MySQL Linux
CentOS7.9 安装 mysql-8.0.36 踩坑小记
CentOS7.9 安装 mysql-8.0.36排错指南
911 1
|
人工智能 自然语言处理
💡脑洞大开!生成式大模型提示词工程,解锁AI创作新维度的钥匙🗝️🌟
【8月更文挑战第1天】在今日科技与创意交织的世界里,生成式大模型如GPT系列、Stable Diffusion等,宛如通往未知世界的神秘大门。提示词工程则是开启这扇大门的钥匙,引领我们步入AI创作的新维度。通过巧妙设计提示词,可以引导AI探索传统手段难以触及的领域。例如,为了创作一幅“梦境与现实交织的城市”,基础提示词可能不足以激发AI的创造力。而优化后的提示词通过增加细节描述,不仅能提供更丰富的素材,还能激发AI探索更复杂主题的能力。在这个时代,提示词工程为我们打开了AI创作的新大门,让我们能够携手AI创造超越想象的作品,共同书写创意传奇。
252 7
|
存储 网络协议 安全
字符编码技术专题(一):快速理解ASCII、Unicode、GBK和UTF-8
今天中午,我突然想搞清楚 Unicode 和 UTF-8 之间的关系,就开始查资料。 这个问题比我想象的复杂,午饭后一直看到晚上9点,才算初步搞清楚。 下面就是我的总结,主要用来整理自己的思路。我尽量写得通俗易懂,希望能对其他朋友有用。毕竟,字符编码是计算机技术的*石,对于程序员来说尤其重要,字符编码的知识是必须要懂的。
210 0
|
SQL 关系型数据库 MySQL
[MySQL]一文带你学明白数据库控制语言——DCL
嗨咯,小伙伴大家好呀!好几天没见了,周末过得怎么样啊!之前学过的SQL语句不会都忘了吧。如果忘了的话大家可以看一下前几期的文章。本期要学习的是SQL语句中的数据库控制语句——DCL,学习完毕之后MySQL中的SQL语句也就结束了。
375 0
|
数据采集
LabVIEW虚拟数字示波器
本篇博文将设计一款虚拟示波器(简易版+复杂版),不依托外部设备,通过LabVIEW内置的信号发生VI,生成各类型波形,通过上位机软件可以对波形进行分析。当然,感兴趣的朋友也可以参照之前博文项目进行修改,将生成波形信号的功能,替换为采集实际设备,实现对实际设备数据的采集和分析。