数据不是新的石油或数字经济的基础设施

简介: 有人声称数据是“新的石油”。有人声称数据是基础设施。这两个断言都是错误的。

世界充满了数据。在2017年的每一分钟里,美国人使用超过260万千兆字节的数据,天气频道收到超过1800万的预测请求。YouTube观看者观看了超过400万的视频。推特用户发送了超过44.6万条推文。谷歌进行了超过360万次的搜索。


全球90%以上的数据是在过去两年中创造的——每天超过2.5个五万亿字节的数据。随着物联网在日常物品的传感设备中收集的数据越来越多,数据量将只增不减。


所有这些数据带动了数字经济,使我们生活的方方面面都更丰富,更多彩,更有趣,更富有成效。在当今的全球信息经济中,我们离不开它。


为了强调数据对数字经济做出的这一独特的贡献,很多评论家已经开始将数据称为新的石油。 例如,《经济学人》把数据描述为“数字时代的石油”。但正如欧洲监管中心所说,这种“数据和石油之间的常见类比是具有误导性的”。


它们之间有什么区别呢?数据可以反复使用。它不会一次性用完。一家公司可能会使用2017年1月17日的收盘价的道琼斯平均指数来评估埃及的政治风险;另一种算法将其用于情感分析,第三种算法可以用来作为推出新产品或服务的营销计划的输入。


相反,石油是有限的有形物质。使用它一度意味着用光它;它被提炼、加工、燃烧,然后消失。人们上班所使用的一加仑汽油不能再用来让他们回家。


此外,石油和信息的不同之处在于它们在隔离和控制上的难易程度。石油的有形物理性质意味着它很容易受到控制,并排除其他人使用它。


但是信息不是那样的。很多有价值的数据集随处可得。例如,公众可以轻松地访问在线商家收取的价格,任何想要设计定价算法的人都可以使用这些信息。Fitbit可以访问用户的身体信息,但是它不能阻止他们使用另外一种可以测量他们锻炼模式的设备。


企业有时可能会使用技术,法律和合同方面的障碍来阻止人们访问他们收集的数据,但这些信息往往可以从其它来源收集。宽带提供商和银行不会让其他人从他们的数据库中提取客户的电子邮件地址。但用户可以将这些信息提供给很多其它的公司和机构。


用户通常使用同一服务的多个提供者。据德勤称,81%的用户使用多种在线购物服务,74%的用户使用多个在线新闻提供者,72%的用户使用多种在线旅游服务,70%的用户使用多种电子邮件,即时消息或视频通话服务。这些替代供应商可以获取有关其客户的非常相似的行为和偏好数据。


《经济学人》在经济观点上非常老练,它承认数据不存在竞争,但他们认为这只对一些隐私保护的传统版本的挑战。更深远的意义在于经济:数据的不可穷尽性和非排他性意味着竞争对手可以收集和使用他们参与竞争时所需要的数据。


数据集的充足供应和可复制性也颠覆了数据是新基础设施的想法。例如,经济合作与发展组织(OECD)认为应该将数据视为“达到多个目的的共享手段”,因为广泛的生产活动“需要”数据作为投入。


但是出于同样的原因,数据不是石油,不是基础设施。丰富的有价值的数据通常可用于公共用途。此外,没有数据集是必不可少的。总是有替代数据集可以复制专有数据的经济职能。


有些物理设施,如道路、水和电力供应必须共享,因为它们对于社会中的人们和组织想做的任何事情都是必不可少的。互联网本身以及支持互联网的物理通信渠道都是如此。但是因使用互联网产生的数据集以及位于其上方的应用程序并不是这样的。它们本身并不是基本的基础设施的一部分。数据是沿着通信信道流动的流量,但它本身不是通信信道。


数据无处不在。它是丰富的,不是稀缺的。数字经济离不开它。但它不是石油,也不是基础设施。

相关文章
|
存储 缓存 NoSQL
深入理解Django与Redis的集成实践
深入理解Django与Redis的集成实践
427 0
|
2月前
|
机器学习/深度学习 人工智能 运维
运维告警别乱飞了!AI智能报警案例解析
运维告警别乱飞了!AI智能报警案例解析
351 0
|
2月前
|
人工智能
AI推理方法演进:Chain-of-Thought、Tree-of-Thought与Graph-of-Thought技术对比分析
大语言模型推理能力不断提升,从早期的规模扩展转向方法创新。2022年Google提出Chain-of-Thought(CoT),通过展示推理过程显著提升模型表现。随后,Tree-of-Thought(ToT)和Graph-of-Thought(GoT)相继出现,推理结构由线性链条演进为树状分支,最终发展为支持多节点连接的图网络。CoT成本低但易错传,ToT支持多路径探索与回溯,GoT则实现非线性、多维推理,适合复杂任务。三者在计算成本与推理能力上形成递进关系,推动AI推理向更接近人类思维的方向发展。
220 4
|
Web App开发 移动开发 JavaScript
探索浏览器内核:理解网络世界的幕后英雄
探索浏览器内核:理解网络世界的幕后英雄
|
机器学习/深度学习 敏捷开发 测试技术
探索软件测试中的自动化策略:从基础到高级实践
【8月更文挑战第24天】在软件开发的快速迭代中,自动化测试成为确保质量和效率的关键。本文将引导你了解自动化测试的核心概念、工具选择、框架搭建,以及如何实施高效策略。我们将通过实际案例,探讨如何根据项目需求定制自动化测试流程,并克服常见挑战。无论你是自动化测试的新手还是寻求进阶的专家,这篇文章都将为你提供价值洞见和实用技巧。
149 3
|
存储 缓存 编译器
Linux源码阅读笔记06-RCU机制和内存优化屏障
Linux源码阅读笔记06-RCU机制和内存优化屏障
|
弹性计算 运维 关系型数据库
云上Serverless高可用架构一键部署体验与测评
在数字化转型背景下,Serverless架构因其实现业务敏捷、降低成本及提升服务可靠性而备受青睐。本文以阿里云Serverless应用引擎(SAE)为核心,展示了一种高可用、低成本且易于扩展的解决方案。通过单地域双可用区部署,构建了具备自动伸缩与故障恢复能力的架构。借助阿里云的一键部署功能,大幅简化了搭建流程,实现了快速部署,并通过性能与成本分析验证了其优势。对比传统ECS,SAE在资源利用与运维效率上表现更佳,特别适合平均负载较低的应用场景。
|
存储 Linux 网络安全
|
机器学习/深度学习 人工智能 自然语言处理
Transformer介绍
Transformer模型于2017年由Google提出,其在BERT中大放异彩,革新了NLP领域。Transformer的优势在于并行计算能力和处理长距离依赖,通过自注意力机制避免了RNN/LSTM的梯度问题。它由编码器和解码器组成,使用位置编码处理序列信息。Transformer在机器翻译、文本生成、问答系统等多个任务中提升效率和准确性,并扩展至计算机视觉和语音识别。随着AI发展,Transformer成为大模型核心技术,推动整个产业进步。
|
开发工具 git
protobuf的复杂结构
protobuf的复杂结构
231 1