杂谈大数据

本文涉及的产品
云原生大数据计算服务MaxCompute,500CU*H 100GB 3个月
简介: 错误的“大数据”称呼,“元芳”你怎么看?数据真的能推动人类文明的发展?数据真的能改变经济体制?今天我们就带着这些问题,温一杯茶,杂谈大数据的那些事。

前几天收到云栖社区馈赠的王坚博士写的《在线》一书,感触很大。首先,我个人觉得这本书让我们认识到了阿里云的成长历程,也让我们看到了技术执着的阿里人在探索道路上的不折不挠。同时也验证了技术进步背后总会有一群人在默默的付出。也见识了心理学博士王坚对于未来的把握如此准确,准确背后是一种信仰和精神。从发展历程上看,不得不说阿里云是培养CTO的最好的大学,没有之一。

王坚博士在书中提到,大数据这个叫法是有些许错误的。于是,我便带着这个问题:“大数据不叫大数据,那它应该叫什么?”去认真的阅读了此书。下面分享一下,我对这个问题的些许看法。

大数据、云计算是共生体。为什么将它们两个放在一起呢?因为它们两个谁也离不开谁,准确的来说它们两个算得上一对宿命鸳鸯。数据不计算永远产生不了价值,计算没有数据作为基础,算是在做无用功。造词者,当时可能没有想到大数据、云计算会走到一起。但是,幸运的是,命运千转百回,它们终成伴侣。

它们彼此让自己更有价值,同时也让彼此的真实面容展现出来。回到我们一开始的问题:“大数据如果不叫大数据,它应该叫什么?”云数据,我个人觉得这个词更适合取代大数据这个词。如果按照大数据的体量来讲,世界上的数据能称得上大的,恐怕只有欧洲大型电子对撞机产生的数据,而今天我们讲得最多的“大数据”,是来自互联网的数据。王坚博士在书中提到了数据是由沉淀效益的,准确的来说,沉淀的越多,价值也就越大。

这样一个效益规律不禁让我想起,由水蒸气聚集形成的云。水蒸气越聚越多,在自然重力的作用下形成了雨,滋润了万物。水一直被视为人类生命之源,水创造了万物,价值也就不可用数字来衡量。同样,今天数据也被视为商业动力之源,指导生产生活。我相信未来数据创造的价值也不可用数字来衡量。

王坚博士在《在线》一书中,提到过,数据同样是有聚合效应的,事实已经证明,这种聚合效应也正在创造着巨大的价值。数据和水蒸气还有一个共同的特征,就是可重复利用。

云数据的价值因其所在的领域而定,在这一点上真实的云也是如此。在干旱的地方,水的价值相对来说很大。对于云数据来说,行业数据沉淀的越多,行业发展的也就越健康。在相对意义上来说,可增长价值也就越小。但是,对于行业数据匮乏的领域来说,发展相对艰难,整个行业都期待能有一场春雨来欢聚它们生存的压力,过去我们靠什么?外部的投资,国家的政策。但是,我们发现这些并不能长久解决问题,只是解决了燃眉之急。

其实,到最后大家能意识到的是:只有自己才能解决自己的问题。今天是一个自救的良机,因为有互联网、云数据、云计算的存在。互联网成为基础设施,数据成为生产资料,计算成为公共服务。

王坚博士在《在线》一书中说:数据成为资源,对于万事万物来说,是世界文明进步的标志。因为什么?数据相对于其他资源来说,是我们人自产的,不是来源于自然界。这对于人类来说,是一个相当震慑的消息。之前,我们总是希望自然界能为我们提供足够多的资源,但是我们发现这似乎有些天方夜谭,尽管在理论上来说,我们可以获得足够多的资源。

或许因为数据的出现,不管是行业,还是人,“自救”会成为时代的主题。不管是自然界赋予人类的资源,还是国家政策、外部投资赋予行业新的生命,到最后都会落到“自救”上。这或许也验证了:只有自己才能救自己,这句至理名言的准确性。

其实,这也就引起了数据到底有什么价值?让今天那么多人为它痴狂,也让行业和人类愿意将自己的命运交付给它。我认为数据并不能直接创造价值!互联网高度发展的今天,拥有数据并不算是一件难事,所有拥有处理它的能力和思想就变得至关重要了。数据创造价值的核心是不变的,那就是:让资源利用率最大化。

马云先生在贵州的时候,就提到过计划经济可能会重新回归,同时他也表示计划经济或许是世界上最好的经济形式。之所以称其为最好的经济形式,无非是其效率是真的高。当然,这个观点一出,瞬间受到了很多经济学教的批评。这其中的原因也是因为上个世纪,我们吃过计划经济的亏。正所谓“一朝被蛇咬,十年怕井绳”。

但是,在怕的时候,我们应该回想过去计划经济体系失败在哪里?计划经济体系失败的原因在于,当时科学技术的限制,中央集权自上而下式的计划经济。上面的人靠不靠谱的不完整的数据样本,来制定经济发展规则。而今天马云先生提到的计划经济不是上个时代的计划经济,它们两个在本质上是由巨大差异的。最明显的是今天的计划经济是自下而上的。在使用的数据体量上也是有天壤之别的,数据的使用量带来了质的变化。这个质的改变是计划经济的质。

另外一个新时代的计划经济和旧时代的计划经济的区别是,新时代的计划经济是完全依靠客观实在的数据得到的;而旧时代的计划经济是带有人的主观意志的计划经济,准确的来说是不客观的。推动这一区别显现的是今天人工智能的高速发展。由机器取代人去做决策,这是时代发展的趋势。也是体现新时代的计划经济一种优越性的一个重要指标。

我们今天使用的市场经济是一双看不见的手,而今天即将复活的计划经济本质是一双由市场数据演变成的一双看得见的手。

相关实践学习
基于MaxCompute的热门话题分析
Apsara Clouder大数据专项技能认证配套课程:基于MaxCompute的热门话题分析
相关文章
|
数据采集 存储 前端开发
关于数仓建设及数据治理的超全概括 (一)
本文分为两大节介绍,第一节是数仓建设,第二节是数据治理,内容较长,还请耐心阅读!
1047 0
关于数仓建设及数据治理的超全概括 (一)
|
自然语言处理 BI 数据处理
【数据对比】综合分析百度情感分析以及华为情感分析的差异,我有了如下结果
【数据对比】综合分析百度情感分析以及华为情感分析的差异,我有了如下结果
571 0
|
弹性计算 Cloud Native Devops
云效DevStudio体验
阿里云中提供了在线编辑工具DevStudio,让开发更加便捷。
2361 0
云效DevStudio体验
|
11月前
|
人工智能 算法 计算机视觉
【01】opencv项目实践第一步opencv是什么-opencv项目实践-opencv完整入门以及项目实践介绍-opencv以土壤和水滴分离的项目实践-人工智能AI项目优雅草卓伊凡
【01】opencv项目实践第一步opencv是什么-opencv项目实践-opencv完整入门以及项目实践介绍-opencv以土壤和水滴分离的项目实践-人工智能AI项目优雅草卓伊凡
374 63
【01】opencv项目实践第一步opencv是什么-opencv项目实践-opencv完整入门以及项目实践介绍-opencv以土壤和水滴分离的项目实践-人工智能AI项目优雅草卓伊凡
|
运维 Java Devops
阿里云云效操作报错合集之在进行GitLab代码分支迁移时遇到报错,一般是什么原因
本合集将整理呈现用户在使用过程中遇到的报错及其对应的解决办法,包括但不限于账户权限设置错误、项目配置不正确、代码提交冲突、构建任务执行失败、测试环境异常、需求流转阻塞等问题。阿里云云效是一站式企业级研发协同和DevOps平台,为企业提供从需求规划、开发、测试、发布到运维、运营的全流程端到端服务和工具支撑,致力于提升企业的研发效能和创新能力。
|
11月前
|
分布式计算 大数据 流计算
玩转数据:初学者的大数据处理工具指南
玩转数据:初学者的大数据处理工具指南
305 14
|
NoSQL MongoDB PHP
MongoDB 管理工具: Rockmongo
10月更文挑战第24天
190 1
MongoDB 管理工具: Rockmongo
|
机器学习/深度学习 Python
机器学习中评估模型性能的重要工具——混淆矩阵和ROC曲线。混淆矩阵通过真正例、假正例等指标展示模型预测情况
本文介绍了机器学习中评估模型性能的重要工具——混淆矩阵和ROC曲线。混淆矩阵通过真正例、假正例等指标展示模型预测情况,而ROC曲线则通过假正率和真正率评估二分类模型性能。文章还提供了Python中的具体实现示例,展示了如何计算和使用这两种工具来评估模型。
570 8
|
移动开发 网络协议 小程序
基于开源IM即时通讯框架MobileIMSDK:RainbowChat-iOS端v9.1版已发布
RainbowChat是一套基于开源IM聊天框架 MobileIMSDK 的产品级移动端IM系统。RainbowChat源于真实运营的产品,解决了大量的屏幕适配、细节优化、机器兼容问题
313 5
|
Java 程序员
Java 面试高频考点:static 和 final 深度剖析
本文介绍了 Java 中的 `static` 和 `final` 关键字。`static` 修饰的属性和方法属于类而非对象,所有实例共享;`final` 用于变量、方法和类,确保其不可修改或继承。两者结合可用于定义常量。文章通过具体示例详细解析了它们的用法和应用场景。
274 3