《大数据时代》引发全球热议,遭美国学者质疑

本文涉及的产品
云原生大数据计算服务MaxCompute,500CU*H 100GB 3个月
简介:

近日,美国两本着名学术杂志同时关注大数据话题:《外交》杂志5/6月刊将《大数据的兴起》一文作为封面文章,认为大数据将改变人类思考和看待世界的方式。而《外交政策》杂志则在网站上发表微软研究院首席研究员、麻省理工学院公民媒体中心客座教授凯特·克劳福德的文章《对大数据的再思考》,从五个方面对大数据理论提出质疑。


大数据带来变革

《大数据的兴起》一文作者是近期引发热议的专着《大数据时代:生活、工作与思维的大变革》作者肯尼思·库克耶和维克托·迈尔—舍恩伯格(对,就是舍恩伯格,今日首篇文章就刊登了他在6月19日的演讲全文)。在文章中,库克耶和舍恩伯格肯定了大数据对社会的巨大变革能力,称大数据不仅将改变人们的生活和工作,而且将改变人类认识和思考世界的方式。


两人认为,随着技术环境的变化,一方面世界出现“数据爆炸”的现象,另一方面人类处理数据的能力也大为增强。由此,人们对待数据的方式出现了三个变化:第一,人们处理的数据从样本数据变成全部数据;第二,由于是全样本数据,人们不得不接受数据的混杂性,而放弃对精确性的追求;第三,人类通过对大数据的处理,放弃对因果关系的渴求,转而关注相互联系。这一切代表着人类告别总是试图了解世界运转方式背后深层原因的态度,而走向仅仅需要弄清现象之间的联系以及利用这些信息来解决问题。


《大数据的兴起》列举了大数据在医学、消费品领域的应用实例。但作者同时认为,大数据的影响力绝不仅限于商业范畴,它将深远地改变政府的运作方式和政治的性质。他们在文章中写道,“在推动经济增长、提供公共服务或进行战争等方面,那些能够有效利用大数据的人将拥有胜过别人的巨大优势”。不过,两位作者承认,大数据应用在公共服务领域比较成功的案例出现在城市这一级,因为在这个级别上获取数据和利用信息进行试验要容易一些。


学者提出五质疑

克劳福德的文章认为,大数据是当前的时髦术语,但人们是否能依靠海量数据揭示人类行为的规律仍值得怀疑。她针对大数据理论从五个方面提出质疑。


第一,大数据中存在偏见和盲区。大数据的倡导者认为,“有了足够的数据,数字就可以自己说话”。但克劳福德认为,数字无法自己说话。不论其规模有多大,数据集归根到底是人类设计的产物,而大数据的工具并不能使人们摆脱曲解、隔阂和错误的成见。当大数据试图反映人类所生活的社会化世界时,认清这些因素就尤为重要。偏见和盲区存在于大数据中,从大数据得出的结论并不比人为的意见更客观。


第二,大数据在一定程度上可以使城市变得更加智能和高效,但具体效果如何取决于市政官员对数据及其局限性的了解。克劳福德称,大数据的倡导者认为,“大数据将使我们的城市变得更加智能和高效”,在一定程度上确实如此。但另一方面,数据在生成或采集的过程中并不都是平等的,大数据集存在“信号问题”———即某些民众和社区被忽略或未得到充分代表。因此,要想运用好大数据,市政官员必须对数据及其局限性有充分了解。


第三,大数据可能导致基于群体的歧视。大数据的倡导者认为,“大数据对不同的社会群体不会厚此薄彼”,其理由是,原始数据的分析是在大规模水平上进行的,因而避免了基于群体的歧视。但克劳福德认为,实际情况并非如此。由于大数据能够作出有关群体不同行为方式的论断,而且其使用的主要目的是把不同个体归入不同的群体中,因此大数据不仅不会避免群体歧视,还可能加重这一趋势。


第四,隐私泄露是应用中的重要问题。克劳福德认为,大数据的倡导者关于“大数据是匿名的,因此它不会侵犯我们的隐私”一说大错特错。尽管许多大数据的提供者尽力消除数据中的个体身份,但身份重新被确认的风险仍然很大。鉴于利用大量公共数据集可以推断很多信息,这使泄露个人隐私成为“日益严重的担忧”。


第五,大数据为科学研究提供了新的途径,但不可断言“大数据是科学的未来”。克劳福德称,大数据的研究方法只能统计某件事情发生的频率和相关性,但不能得出因果关系。将大数据策略和小数据研究相结合也许是更好的科学研究途径。


库克耶和舍恩伯格也认识到了大数据理论的一些内在瑕疵。在《大数据的兴起》一文结尾,两位作者表示,大数据是一种资源和工具,它的目的是告知,而不是解释;它意在促进理解,但可能导致误解———关键在于人们对它的掌握程度。他们认为,人们必须用一种不仅欣赏其力量、而且承认其局限的态度来接纳大数据。


原文发布时间为:2014-06-20

本文来自云栖社区合作伙伴“大数据文摘”,了解相关信息可以关注“BigDataDigest”微信公众号

相关实践学习
基于Hologres轻松玩转一站式实时仓库
本场景介绍如何利用阿里云MaxCompute、实时计算Flink和交互式分析服务Hologres开发离线、实时数据融合分析的数据大屏应用。
基于MaxCompute的热门话题分析
Apsara Clouder大数据专项技能认证配套课程:基于MaxCompute的热门话题分析
相关文章
|
10月前
|
存储 数据安全/隐私保护 数据中心
Incus 6.4 容器和虚拟机管理器发布
【10月更文挑战第26天】
341 2
Incus 6.4 容器和虚拟机管理器发布
|
10月前
|
编解码 算法 安全
flv 和 mp4 区别
【10月更文挑战第26天】FLV和MP4格式在容器格式、编码标准、视频质量、兼容性、流媒体支持以及编辑制作等方面都存在一定的区别。用户在选择使用哪种格式时,应根据具体的需求和应用场景来决定。如果注重网络流媒体播放和实时性,FLV格式可能更适合;如果追求更好的视频质量、广泛的兼容性和方便的编辑制作,MP4格式则是更好的选择。
841 10
|
10月前
|
机器学习/深度学习 人工智能 算法
青否数字人声音克隆算法升级,16个超真实直播声音模型免费送!
青否数字人的声音克隆算法全面升级,能够完美克隆真人的音调、语速、情感和呼吸。提供16种超真实的直播声音模型,支持3大AI直播类型和6大核心AIGC技术,60秒快速开播,助力商家轻松赚钱。AI讲品、互动和售卖功能强大,支持多平台直播,确保每场直播话术不重复,智能互动和真实感十足。新手小白也能轻松上手,有效规避违规风险。
|
Web App开发 移动开发
视频教程 | 1分钟了解支付宝小程序发布流程
一分钟了解支付宝小程序发布流程。
6208 12
视频教程 | 1分钟了解支付宝小程序发布流程
|
算法 程序员 数据库连接
深入探索C++中的RAII原则:资源管理的艺术 (In-Depth Exploration of RAII in C++: The Art of Resource Management)...
深入探索C++中的RAII原则:资源管理的艺术 (In-Depth Exploration of RAII in C++: The Art of Resource Management)...
436 2
|
Java 程序员 C++
大学生如果想从事游戏行业,游戏开发或者电竞选手,有哪些建议?
@[TOC](目录) 大学生如果想从事游戏行业,游戏开发或者电竞选手,有哪些建议? # 一、游戏行业概述 游戏行业是指以电子游戏为核心的产业链,包括游戏开发、游戏发行、游戏运营、游戏硬件设备等多个环节。近年来,随着互联网技术的飞速发展,游戏行业呈现出移动化、社交化、智能化的趋势,不断涌现出新的游戏类型和玩法。游戏行业已成为全球范围内最具活力和潜力的产业之一。 # 二、游戏开发 游戏开发是指游戏制作团队根据游戏设计方案,通过编程、美术、音效等手段将游戏构思转化为具体游戏产品的过程。游戏开发涉及多个领域,包括计算机科学、数学、物理学、艺术设计等。游戏开发团队通常包括程序员、美术设计师、音效师、策划
328 0
|
索引 Python
独热(One-Hot)编码简述
独热(One-Hot)编码简述
908 0
独热(One-Hot)编码简述
|
缓存 应用服务中间件 网络安全
【CDN 常见问题】CDN HTTPS配置及常见问题
CDN提供了HTTPS的加密传输方式保证在客户端访问CDN的L1节点的链路上对传输数据进行加密避免被恶意查看和篡改。客户通过将自行向证书CA机构申请的SSL证书上传到CDN上,CDN会完成对所有的L1节点的配置同步保证后续所有的L1节点支持HTTPS方式访问。
9654 0
|
运维 监控 Java
如何成为优秀的技术主管?你要做到这三点
技术主管,又叫「技术经理」,英文一般是 Tech Leader ,简称 TL。随着工作经验的不断积累,能力的不断提升,每个人都有机会成为Team Leader。然而在机会到来前,我们必须提前做好准备,对TL的工作职责有一定了解。当然,这也会为当下更好地配合TL工作打下基础。
16880 0