警惕“数据可视化”

简介: 迷彩通常意味着与周围环境协调一致。在一个世纪之前,战舰想躲避潜艇时不会用这一招,因为在不断变幻的海天背景之下,船首波与主烟囱会时刻暴露出战舰的位置。于是炫幻迷彩应运而生,这种迷彩由弯弯曲曲的线条和五颜六色的花纹,以很抽象的方式显示出来。

迷彩通常意味着与周围环境协调一致。在一个世纪之前,战舰想躲避潜艇时不会用这一招,因为在不断变幻的海天背景之下,船首波与主烟囱会时刻暴露出战舰的位置。于是炫幻迷彩应运而生,这种迷彩由弯弯曲曲的线条和五颜六色的花纹,以很抽象的方式显示出来。采用炫幻迷彩的战舰不难定位,难的是在程序繁琐的拦截中,发射鱼雷之前需要潜望镜操作手迅速判断出战舰的航速与航向。也就是说,设计炫幻迷彩的目的就是造成误判,有证据表明这种策略确实有效。

现在让我们讨论一下数据可视化,这是数字导向新闻报道中近来最炙手可热的操作手法,不过这也让我们想起弗洛伦斯•南丁格尔(Florence Nightingale)这样的人物。她不仅是史上最著名的护士,而且是最漂亮的可视化技术“鸡冠花图”(Coxcomb diagram)的创始人。另外,她还是首位当选英国皇家统计学会(Royal Statistical Society)的女性会员。

数据可视化用复杂数据生成强大而精美的图像。它就像行文技巧一样:它能带来舒适的体验,如果应用得当,能成为一种发挥积极作用的武器;但另一面,它充满诱惑,并可能具有欺骗性。我们对于数据可视化的经验少于在修辞方面的经验,在这方面还处于懵懂状态,很容易可视化冲昏头脑。数据可视化被等同于统计版炫幻迷彩的情形太多了——富有冲击力的形象吸引了我们的注意力,而这要么不能传递有用信息,要么会在很大程度上误导我们。

举一个危害相对不大的例子,比如《纽约客》(The New Yorker)最近上线的地铁不平等在线地图。文中说:“纽约有不平等问题。”接着该文请我们点击不同的地铁地图,这会让我们看到一幅截面图,截面图显示出沿着不同地铁线路乘客收入中位数分布的波峰和波谷。这一结果看上去十分漂亮,但是它所提供的信息远远比不上一幅地图本来能提供的信息量。这其实是一件打着统计分析幌子的艺术品。

更有名的例子,是戴维•麦坎德利斯(David McCandless)令人印象深刻的动画“债务方块(Detris)”。在这个动画中,巨大的方块缓缓落下。为了向那个令人上瘾的电脑游戏“俄罗斯方块”(Tetris)致敬,背景音乐采用了8位音轨。这些方块的大小表示相应的美元金额。在“600亿美元:2003年伊拉克战争耗费成本估值”的方块之后,随之而来的是“3万亿美元:伊拉克战争总成本估值”。在这之后则是沃尔玛(Walmart)营收、联合国(UN)预算、金融危机成本以及许多其他项目。

这一动画纯粹是一种炫幻迷彩。这完全把统计学的苹果和统计学的桔子放在一起进行了比较。例如,与伊拉克战争有关的比较并不是第一眼看上去的那种“过去和现在的比较”,而是美国国防部(DoD)曾经估计的可能花销与一种涵盖因素更多的宏观估值的比较,后者包括了死亡战士生命的在财务估值,另外还包括了一万亿美元的“宏观经济损失”。伊拉克战争确实是一场灾难,但完全没必要为了证明这一观点而在统计上采取调包手法。

麦坎德利斯告诉我们,信息可以是十分美妙的。不幸的是,误导性信息也可能同样美妙。或者,正如统计大师麦克•布拉斯特兰德(Michael Blastland)所说:“我们很有可能会犯下与过去常犯的统计错误一样的错误,只是表现形式更漂亮一些。”

那些漂亮的鸡冠花图也不例外。它们确实展示了克里米亚战争(Crimean war)中人员大量致死的原因,并且无可辩驳地证明了改善卫生条件能拯救人们的生命。但是南丁格尔传记作家休•斯莫尔(Hugh Small)声称,南丁格尔选择鸡冠花图的目的是为了专门证明以上观点。实际上,简单的直方图原本能呈现得更清楚一些,但是就南丁格尔的目的而言,直方图的问题在于因果关系表现得太过清晰,因为读者会从直方图得出结论,冬天来临与糟糕的卫生条件导致的死亡人数同样多。南丁格尔展示数据的方式是极有控制力的。这样的呈现方式不是为了传递信息,而是为了说服读者。我们观赏当代数据可视化图案之时,应该铭记这一点。


原文发布时间为:2013-08-21


本文来自云栖社区合作伙伴“大数据文摘”,了解相关信息可以关注“BigDataDigest”微信公众号

相关文章
|
定位技术 索引
基于Amos路径分析的输出结果参数详解
基于Amos路径分析的输出结果参数详解
1650 2
|
开发者
SyntaxError: cannot assign to literal错误
SyntaxError: cannot assign to literal错误
2875 1
|
机器学习/深度学习 算法 搜索推荐
精确率(Precision)和召回率(Recall)
精确率(Precision)和召回率(Recall)是用于评估分类模型性能的指标。它们通常用于二分类问题,例如判断一个样本是正例(Positive)还是负例(Negative)。
7301 0
|
9月前
|
安全 数据安全/隐私保护 UED
HarmonyOS 5.0 (Next)应用开发实战:使用ArkTS构建开箱即用的登录页面【HarmonyOS 5.0(Next)】
### HarmonyOS 5.0(Next)应用开发实战:使用ArkTS构建开箱即用的登录页面 HarmonyOS 5.0(Next)融合了美学与科技,引入“光感美学”设计理念和多设备深度协同功能。本文通过 ArkTS 构建一个简单的登录页面,展示了模块化导入、状态管理、方法封装、声明式UI构建及事件处理等最佳实践。代码实现了一个包含用户名和密码输入框及登录按钮的界面,支持错误提示和页面跳转。
637 14
HarmonyOS 5.0 (Next)应用开发实战:使用ArkTS构建开箱即用的登录页面【HarmonyOS 5.0(Next)】
|
9月前
|
JSON Dart API
Flutter 使用图片和资源
Flutter 使用图片和资源
214 2
Flutter 使用图片和资源
|
9月前
|
Java
Java 异常处理:11 个异常处理最佳实践
本文深入探讨了Java异常处理的最佳实践,包括早抛出晚捕获、只捕获可处理异常、不忽略异常、抛出具体异常、正确包装异常、记录或抛出异常但不同时执行、不在finally中抛出异常、避免用异常控制流程、使用模板方法减少重复代码、抛出与方法相关的异常及异常处理后清理资源等内容,旨在提升代码质量和可维护性。
506 3
|
9月前
|
机器学习/深度学习 人工智能 算法
机器学习与深度学习:差异解析
机器学习与深度学习作为两大核心技术,各自拥有独特的魅力和应用价值。尽管它们紧密相连,但两者之间存在着显著的区别。本文将从定义、技术、数据需求、应用领域、模型复杂度以及计算资源等多个维度,对机器学习与深度学习进行深入对比,帮助您更好地理解它们之间的差异。
|
10月前
|
开发工具 C++ git
利用VS Code提升开发效率的五大插件推荐
本文推荐了五款能显著提升开发效率的VS Code插件:ESLint用于代码质量和风格检查;Prettier自动格式化代码;GitLens增强Git功能;Live Server提供前端实时预览;Docker支持容器管理。
|
11月前
|
前端开发 JavaScript 编译器
不走弯路,纯前端如何把图片导出成视频!
【10月更文挑战第3天】不走弯路,纯前端如何把图片导出成视频!
556 3
|
人工智能 搜索推荐 云栖大会
什么是通义智文?AI阅读助手,用AI帮你读得多、读得快、读得懂
介绍通义智文产品发展历程、使用场景及主要功能。
52232 9