七个经典可视化案例,展示数据思维

简介:

图表是一种美观而强大的工具,可以帮助我们探索和诠释这个世界。数百年来,人们一直在使用图表来解释跟数据相关的种种。为了向数据可视化的历史和图表的力量致敬,我们重新制作了史上最具代表性的7张图表。

 

这其中一部分是用现代的方法呈现出原稿,而另一些则致力于对原图的重新制作。这项工程由Edward Tufte发起。他是一位数据可视化的专家,已经对这些以及更多的图表写过相关文章。


 ◆  

1. 俄法战争


1969年,Charles Minard做了一张图表,是1812年拿破仑率军攻占莫斯科的行军图,显示了军队规模的缩减。在顶端较粗的线代表了从波兰到莫斯科的行军规模变化。下方的细深色线则代表了撤退时的军队规模。线条的宽度代表了军队的规模,从400000大军缩减到了10000。底部线条是温度和时间刻度,而整个图形分布展示了行军距离。

                           
 

下方是我们的现代视图。我们也可以做一个更为准确的复刻。中间的分界线代表莫斯科。蓝色的线表示温度随右侧Y轴的变化。底部的X轴则表示日期和距离。我们也可以使用一个自定义的日期格式。拖动鼠标会看到数据。D3.js带来这种交互性。也可单击并拖动缩放。


 

  ◆ 

2. 约翰·雪诺(John Snow)和霍乱案例


下方是约翰·雪诺的地图,展示了1854年伦敦霍乱爆发时的发病源头。线条代表街道。黑色的长条代表了所在街区死亡的人数。圆点代表抽水泵。特别注意在宽街 (Broad Street)上的抽水泵周围的死亡人数相对集中。雪诺用他的这幅地图佐证了他极富争议的理论:霍乱是由被污染的引用水传播开来的。当政府关闭了宽街上的水泵,霍乱的蔓延也平息了。引发霍乱的病菌最终由德国物理学家罗伯特·科赫(Robert Koch)在1883年分离出来。

我们重制了这张图表,用蓝色半透明方块来表示死亡人数。 沿着灰色街道的深色块表示多人死亡。星形表示抽水泵。图中的多边形展现了基于抽水泵区域而分布的死亡人群分布:即最近的打水区域。最右侧的区域超出了地图绘制的范围。如果你将鼠标放在某个抽水泵图标上,你就可以看到这个区域内的死亡人数。放大图像则可以展开某一个群组看到详细数据。


  ◆ 

3. 死亡原因极坐标图


弗洛伦斯·南丁格尔(Florence Nightingale)是一位著名的英国社会改革者和统计学家。她是皇家统计学会的第一位女性成员,是使用极坐标图的先驱。当向国会展示她的研究成果时,南丁格尔使用区块来解释克里米亚战争。她的区块显示了在1854到1856年间克里米亚战争中人们死亡的原因。



 

史蒂芬(Stephen Few)在《把饼状图留给甜点》(“Save the Pies for Dessert”)一文中提到,由于饼状图不是并排展示,会使得比较规模和数值变得困难。这样的问题在极坐标图中同样存在。为了大家更好的理解,我们在Plotly中用python将她的图表录入,然后使用堆积柱状图来解决比较问题。



  ◆ 

4. 地球


地图应该是最早形式的图表。下面的地图分别由马丁·瓦尔德泽米勒(Martin Waldseemüller)在1507年,亚伯拉罕·奥特柳斯(Abraham Ortelius)在1570年和伊曼纽尔-鲍文(EmanuelBowen)在1744年制作完成的。


Plotly的创建人切尔西(Chelsea Lyn)用MATLAB的3Dglobe绘制地图,展示了国家、水域、经纬度和飞行轨迹。如果你点击、长按或拖动图像,图像可被翻动和旋转。切换图像的缩放比例可以看到详细数据。

(编者注:交互效果请前往原网页查看→ https://plot.ly/~chelsea_lyn/2170/land-rivers-paris-to-new-york-city-hong-kong-london-los-angeles-to-tokyo-longitu/)


 ◆ 

5. 汉斯·罗斯林(HansRosling)


汉斯•罗斯林是Gapminder(注:一个在线互动图表数据平台)的创办人之一,他制作了气泡图来展示每个国家四个维度的变量指标:平均寿命(y轴),GDP(x轴),七大洲(颜色)和人口数量(气泡大小)。


以下是利用Plotly绘制的。你可以通过悬停鼠标来查看数据,切换图例的轨迹,或通过点击和拖拽来缩放展示比例。获取更多信息,可查看我们基于python创建图表的教程或者网页版教程,Plotly也能进行流式数据处理。



 ◆ 

6. Anscombe四图:为什么要制作图表

  

Anscombe四图展示了弗朗西斯·安斯库姆(Francis Anscombe)在1973年构造的四组数据集。数据集具有相同的线性回归参数,x、y均值,x、y方差和Pearson相关系数(精确到两位小数)。《Nature》中的一篇文章重新发布了该数据集并绘制成如下图表。


关键点是:仅仅只有统计数据会变得混淆杂乱和不完整。图表能让我们更好的理解数据。可通过阅读ggplot2和matplotlib文档去了解和制作subplots,同时可通过以往关于Anscombe主题的文章进行学习。


 ◆ 

7. 进口量&出口量折线图

威廉·普莱费尔(WilliamPlayfair,1759-1823)是一位苏格兰的工程师和政治经济学家。他发明了折线图,条形图,饼图和扇形图。他通过绘制以下轨迹图展示英国从进口量大于出口量到出口量大于进口量的时间点。


以下是利用plotly绘制的,其中y轴是对数值。


原文发布时间为:2016-06-12

本文来自云栖社区合作伙伴“大数据文摘”,了解相关信息可以关注“BigDataDigest”微信公众号

相关文章
|
JSON 网络协议 数据格式
curl常用参数详解及示例
curl是一个开源的命令行工具,它基于网络协议,对指定URL进行网络传输,得到数据后不任何具体处理(如:html的渲染等),直接显示在"标准输出"(stdout)上。
4382 1
|
机器学习/深度学习 计算机视觉
YOLOv11改进策略【注意力机制篇】| 添加SE、CBAM、ECA、CA、Swin Transformer等注意力和多头注意力机制
YOLOv11改进策略【注意力机制篇】| 添加SE、CBAM、ECA、CA、Swin Transformer等注意力和多头注意力机制
3988 2
YOLOv11改进策略【注意力机制篇】| 添加SE、CBAM、ECA、CA、Swin Transformer等注意力和多头注意力机制
|
人工智能 自然语言处理 JavaScript
Univer:开源全栈 AI 办公工具,支持 Word、Excel、PPT 等文档处理和多人实时协作
Univer 是一款开源的 AI 办公工具,支持 Word、Excel 等文档处理的全栈解决方案。它具有强大的功能、高度的可扩展性和跨平台兼容性,适用于个人和企业用户,能够显著提高工作效率。
2699 9
Univer:开源全栈 AI 办公工具,支持 Word、Excel、PPT 等文档处理和多人实时协作
|
人工智能 JSON 安全
酒店旅游API:数据交互的隐形桥梁——以携程API为例
携程API提供酒店旅游行业的实时数据互通、业务自动化及生态扩展功能,涵盖酒店详情获取、搜索、房态管理、订单处理和支付等核心接口。技术架构采用微服务集群与数据中台,支持高并发和金融级安全防护。挑战包括高并发、数据一致性和商业博弈,未来将融合AI、元宇宙和区块链技术,实现智能旅游体验。
|
小程序 前端开发 JavaScript
ssm+vue基本微信小程序的购物商城系统
随着互联网的趋势的到来,各行各业都在考虑利用互联网将自己的信息推广出去,最好方式就是建立自己的平台信息,并对其进行管理,随着现在智能手机的普及,人们对于智能手机里面的应用购物平台小程序也在不断的使用,本文首先分析了购物平台小程序应用程序的需求,从系统开发环境、系统目标、设计流程、功能设计等几个方面对系统进行了系统设计。开发出本购物平台小程序,主要实现了管理员后端:首页、个人中心、用户管理、商品分类管理、商品信息管理、订单评价管理、系统管理、订单管理,用户前端:首页、商品信息、商品资讯、我的等功能。总体设计主要包括系统功能设计、该系统里充分综合应用Mysql数据库、JAVA等相关知识。网页界面的
372 0
|
API 开发工具 Android开发
简述大疆无人机对接
【2月更文挑战第7天】本文介绍了对接大疆无人机的主要目的,包括实时画面获取、飞行数据监测、操控飞行、媒体管理和业务功能开发等,并列举了多种开发接口如MobileSDK、UXSDK、云开发API等。重点讨论了MobileSDK在Android平台的应用,包括SDK集成步骤、直播推流和获取飞机实时数据的细节。另外,UXSDK用于加速应用开发,提供预设UI组件。上云API则简化了无人机与第三方云平台的集成,支持MQTT、HTTPS和WebSocket协议,适用于行业级无人机。对接流程涉及Pilot2和Dock的配置,以及数据传输和业务功能处理。文章还提及了如何对接多个飞机的方法。
13049 0
简述大疆无人机对接
|
SpringCloudAlibaba 监控 网络协议
SpringCloud Alibaba系列(三) Sentinel系统自适应限流
  Sentinel 系统自适应限流从整体维度对应用入口流量进行控制,结合应用的 Load、CPU 使用率、总体平均 RT、入口 QPS 和并发线程数等几个维度的监控指标,通过自适应的流控策略,让系统的入口流量和系统的负载达到一个平衡,让系统尽可能跑在最大吞吐量的同时保证系统整体的稳定性。
634 0
链表学习(链表的创建,插入,删除,查找,遍历)
链表学习(链表的创建,插入,删除,查找,遍历)
306 0
|
机器学习/深度学习
Nat. Methods | 基于机器学习和生物物理的蛋白质-肽相互作用预测
Nat. Methods | 基于机器学习和生物物理的蛋白质-肽相互作用预测
276 0
Nat. Methods | 基于机器学习和生物物理的蛋白质-肽相互作用预测
|
SQL 分布式计算 负载均衡
Out of memory due to hash maps used in map-side aggregation解决办法
在运行一个group by的sql时,抛出以下错误信息: Task with the most failures(4):  -----Task ID:  task_201411191723_723592_m_000004URL:  http://DDS0204.
1349 1

热门文章

最新文章