性感的数据可视化 —— 精讲桑基图、气泡图、南丁格尔玫瑰图-阿里云开发者社区

开发者社区> 阿里云数据中台> 正文

性感的数据可视化 —— 精讲桑基图、气泡图、南丁格尔玫瑰图

简介: 文章主要为大家介绍三个可视化故事,和他们使用的三个重要的可视化组件:桑基图、气泡图、南丁格尔玫瑰图。

前言:更多关于数智化转型、数据中台内容可扫码加群一起探讨
668d7f5941782665ed1f41529db3eb677f4b9379.png
阿里云数据中台官网 https://dp.alibaba.com/index


(作者:常成)

2019年的“凯度信息之美奖”揭晓了,有很多很有意思的信息可视化作品。很多作品看到的时候都被感动到,数据/信息不再是冷冰冰的,而是立体的,通过可视化可以让人们更清晰的看到和感受到作者想表达的信息,比文字更加直接。选择了合适的数据可视化组件,就会有魔力,让你想传达的信息变得生动起来。

 

这里介绍三个可视化作品和故事,和他们使用的三个重要的可视化组件:桑基图、气泡图、南丁格尔玫瑰图

1. “凯度信息之美奖”的人道主义类金奖 - 《看不见的罪行:我们是否让性侵受害者失望了?》

22.png

作者研究了很多性暴力事件,采访了很多性侵幸存者,通过「桑基图」来展示性暴力事件有多少被起诉,为什么社会系统没能为受害者伸张正义。这每一个数字背后都是受到伤害的人们。

 

桑基图的使用场景
桑基图(Sankey diagram),即桑基能量分流图,也叫桑基能量平衡图。因1898年Matthew Henry Phineas Riall Sankey绘制的“蒸汽机的能源效率图”而闻名,此后便以其名字命名为“桑基图”。

使用桑基图能够很好的表达数据的流动,可以非常明显的看到整体数据和各个阶段的流向。

上面那个例子中一方面可以很清晰地看到向警方报告的性暴力事件,最终都流向了什么样的结果。另一方面,最初报告的事件数和最终判决的对比也是如此的强烈。

因为能够非常直观的表达出数据的流向,并且简单易懂,桑基图的应用场景越来越多,也被大量应用于媒体中。另外在网站/APP的流量/用户行为数据分析中也得到了大量的应用,分析用户从哪些落地页进入,又因为什么页面跳出,在网站中如何流动。比如Google Analytics中的页面流/事件流。

 

2.  汉斯·罗斯林告诉我们的《事实》

“你觉得数据无聊是因为这不是你想知道的,或者说你并没有意识到这些数据和真实世界的联系。” —— 汉斯·罗斯林
5.jpg

统计学家汉斯·罗斯林在大学授课的时候发现大家对这个世界有很多误解,所以他将后半生都致力于将真实信息传达给世界。在他最出名的一次演讲中他用气泡图,用 12 万个数据解释 200 个国家 200 年的发展。

 

这个气泡图中每个气泡代表一个国家,横轴是各个人均收入,纵轴是寿命,气泡大小表示人口,那两个大红点分别是中国和印度。

可以看出来各个国家在过去200年都逐渐往右上角移动,更高的收入,更高的寿命,世界在一点点的变好。

 

气泡图的使用场景

气泡图可以用于展示三个度量之间的相关关系,或者同时呈现三维数据。

比如罗斯林的这个图,同时向我们展示了每个国家的:人均收入、寿命、人口。同时气泡基本分布在一条斜线上,人均收入和寿命有一定的相关性。

 

  1. 南丁格尔用「玫瑰图」挽救了千万人的生命
    3.jpg

这是一张19世纪50年代的图表,当时英国、法国、土耳其和俄国正在进行克里米亚战争。南丁格尔主动申请,自愿担任战地护士。南丁格尔发现改善医疗环境可以降低死亡率,所以做了这个图,向政府说明应该改善战地医院的条件来拯救更多年轻的生命。右侧的玫瑰图表示1854 年 4 月至 1955 年 3 月每月的死亡率,每月死亡率都非常高,高达42%。左侧的玫瑰图表示1955年3月卫生委员会改善了卫生环境之后,死亡率得到了大幅下降,戏剧性地降至 2.5%。另外图中灰色区域表示糟糕的医疗环境的感染导致的死亡,可以看到大部分的伤亡并非直接来自战争,而是因为医疗环境。

左右2个图的大小对比出卫生环境改善前后死亡率的变化,各种颜色扇区的面积强烈对比出环境对死亡的影响。

这样强烈的对比让政府相关官员了解到:改善医院的医疗状况可以显著的降低英军的死亡率,最终挽救了千万人的生命。这种新型的图表也由此得名,因为外形很像一朵绽放的玫瑰,这种图表也被称为“南丁格尔玫瑰图”。

 

南丁格尔玫瑰图的使用场景

这种图表适合用于对比各类别的数据,而相比柱图/条形图等图表类型来说,南丁格尔玫瑰图能够放大数据差异。因为它使用扇区半径来表示数据的大小,半径和面积的关系是平方的关系,用户直觉上会通过面积来感知差异,所以它会将数据的比例大小夸大。这种放大数据差异的效果尤其适合对比大小相近的数值,或者像南丁格尔一样就是希望突出数据差异的场景。

当然在使用这个图表的时候需要注意,因为它夸大了数据的差异,比如两个类别数据原本差10倍,用这个图表就会给人一种差100倍的感觉。所以如果希望客观的展示数据,还是建议使用柱图等图表类型。
 

这里想告诉小伙伴们,使用Quick BI,可以快速制作桑基图、气泡图、玫瑰图哦。
(**智能数据分析与可视化-Quick BI:专为云上用户和企业量身打造的新一代自助式智能BI服务平台,简单易用的可视化操作和灵活高效的多维分析能力,让精细化数据洞察为商业决策保驾护航。
中国唯一进入Gartner魔力象限BI产品,此次联合钉钉协同升级,“随时随地、智能决策”。**)
在Quick BI上,可以通过简单的勾勾选选就能做出桑基图、气泡图、玫瑰图。

快来使用试试哦,通过数据可视化,让你的汇报、故事更性感吧~

PS:
凯度信息之美奖:  https://www.informationisbeautifulawards.com/news/485-information-is-beautiful-awards-2019-the-winners
汉斯·罗斯林用前所未有的好方法诠释数字统计:https://www.ted.com/talks/hans_rosling_the_best_stats_you_ve_ever_seen?language=zh-cn
汉斯·罗斯林的非营利机构: https://www.gapminder.org/


数据中台是企业数智化的新基建,阿里巴巴认为数据中台是集方法论、工具、组织于一体的,“快”、“准”、“全”、“统”、“通”的智能大数据体系。目前正通过阿里云数据中台解决方案对外输出,包括零售、金融、互联网等行业,其中核心产品有:

数据中台官网 https://dp.alibaba.com
数据中台钉钉群二维码2.jpg


版权声明:本文内容由阿里云实名注册用户自发贡献,版权归原作者所有,阿里云开发者社区不拥有其著作权,亦不承担相应法律责任。具体规则请查看《阿里云开发者社区用户服务协议》和《阿里云开发者社区知识产权保护指引》。如果您发现本社区中有涉嫌抄袭的内容,填写侵权投诉表单进行举报,一经查实,本社区将立刻删除涉嫌侵权内容。

分享:

阿里云数据中台,帮助企业降本提效,促进业务增长。

官方博客
官方站点