性感的数据可视化 —— 精讲桑基图、气泡图、南丁格尔玫瑰图-阿里云开发者社区

开发者社区> 数据中台百晓生> 正文

性感的数据可视化 —— 精讲桑基图、气泡图、南丁格尔玫瑰图

简介: 文章主要为大家介绍三个可视化故事,和他们使用的三个重要的可视化组件:桑基图、气泡图、南丁格尔玫瑰图。
+关注继续查看

前言:更多关于数智化转型、数据中台内容可扫码加群一起探讨
668d7f5941782665ed1f41529db3eb677f4b9379.png
阿里云数据中台官网 https://dp.alibaba.com/index


(作者:常成)

2019年的“凯度信息之美奖”揭晓了,有很多很有意思的信息可视化作品。很多作品看到的时候都被感动到,数据/信息不再是冷冰冰的,而是立体的,通过可视化可以让人们更清晰的看到和感受到作者想表达的信息,比文字更加直接。选择了合适的数据可视化组件,就会有魔力,让你想传达的信息变得生动起来。

 

这里介绍三个可视化作品和故事,和他们使用的三个重要的可视化组件:桑基图、气泡图、南丁格尔玫瑰图

1. “凯度信息之美奖”的人道主义类金奖 - 《看不见的罪行:我们是否让性侵受害者失望了?》

22.png

作者研究了很多性暴力事件,采访了很多性侵幸存者,通过「桑基图」来展示性暴力事件有多少被起诉,为什么社会系统没能为受害者伸张正义。这每一个数字背后都是受到伤害的人们。

 

桑基图的使用场景
桑基图(Sankey diagram),即桑基能量分流图,也叫桑基能量平衡图。因1898年Matthew Henry Phineas Riall Sankey绘制的“蒸汽机的能源效率图”而闻名,此后便以其名字命名为“桑基图”。

使用桑基图能够很好的表达数据的流动,可以非常明显的看到整体数据和各个阶段的流向。

上面那个例子中一方面可以很清晰地看到向警方报告的性暴力事件,最终都流向了什么样的结果。另一方面,最初报告的事件数和最终判决的对比也是如此的强烈。

因为能够非常直观的表达出数据的流向,并且简单易懂,桑基图的应用场景越来越多,也被大量应用于媒体中。另外在网站/APP的流量/用户行为数据分析中也得到了大量的应用,分析用户从哪些落地页进入,又因为什么页面跳出,在网站中如何流动。比如Google Analytics中的页面流/事件流。

 

2.  汉斯·罗斯林告诉我们的《事实》

“你觉得数据无聊是因为这不是你想知道的,或者说你并没有意识到这些数据和真实世界的联系。” —— 汉斯·罗斯林
5.jpg

统计学家汉斯·罗斯林在大学授课的时候发现大家对这个世界有很多误解,所以他将后半生都致力于将真实信息传达给世界。在他最出名的一次演讲中他用气泡图,用 12 万个数据解释 200 个国家 200 年的发展。

 

这个气泡图中每个气泡代表一个国家,横轴是各个人均收入,纵轴是寿命,气泡大小表示人口,那两个大红点分别是中国和印度。

可以看出来各个国家在过去200年都逐渐往右上角移动,更高的收入,更高的寿命,世界在一点点的变好。

 

气泡图的使用场景

气泡图可以用于展示三个度量之间的相关关系,或者同时呈现三维数据。

比如罗斯林的这个图,同时向我们展示了每个国家的:人均收入、寿命、人口。同时气泡基本分布在一条斜线上,人均收入和寿命有一定的相关性。

 

  1. 南丁格尔用「玫瑰图」挽救了千万人的生命
    3.jpg

这是一张19世纪50年代的图表,当时英国、法国、土耳其和俄国正在进行克里米亚战争。南丁格尔主动申请,自愿担任战地护士。南丁格尔发现改善医疗环境可以降低死亡率,所以做了这个图,向政府说明应该改善战地医院的条件来拯救更多年轻的生命。右侧的玫瑰图表示1854 年 4 月至 1955 年 3 月每月的死亡率,每月死亡率都非常高,高达42%。左侧的玫瑰图表示1955年3月卫生委员会改善了卫生环境之后,死亡率得到了大幅下降,戏剧性地降至 2.5%。另外图中灰色区域表示糟糕的医疗环境的感染导致的死亡,可以看到大部分的伤亡并非直接来自战争,而是因为医疗环境。

左右2个图的大小对比出卫生环境改善前后死亡率的变化,各种颜色扇区的面积强烈对比出环境对死亡的影响。

这样强烈的对比让政府相关官员了解到:改善医院的医疗状况可以显著的降低英军的死亡率,最终挽救了千万人的生命。这种新型的图表也由此得名,因为外形很像一朵绽放的玫瑰,这种图表也被称为“南丁格尔玫瑰图”。

 

南丁格尔玫瑰图的使用场景

这种图表适合用于对比各类别的数据,而相比柱图/条形图等图表类型来说,南丁格尔玫瑰图能够放大数据差异。因为它使用扇区半径来表示数据的大小,半径和面积的关系是平方的关系,用户直觉上会通过面积来感知差异,所以它会将数据的比例大小夸大。这种放大数据差异的效果尤其适合对比大小相近的数值,或者像南丁格尔一样就是希望突出数据差异的场景。

当然在使用这个图表的时候需要注意,因为它夸大了数据的差异,比如两个类别数据原本差10倍,用这个图表就会给人一种差100倍的感觉。所以如果希望客观的展示数据,还是建议使用柱图等图表类型。
 

这里想告诉小伙伴们,使用Quick BI,可以快速制作桑基图、气泡图、玫瑰图哦。
(**智能数据分析与可视化-Quick BI:专为云上用户和企业量身打造的新一代自助式智能BI服务平台,简单易用的可视化操作和灵活高效的多维分析能力,让精细化数据洞察为商业决策保驾护航。
中国唯一进入Gartner魔力象限BI产品,此次联合钉钉协同升级,“随时随地、智能决策”。**)
在Quick BI上,可以通过简单的勾勾选选就能做出桑基图、气泡图、玫瑰图。

快来使用试试哦,通过数据可视化,让你的汇报、故事更性感吧~

PS:
凯度信息之美奖:  https://www.informationisbeautifulawards.com/news/485-information-is-beautiful-awards-2019-the-winners
汉斯·罗斯林用前所未有的好方法诠释数字统计:https://www.ted.com/talks/hans_rosling_the_best_stats_you_ve_ever_seen?language=zh-cn
汉斯·罗斯林的非营利机构: https://www.gapminder.org/


数据中台是企业数智化的新基建,阿里巴巴认为数据中台是集方法论、工具、组织于一体的,“快”、“准”、“全”、“统”、“通”的智能大数据体系。目前正通过阿里云数据中台解决方案对外输出,包括零售、金融、互联网等行业,其中核心产品有:

数据中台官网 https://dp.alibaba.com
数据中台钉钉群二维码2.jpg


版权声明:本文内容由阿里云实名注册用户自发贡献,版权归原作者所有,阿里云开发者社区不拥有其著作权,亦不承担相应法律责任。具体规则请查看《阿里云开发者社区用户服务协议》和《阿里云开发者社区知识产权保护指引》。如果您发现本社区中有涉嫌抄袭的内容,填写侵权投诉表单进行举报,一经查实,本社区将立刻删除涉嫌侵权内容。

相关文章
Charted – 自动化的可视化数据生成工具
  Charted 是一个让数据自动生成可视化图表的工具。只需要提供一个数据文件的链接,它就能返回一个美丽的,可共享的图表。Charted 不会存储任何数据。它只是获取和让链接提供的数据可视化。     在线演示      插件下载   您可能感兴趣的相关文章 网站开发中很有用...
768 0
算法博士平均月入4万,数据可视化技能全球吃香 | 2020年《顶级数据团队建设全景报告》重磅发布
算法博士平均月入4万,数据可视化技能全球吃香 | 2020年《顶级数据团队建设全景报告》重磅发布
19 0
一入前端深似海,从此红尘是路人系列第六弹之走进数据可视化
先上几张关于单个组件配置及页面承载组件的展示效果图吧:
1260 0
阿里云服务器端口号设置
阿里云服务器初级使用者可能面临的问题之一. 使用tomcat或者其他服务器软件设置端口号后,比如 一些不是默认的, mysql的 3306, mssql的1433,有时候打不开网页, 原因是没有在ecs安全组去设置这个端口号. 解决: 点击ecs下网络和安全下的安全组 在弹出的安全组中,如果没有就新建安全组,然后点击配置规则 最后如上图点击添加...或快速创建.   have fun!  将编程看作是一门艺术,而不单单是个技术。
8970 0
TelecomLocate ---- Android与服务器端实时运动数据传输渲染与轨迹分类可视化
本应用是通过Android应用程序记录用户运动轨迹的数据,并将数据保存在服务器上。服务器上基于Play2框架的web应用程序,可以将运动数据可视化,并进行分类。
188 0
使用Portainer或者UI for Docker可视化管理你的树莓派容器
本文讲的是使用Portainer或者UI for Docker可视化管理你的树莓派容器【编者的话】Stefan Scherer是Docker海盗船长,微软MVP。专注于Docker技术在ARM体系中应用。
4147 0
2016年研究数据可视化最不应该错过的10篇文章
2016年是数据可视化渐趋成熟的一年,越来越多的领域开始认识到数据可视化的重要性。同样在这一年,涌现出了大量关于数据可视化的文章,其中不乏富有创见性的观点和研究。我们选出了以下10篇最具启发性的文章,并给出了简短的介绍和评述。
1450 0
MetricGraphics.js – 时间序列数据的可视化
  MetricsGraphics.js 是建立在D3的基础上,被用于可视化和布局的时间序列数据进行了优化。它提供以产生一个原则性的,一致的和响应式的方式的图形常见类型的简单方法。该库目前支持折线图,散点图和直方图,以及地毯地块和基本线性回归功能。
693 0
147
文章
1
问答
来源圈子
更多
文章排行榜
最热
最新
相关电子书
更多
《Nacos架构&原理》
立即下载
《看见新力量:二》电子书
立即下载
云上自动化运维(CloudOps)白皮书
立即下载