性感的数据可视化 —— 精讲桑基图、气泡图、南丁格尔玫瑰图

本文涉及的产品
智能数据建设与治理Dataphin,200数据处理单元
简介: 文章主要为大家介绍三个可视化故事,和他们使用的三个重要的可视化组件:桑基图、气泡图、南丁格尔玫瑰图。

前言:更多关于数智化转型、数据中台内容可扫码加群一起探讨
668d7f5941782665ed1f41529db3eb677f4b9379.png
阿里云数据中台官网 https://dp.alibaba.com/index


(作者:常成)

2019年的“凯度信息之美奖”揭晓了,有很多很有意思的信息可视化作品。很多作品看到的时候都被感动到,数据/信息不再是冷冰冰的,而是立体的,通过可视化可以让人们更清晰的看到和感受到作者想表达的信息,比文字更加直接。选择了合适的数据可视化组件,就会有魔力,让你想传达的信息变得生动起来。

 

这里介绍三个可视化作品和故事,和他们使用的三个重要的可视化组件:桑基图、气泡图、南丁格尔玫瑰图

1. “凯度信息之美奖”的人道主义类金奖 - 《看不见的罪行:我们是否让性侵受害者失望了?》

22.png

作者研究了很多性暴力事件,采访了很多性侵幸存者,通过「桑基图」来展示性暴力事件有多少被起诉,为什么社会系统没能为受害者伸张正义。这每一个数字背后都是受到伤害的人们。

 

桑基图的使用场景
桑基图(Sankey diagram),即桑基能量分流图,也叫桑基能量平衡图。因1898年Matthew Henry Phineas Riall Sankey绘制的“蒸汽机的能源效率图”而闻名,此后便以其名字命名为“桑基图”。

使用桑基图能够很好的表达数据的流动,可以非常明显的看到整体数据和各个阶段的流向。

上面那个例子中一方面可以很清晰地看到向警方报告的性暴力事件,最终都流向了什么样的结果。另一方面,最初报告的事件数和最终判决的对比也是如此的强烈。

因为能够非常直观的表达出数据的流向,并且简单易懂,桑基图的应用场景越来越多,也被大量应用于媒体中。另外在网站/APP的流量/用户行为数据分析中也得到了大量的应用,分析用户从哪些落地页进入,又因为什么页面跳出,在网站中如何流动。比如Google Analytics中的页面流/事件流。

 

2.  汉斯·罗斯林告诉我们的《事实》

“你觉得数据无聊是因为这不是你想知道的,或者说你并没有意识到这些数据和真实世界的联系。” —— 汉斯·罗斯林
5.jpg

统计学家汉斯·罗斯林在大学授课的时候发现大家对这个世界有很多误解,所以他将后半生都致力于将真实信息传达给世界。在他最出名的一次演讲中他用气泡图,用 12 万个数据解释 200 个国家 200 年的发展。

 

这个气泡图中每个气泡代表一个国家,横轴是各个人均收入,纵轴是寿命,气泡大小表示人口,那两个大红点分别是中国和印度。

可以看出来各个国家在过去200年都逐渐往右上角移动,更高的收入,更高的寿命,世界在一点点的变好。

 

气泡图的使用场景

气泡图可以用于展示三个度量之间的相关关系,或者同时呈现三维数据。

比如罗斯林的这个图,同时向我们展示了每个国家的:人均收入、寿命、人口。同时气泡基本分布在一条斜线上,人均收入和寿命有一定的相关性。

 

  1. 南丁格尔用「玫瑰图」挽救了千万人的生命
    3.jpg

这是一张19世纪50年代的图表,当时英国、法国、土耳其和俄国正在进行克里米亚战争。南丁格尔主动申请,自愿担任战地护士。南丁格尔发现改善医疗环境可以降低死亡率,所以做了这个图,向政府说明应该改善战地医院的条件来拯救更多年轻的生命。右侧的玫瑰图表示1854 年 4 月至 1955 年 3 月每月的死亡率,每月死亡率都非常高,高达42%。左侧的玫瑰图表示1955年3月卫生委员会改善了卫生环境之后,死亡率得到了大幅下降,戏剧性地降至 2.5%。另外图中灰色区域表示糟糕的医疗环境的感染导致的死亡,可以看到大部分的伤亡并非直接来自战争,而是因为医疗环境。

左右2个图的大小对比出卫生环境改善前后死亡率的变化,各种颜色扇区的面积强烈对比出环境对死亡的影响。

这样强烈的对比让政府相关官员了解到:改善医院的医疗状况可以显著的降低英军的死亡率,最终挽救了千万人的生命。这种新型的图表也由此得名,因为外形很像一朵绽放的玫瑰,这种图表也被称为“南丁格尔玫瑰图”。

 

南丁格尔玫瑰图的使用场景

这种图表适合用于对比各类别的数据,而相比柱图/条形图等图表类型来说,南丁格尔玫瑰图能够放大数据差异。因为它使用扇区半径来表示数据的大小,半径和面积的关系是平方的关系,用户直觉上会通过面积来感知差异,所以它会将数据的比例大小夸大。这种放大数据差异的效果尤其适合对比大小相近的数值,或者像南丁格尔一样就是希望突出数据差异的场景。

当然在使用这个图表的时候需要注意,因为它夸大了数据的差异,比如两个类别数据原本差10倍,用这个图表就会给人一种差100倍的感觉。所以如果希望客观的展示数据,还是建议使用柱图等图表类型。
 

这里想告诉小伙伴们,使用Quick BI,可以快速制作桑基图、气泡图、玫瑰图哦。
(**智能数据分析与可视化-Quick BI:专为云上用户和企业量身打造的新一代自助式智能BI服务平台,简单易用的可视化操作和灵活高效的多维分析能力,让精细化数据洞察为商业决策保驾护航。
中国唯一进入Gartner魔力象限BI产品,此次联合钉钉协同升级,“随时随地、智能决策”。**)
在Quick BI上,可以通过简单的勾勾选选就能做出桑基图、气泡图、玫瑰图。

快来使用试试哦,通过数据可视化,让你的汇报、故事更性感吧~

PS:
凯度信息之美奖:  https://www.informationisbeautifulawards.com/news/485-information-is-beautiful-awards-2019-the-winners
汉斯·罗斯林用前所未有的好方法诠释数字统计:https://www.ted.com/talks/hans_rosling_the_best_stats_you_ve_ever_seen?language=zh-cn
汉斯·罗斯林的非营利机构: https://www.gapminder.org/


数据中台是企业数智化的新基建,阿里巴巴认为数据中台是集方法论、工具、组织于一体的,“快”、“准”、“全”、“统”、“通”的智能大数据体系。目前正通过阿里云数据中台解决方案对外输出,包括零售、金融、互联网等行业,其中核心产品有:

数据中台官网 https://dp.alibaba.com
数据中台钉钉群二维码2.jpg


相关实践学习
AnalyticDB PostgreSQL 企业智能数据中台:一站式管理数据服务资产
企业在数据仓库之上可构建丰富的数据服务用以支持数据应用及业务场景;ADB PG推出全新企业智能数据平台,用以帮助用户一站式的管理企业数据服务资产,包括创建, 管理,探索, 监控等; 助力企业在现有平台之上快速构建起数据服务资产体系
相关文章
|
缓存 NoSQL 关系型数据库
13- Redis和Mysql如何保证数据⼀致?
该内容讨论了保证Redis和MySQL数据一致性的几种策略。首先提到的两种方法存在不一致风险:先更新MySQL再更新Redis,或先删Redis再更新MySQL。第三种方案是通过MQ异步同步以达到最终一致性,适用于一致性要求较高的场景。项目中根据不同业务需求选择不同方案,如对一致性要求不高的情况不做处理,时效性数据设置过期时间,高一致性需求则使用MQ确保同步,最严格的情况可能涉及分布式事务(如Seata的TCC模式)。
218 6
|
SQL 存储 大数据
【大数据技术Hadoop+Spark】Hive基础SQL语法DDL、DML、DQL讲解及演示(附SQL语句)
【大数据技术Hadoop+Spark】Hive基础SQL语法DDL、DML、DQL讲解及演示(附SQL语句)
521 0
|
3月前
|
自然语言处理 API 语音技术
是时候说点方言了,Qwen-TTS上新!
Qwen-TTS更新支持北京话、上海话和四川话三种中文方言,新增七种中英双语音色。模型基于超300万小时语料训练,合成语音自然流畅,可自动调整韵律与情绪。用户可通过Qwen API便捷调用,体验多语言、多风格的高质量语音生成服务。
732 1
|
7月前
|
JSON 监控 物联网
#WebSocket 调试全攻略:Postman、Apipost和Apifox核心解析、工具选择与对比!
WebSocket 是一种现代化的全双工通信协议,允许客户端和服务端通过持久连接实时双向传输数据。它适用于即时通讯、实时通知、金融行情、在线协作、物联网等场景。调试 WebSocket 时,工具应具备握手管理、实时消息收发、自定义 Header、消息大小监控、分组管理、多连接支持等功能。
611 1
|
数据可视化 JavaScript 前端开发
惊世奇迹!D3.js 铸就数据可视化辉煌,探索交互式图表与效果的奇幻之旅!
【8月更文挑战第12天】在数据驱动的时代,D3.js 作为领先的 JavaScript 库,以其强大的功能和灵活性在数据可视化领域脱颖而出。开发者可通过 D3.js 构建精美的交互式图表,如简单的柱状图或具备缩放拖拽功能的折线图,甚至将数据以地图、树形结构等独特形式展现。尽管学习曲线陡峭,但它在数据分析、商业智能等领域的广泛应用使其成为专业人士传达数据故事、辅助决策制定的强大工具。
279 1
|
机器学习/深度学习 人工智能 自然语言处理
自然语言处理:实现智能问答系统的关键技术
自然语言处理在实现智能问答系统中起着重要作用。通过文本预处理、信息检索、语义理解和答案生成等关键技术,我们可以构建高效准确的智能问答系统,为用户提供便捷的信息获取方式。随着深度学习等技术的发展,智能问答系统的性能还将得到进一步提升,为人们提供更加智能化的服务。
1096 0
|
存储 大数据 Apache
深入理解ZooKeeper:分布式协调服务的核心与实践
【5月更文挑战第7天】ZooKeeper是Apache的分布式协调服务,确保大规模分布式系统中的数据一致性与高可用性。其特点包括强一致性、高可用性、可靠性、顺序性和实时性。使用ZooKeeper涉及安装配置、启动服务、客户端连接及执行操作。实际应用中,面临性能瓶颈、不可伸缩性和单点故障等问题,可通过水平扩展、集成其他服务和多集群备份来解决。理解ZooKeeper原理和实践,有助于构建高效分布式系统。
|
开发框架 .NET
ASP.NET Core获取请求完整的Url
ASP.NET Core获取请求完整的Url
647 0
ASP.NET Core获取请求完整的Url
|
数据可视化 API 算法框架/工具
Python用T-SNE非线性降维技术拟合和可视化高维数据iris鸢尾花、MNIST 数据
Python用T-SNE非线性降维技术拟合和可视化高维数据iris鸢尾花、MNIST 数据
|
开发框架 前端开发 JavaScript
LayUI的使用
LayUI的使用
511 0