Python数据可视化2.6 一些最好的可视化实践

简介:

2.6 一些最好的可视化实践


我们完成一个好的可视化的最首要一步是了解努力背后的目标。如何了解可视化是否有其意图?同样重要的是了解观众群以及这种方式是否有帮助。

一旦回答了这些问题并透彻理解可视化的目标,那么下一个挑战就是选择正确的呈现方法。最常用的可视化类型可根据下述内容进一步分类:

比较和排名

相关性

分布

位置定位或地理数据

局部到整体的关系

随时间的变化趋势

2.6.1 比较和排名

比较和排名的方法不止一种,传统的方法使用条形图。条形图是在相同基线上以编码数值为长度的图形。但它并不总是比较和排名的最佳方法。例如,为了展示非洲GDP排名前12名的国家,下面是一种创造性的可视化方式(来源:Stats Legend,Andrew Gelman and Antony Unwin):

 

2.6.2 相关性

相关性不能保证一种关系,但一种简单的相关性分析是识别不同测度间关系的良好开端。通常需要一种统计方法来确保关系的真实存在。下面的例子是通过构建一个简单的散点图来检测两个因子间关系,比如同一所大学中学生的gpa和tv,gpa和exercise:

 

我们也可以用其他方法展示相关矩阵。比如,可以用散点图、热力图,或一些特定的案例来展示S&P 100中股票的影响力网。(下面两个图来自Statistical Tools for High Throughput Analysis,网址是:http://www.sthda.com。)需要进一步强调,一个相关矩阵包括数据的矩阵形式。如下面的例子所示,数据通过一个缩放后的颜色图计算相关性。为了解更多细节,我们建议您参考下面的网站:http://www.sthda.com。

 

相关矩阵被用来研究同一时间多个变量间的依赖性。结果是一张表,包括每一个变量与其他变量的相关系数。热力图源于数据矩阵形式的二维展示。通过很多不同的颜色方案来说图解热力图,每一种方案都有感知优点和缺点。

 

2.6.3 分布

分布分析展示了数值在区间范围内的分布,因此,在数据分析中非常有用。比如,比较同一个班的学生在家庭作业、期中考试、期末考试和全部课程成绩的得分分布。在这个例子中,我们将讨论使用最普遍的两种图表类型来实现这个目的。一种是直方图(如下图所示),另一种是箱线图或箱须图。

 

直方图的形状非常依赖于箱子的大小和位置。箱须图特别适用于多元分布。它们将所有数据点(在这个例子中是学生的得分)打包入箱须图中。现在,你可以很容易识别出所有类别中的最小值、25%分位数、中位数、75%分位数和最大值,这些都能同时进行。

 

Python中有一种便捷的画图方法Plotly它是一种在线分析和可视化工具。Plotly提供在线画图、分析和统计工具,还有Python、R、Julia和JavaScript的科学绘图库。直方图和箱线图的案例请见:https://plot.ly/python/histograms-and-box-plots-tutorial。

2.6.4 位置定位或地理数据

地图是展示位置定位数据的最佳方法。地图最适用于与另外一个图配对的情况,该图详细说明了地图的展示内容(比如条形图按从大到小排序,线图展示趋势,等等)。比如,下面的地图展示了不同大洲之间地震的强度:

 

2.6.5 局部到整体的关系

饼图适用于展示局部到整体的关系,但还有其他方式。分组的条形图适用于比较类别中每个元素与其他元素,以及所有类别的元素。然而,分组使区分每个组的整体差异变得更难。下图是累积柱形图。

 

累积柱形图适用于展示整体差异,这是因为它们在视觉上聚集同一个组中的所有类别。不足之处是比较单个类别大小变得更难。这种累积方式也展示出一种局部到整体的关系。

2.6.6 随时间的变化趋势

最常用类进行数据分析的可视化方法是展示一段时间的变化趋势。在下面的例子中,2009~2015年穿戴式设备的初创公司投资情况被画成图。该图表明,该项投资在几年中持续增长;而在2013年,只有43起总价值$166百万的交易,所有年份中最高点是2014年61起总价值$427百万的交易,相比仅一年前。

 

相关文章
|
19天前
|
Python
深入理解Python装饰器:从入门到实践####
本文旨在通过简明扼要的方式,为读者揭开Python装饰器的神秘面纱,从基本概念、工作原理到实际应用场景进行全面解析。不同于常规的摘要仅概述内容概要,本文将直接以一段精炼代码示例开篇,展示装饰器如何优雅地增强函数功能,激发读者探索兴趣,随后深入探讨其背后的机制与高级用法。 ####
47 11
|
15天前
|
机器学习/深度学习 人工智能 TensorFlow
人工智能浪潮下的自我修养:从Python编程入门到深度学习实践
【10月更文挑战第39天】本文旨在为初学者提供一条清晰的道路,从Python基础语法的掌握到深度学习领域的探索。我们将通过简明扼要的语言和实际代码示例,引导读者逐步构建起对人工智能技术的理解和应用能力。文章不仅涵盖Python编程的基础,还将深入探讨深度学习的核心概念、工具和实战技巧,帮助读者在AI的浪潮中找到自己的位置。
|
10天前
|
机器学习/深度学习 人工智能 数据可视化
使用Python进行数据可视化:探索与实践
在数字时代的浪潮中,数据可视化成为了沟通复杂信息和洞察数据背后故事的重要工具。本文将引导读者通过Python这一强大的编程语言,利用其丰富的库函数,轻松入门并掌握数据可视化的基础技能。我们将从简单的图表创建开始,逐步深入到交互式图表的制作,最终实现复杂数据的动态呈现。无论你是数据分析新手,还是希望提升报告吸引力的专业人士,这篇文章都将是你的理想指南。
28 9
|
22天前
|
数据可视化 数据挖掘 定位技术
Python和Geopandas进行地理数据可视化
【10月更文挑战第22天】本文介绍了如何使用Python和Geopandas进行地理数据可视化和分析,涵盖从准备工作、加载数据、数据探索与处理、地理数据可视化、空间分析与查询到交互式地理数据可视化等内容。通过丰富的代码示例和案例演示,帮助读者掌握地理数据分析的基本方法,为实际应用提供支持。
68 19
|
15天前
|
设计模式 缓存 开发框架
Python中的装饰器:从入门到实践####
本文深入探讨了Python中装饰器的工作原理与应用,通过具体案例展示了如何利用装饰器增强函数功能、提高代码复用性和可读性。读者将学习到装饰器的基本概念、实现方法及其在实际项目开发中的实用技巧。 ####
26 3
|
18天前
|
机器学习/深度学习 数据采集 数据可视化
Python在数据科学中的应用:从入门到实践
本文旨在为读者提供一个Python在数据科学领域应用的全面概览。我们将从Python的基础语法开始,逐步深入到数据处理、分析和可视化的高级技术。文章不仅涵盖了Python中常用的数据科学库,如NumPy、Pandas和Matplotlib,还探讨了机器学习库Scikit-learn的使用。通过实际案例分析,本文将展示如何利用Python进行数据清洗、特征工程、模型训练和结果评估。此外,我们还将探讨Python在大数据处理中的应用,以及如何通过集成学习和深度学习技术来提升数据分析的准确性和效率。
|
17天前
|
移动开发 数据可视化 数据挖掘
利用Python实现数据可视化:以Matplotlib和Seaborn为例
【10月更文挑战第37天】本文旨在引导读者理解并掌握使用Python进行数据可视化的基本方法。通过深入浅出的介绍,我们将探索如何使用两个流行的库——Matplotlib和Seaborn,来创建引人入胜的图表。文章将通过具体示例展示如何从简单的图表开始,逐步过渡到更复杂的可视化技术,帮助初学者构建起强大的数据呈现能力。
|
17天前
|
数据采集 IDE 测试技术
Python实现自动化办公:从基础到实践###
【10月更文挑战第21天】 本文将探讨如何利用Python编程语言实现自动化办公,从基础概念到实际操作,涵盖常用库、脚本编写技巧及实战案例。通过本文,读者将掌握使用Python提升工作效率的方法,减少重复性劳动,提高工作质量。 ###
34 1
|
18天前
|
机器学习/深度学习 数据采集 人工智能
探索机器学习:从理论到Python代码实践
【10月更文挑战第36天】本文将深入浅出地介绍机器学习的基本概念、主要算法及其在Python中的实现。我们将通过实际案例,展示如何使用scikit-learn库进行数据预处理、模型选择和参数调优。无论你是初学者还是有一定基础的开发者,都能从中获得启发和实践指导。
39 2
|
21天前
|
算法 Python
Python图论探索:从理论到实践,DFS与BFS遍历技巧让你秒变技术大牛
图论在数据结构与算法中占据重要地位,应用广泛。本文通过Python代码实现深度优先搜索(DFS)和广度优先搜索(BFS),帮助读者掌握图的遍历技巧。DFS沿路径深入搜索,BFS逐层向外扩展,两者各具优势。掌握这些技巧,为解决复杂问题打下坚实基础。
30 2