Python数据可视化2.6 一些最好的可视化实践

简介:

2.6 一些最好的可视化实践


我们完成一个好的可视化的最首要一步是了解努力背后的目标。如何了解可视化是否有其意图?同样重要的是了解观众群以及这种方式是否有帮助。

一旦回答了这些问题并透彻理解可视化的目标,那么下一个挑战就是选择正确的呈现方法。最常用的可视化类型可根据下述内容进一步分类:

比较和排名

相关性

分布

位置定位或地理数据

局部到整体的关系

随时间的变化趋势

2.6.1 比较和排名

比较和排名的方法不止一种,传统的方法使用条形图。条形图是在相同基线上以编码数值为长度的图形。但它并不总是比较和排名的最佳方法。例如,为了展示非洲GDP排名前12名的国家,下面是一种创造性的可视化方式(来源:Stats Legend,Andrew Gelman and Antony Unwin):

 

2.6.2 相关性

相关性不能保证一种关系,但一种简单的相关性分析是识别不同测度间关系的良好开端。通常需要一种统计方法来确保关系的真实存在。下面的例子是通过构建一个简单的散点图来检测两个因子间关系,比如同一所大学中学生的gpa和tv,gpa和exercise:

 

我们也可以用其他方法展示相关矩阵。比如,可以用散点图、热力图,或一些特定的案例来展示S&P 100中股票的影响力网。(下面两个图来自Statistical Tools for High Throughput Analysis,网址是:http://www.sthda.com。)需要进一步强调,一个相关矩阵包括数据的矩阵形式。如下面的例子所示,数据通过一个缩放后的颜色图计算相关性。为了解更多细节,我们建议您参考下面的网站:http://www.sthda.com。

 

相关矩阵被用来研究同一时间多个变量间的依赖性。结果是一张表,包括每一个变量与其他变量的相关系数。热力图源于数据矩阵形式的二维展示。通过很多不同的颜色方案来说图解热力图,每一种方案都有感知优点和缺点。

 

2.6.3 分布

分布分析展示了数值在区间范围内的分布,因此,在数据分析中非常有用。比如,比较同一个班的学生在家庭作业、期中考试、期末考试和全部课程成绩的得分分布。在这个例子中,我们将讨论使用最普遍的两种图表类型来实现这个目的。一种是直方图(如下图所示),另一种是箱线图或箱须图。

 

直方图的形状非常依赖于箱子的大小和位置。箱须图特别适用于多元分布。它们将所有数据点(在这个例子中是学生的得分)打包入箱须图中。现在,你可以很容易识别出所有类别中的最小值、25%分位数、中位数、75%分位数和最大值,这些都能同时进行。

 

Python中有一种便捷的画图方法Plotly它是一种在线分析和可视化工具。Plotly提供在线画图、分析和统计工具,还有Python、R、Julia和JavaScript的科学绘图库。直方图和箱线图的案例请见:https://plot.ly/python/histograms-and-box-plots-tutorial。

2.6.4 位置定位或地理数据

地图是展示位置定位数据的最佳方法。地图最适用于与另外一个图配对的情况,该图详细说明了地图的展示内容(比如条形图按从大到小排序,线图展示趋势,等等)。比如,下面的地图展示了不同大洲之间地震的强度:

 

2.6.5 局部到整体的关系

饼图适用于展示局部到整体的关系,但还有其他方式。分组的条形图适用于比较类别中每个元素与其他元素,以及所有类别的元素。然而,分组使区分每个组的整体差异变得更难。下图是累积柱形图。

 

累积柱形图适用于展示整体差异,这是因为它们在视觉上聚集同一个组中的所有类别。不足之处是比较单个类别大小变得更难。这种累积方式也展示出一种局部到整体的关系。

2.6.6 随时间的变化趋势

最常用类进行数据分析的可视化方法是展示一段时间的变化趋势。在下面的例子中,2009~2015年穿戴式设备的初创公司投资情况被画成图。该图表明,该项投资在几年中持续增长;而在2013年,只有43起总价值$166百万的交易,所有年份中最高点是2014年61起总价值$427百万的交易,相比仅一年前。

 

相关文章
|
8天前
|
存储 数据可视化 BI
Python可视化应用——学生成绩分布柱状图展示
本程序使用Python读取Excel中的学生成绩数据,统计各分数段人数,并通过Matplotlib库绘制柱状图展示成绩分布。同时计算最高分、最低分及平均分,实现成绩可视化分析。
38 0
|
6月前
|
存储 人工智能 运维
【01】做一个精美的打飞机小游戏,浅尝阿里云通义灵码python小游戏开发AI编程-之飞机大战小游戏上手实践-优雅草央千澈-用ai开发小游戏尝试-分享源代码和游戏包
【01】做一个精美的打飞机小游戏,浅尝阿里云通义灵码python小游戏开发AI编程-之飞机大战小游戏上手实践-优雅草央千澈-用ai开发小游戏尝试-分享源代码和游戏包
414 48
【01】做一个精美的打飞机小游戏,浅尝阿里云通义灵码python小游戏开发AI编程-之飞机大战小游戏上手实践-优雅草央千澈-用ai开发小游戏尝试-分享源代码和游戏包
|
2天前
|
数据采集 数据可视化 搜索推荐
Python数据分析全流程指南:从数据采集到可视化呈现的实战解析
在数字化转型中,数据分析成为企业决策核心,而Python凭借其强大生态和简洁语法成为首选工具。本文通过实战案例详解数据分析全流程,涵盖数据采集、清洗、探索、建模、可视化及自动化部署,帮助读者掌握从数据到业务价值的完整技能链。
24 0
|
1月前
|
数据采集 Web App开发 自然语言处理
利用Python构建今日头条搜索结果的可视化图表
利用Python构建今日头条搜索结果的可视化图表
|
2月前
|
人工智能 数据可视化 数据挖掘
如何使用Python进行数据可视化
Python是一种强大的编程语言,广泛应用于数据分析与可视化。常见的可视化库有Matplotlib、Seaborn和Plotly等。数据可视化通常包括以下步骤:准备数据(如列表或从文件读取)、选择合适的工具、绘制图表、优化样式(如标题和标签)以及保存或分享结果。例如,使用Matplotlib可通过简单代码绘制线图并添加标题和轴标签。实际应用中,可通过调整颜色、样式等进一步优化图表,甚至使用交互式工具提升效果。总之,Python的丰富工具为数据可视化提供了强大支持。
|
3月前
|
数据采集 数据可视化 数据挖掘
基于Python的App流量大数据分析与可视化方案
基于Python的App流量大数据分析与可视化方案
|
4月前
|
数据可视化 前端开发 数据挖掘
使用Folium在Python中进行地图可视化:全面指南
Folium是基于Python的交互式地图可视化库,依托Leaflet.js实现地理空间数据展示。本文从安装、基础使用到高级功能全面解析Folium:包括创建地图、添加标记、保存文件,以及绘制热力图、多边形和Choropleth地图等高级操作。通过展示北京市景点与全球地震数据的实际案例,结合性能优化、自定义样式和交互性增强技巧,帮助用户掌握Folium的核心功能与应用潜力,为数据分析提供直观支持。
249 2
|
7月前
|
数据可视化 数据挖掘 DataX
Python 数据可视化的完整指南
Python 数据可视化在数据分析和科学研究中至关重要,它能帮助我们理解数据、发现规律并以直观方式呈现复杂信息。Python 提供了丰富的可视化库,如 Matplotlib、Seaborn、Plotly 和 Pandas 的绘图功能,使得图表生成简单高效。本文通过具体代码示例和案例,介绍了折线图、柱状图、饼图、散点图、箱形图、热力图和小提琴图等常用图表类型,并讲解了自定义样式和高级技巧,帮助读者更好地掌握 Python 数据可视化工具的应用。
451 3
|
7月前
|
数据可视化 算法 数据挖掘
Python量化投资实践:基于蒙特卡洛模拟的投资组合风险建模与分析
蒙特卡洛模拟是一种利用重复随机抽样解决确定性问题的计算方法,广泛应用于金融领域的不确定性建模和风险评估。本文介绍如何使用Python和EODHD API获取历史交易数据,通过模拟生成未来价格路径,分析投资风险与收益,包括VaR和CVaR计算,以辅助投资者制定合理决策。
365 15
|
7月前
|
数据可视化 编译器 Python
Manim:数学可视化的强大工具 | python小知识
Manim(Manim Community Edition)是由3Blue1Brown的Grant Sanderson开发的数学动画引擎,专为数学和科学可视化设计。它结合了Python的灵活性与LaTeX的精确性,支持多领域的内容展示,能生成清晰、精确的数学动画,广泛应用于教育视频制作。安装简单,入门容易,适合教育工作者和编程爱好者使用。
1915 7

热门文章

最新文章

推荐镜像

更多