14个Seaborn数据可视化图(下)

简介: 14个Seaborn数据可视化图

d.Violin图

它类似于箱型图,但它也提供了关于数据分布的补充信息。

importseabornassnssns.violinplot(y=df['Age'], x=df['Sex'])

640.png

图9:“年龄”和“性别”之间的violin图

高级绘制方法

a.strip图

  • 这是一个连续变量和分类变量之间的图。
  • 它以散点图为主,但补充使用分类变量的分类编码。
importseabornassnssns.stripplot(y=df['Age'], x=df['Pclass'])

640.png

图10:“年龄”与“p-class”之间的条形图

  • 我们可以看到,1班和2班没有10岁左右的儿童,60岁以上的儿童多集中在1班。
  • 通常,这种图被用来填补缺失值。

b.swarm图

  • 这是一个strip图和violin图的结合。
  • 除了数据点的数量,它还提供了它们各自的分布。
importseabornassnssns.swarmplot(y=train['Age'], x=train['Pclass'])

640.png

图11:‘年龄’与‘P-class’之间的swarm图

矩阵图

这些是使用二维矩阵数据进行可视化的特殊类型的图形。由于矩阵数据的维数较大,很难对其进行分析和可视化。因此,通过为矩阵数据提供颜色编码,使这个更容易。

a.热力图

  • 在给定的原始数据集“df”中,我们有七个数值变量。那么,让我们在这七个变量之间生成一个相关矩阵。
df.corr()

640.png

图12:关联矩阵

  • 虽然只有49个值,但要读取每个值似乎非常困难。因为我们遍历数以千计的特征。
    所以,让我们尝试实现一些颜色编码,这会大大简化模型。
sns.heatmap(df.corr(), annot=True, cmap='viridis')

640.png

图13:泰坦尼克号数据集的关联矩阵热图。

  • 同样的矩阵现在表达了更多的信息。
  • 另一个非常明显的例子是使用heatmap来理解缺失的值。在图14中,黄色的虚线表示一个缺失的值,因此它使我们的任务更容易识别缺失的值。
sns.heatmap(df.isnull(),yticklabels=False,cbar=False,cmap='viridis')

640.png

图14:泰坦尼克号数据中缺失值的热图。

b.聚类图

  • 如果我们有一个矩阵数据,并想要根据其相似性对一些特征进行分组,聚类映射可以帮助我们。先看一下热图(图13),然后再看一下聚类图(图15)。
sns.clustermap(tran.corr(), annot='True',cmap='viridis')

640.png

图15:泰坦尼克号数据关联矩阵的聚类图

  • x-label和y-label是一样的,但是它们协调的方式不同。这是因为它们是根据它们的相似性分组的。
  • 顶部和左侧的类似流程图的结构描述了它们的相似程度。
  • 聚类图使用层次聚类来形成不同的集群。

网格

网格图为我们提供了对可视化的更多控制,并通过一行代码绘制各种各样的图形。

a.面网格

  • 假设我们想要绘制所有三类票中男性和女性的年龄分布,我们总共有6个图。
sns.FacetGrid(train, col='Pclass', row='Sex').map(sns.distplot, 'Age')

640.png

图16:“性别”和“p-class”的“年龄”分布图

  • 面网格可以按要求提供非常清晰的图形。
  • sns.FacetGrid( col = ‘col’, row = ‘row’, data = data) 提供一个包含col和行中所有唯一类别的空网格。之后,我们可以使用不同的图和常见的变量来进行特殊的变化。

回归图

这是一个更高级的统计图,它提供了散点图以及对数据的线性拟合。

sns.lmplot(x='Age', y='PassengerId', data=df, hue='Sex)

640.png

图17:男女乘客年龄与身份证的回归图。

图17为男女乘客身份证与年龄的线性回归拟合。

总结

在本文中,我们看到了14种使用seaborn的可视化技术。

我相信数据可视化增强了我们对数据解释的理解和潜力。它给我们提供了更令人满意的技能来表示数据,输入缺失值,识别异常值,检测异常,以及更多。

数据分析师就像警察一样,需要询问数据并通过它们得到信息。使用合适的工具来完成这项工作是非常必要的。因此,我希望这篇文章能够成为您查询数据的工具。

目录
相关文章
|
15天前
|
数据可视化 DataX Python
Seaborn 教程-绘图函数
Seaborn 教程-绘图函数
43 8
|
15天前
Seaborn 教程-主题(Theme)
Seaborn 教程-主题(Theme)
42 7
|
15天前
|
Python
Seaborn 教程-模板(Context)
Seaborn 教程-模板(Context)
42 4
|
15天前
|
数据可视化 Python
Seaborn 教程
Seaborn 教程
37 5
|
18天前
|
数据可视化 Python
以下是一些常用的图表类型及其Python代码示例,使用Matplotlib和Seaborn库。
通过这些思维导图和分析说明表,您可以更直观地理解和选择适合的数据可视化图表类型,帮助更有效地展示和分析数据。
60 8
|
25天前
|
数据可视化 Python
使用Python进行数据可视化的初学者指南
在数据的海洋里,我们如何能够不迷失方向?通过数据可视化的力量,我们可以将复杂的数据集转化为易于理解的图形和图表。本文旨在为初学者提供一份简明的入门手册,介绍如何使用Python中的Matplotlib库来揭示数据背后的故事。我们将从基础的图表开始,逐步深入到更高级的可视化技术,确保每个步骤都清晰易懂,让初学者也能轻松上手。让我们开始绘制属于你自己的数据图谱吧!
|
1月前
|
机器学习/深度学习 人工智能 数据可视化
使用Python进行数据可视化:探索与实践
在数字时代的浪潮中,数据可视化成为了沟通复杂信息和洞察数据背后故事的重要工具。本文将引导读者通过Python这一强大的编程语言,利用其丰富的库函数,轻松入门并掌握数据可视化的基础技能。我们将从简单的图表创建开始,逐步深入到交互式图表的制作,最终实现复杂数据的动态呈现。无论你是数据分析新手,还是希望提升报告吸引力的专业人士,这篇文章都将是你的理想指南。
49 9
|
1月前
|
数据可视化 数据处理 Python
Python编程中的数据可视化技术
在Python编程中,数据可视化是一项强大的工具,它能够将复杂的数据集转化为易于理解的图形。本文将介绍如何使用matplotlib和pandas这两个流行的Python库来实现数据可视化,并展示一些实用的代码示例。通过这些示例,读者将学会如何创建各种图表,包括折线图、柱状图和散点图等,以便更好地理解和呈现数据。
|
1月前
|
数据可视化 数据挖掘 定位技术
Python和Geopandas进行地理数据可视化
【10月更文挑战第22天】本文介绍了如何使用Python和Geopandas进行地理数据可视化和分析,涵盖从准备工作、加载数据、数据探索与处理、地理数据可视化、空间分析与查询到交互式地理数据可视化等内容。通过丰富的代码示例和案例演示,帮助读者掌握地理数据分析的基本方法,为实际应用提供支持。
112 19
|
1月前
|
移动开发 数据可视化 数据挖掘
利用Python实现数据可视化:以Matplotlib和Seaborn为例
【10月更文挑战第37天】本文旨在引导读者理解并掌握使用Python进行数据可视化的基本方法。通过深入浅出的介绍,我们将探索如何使用两个流行的库——Matplotlib和Seaborn,来创建引人入胜的图表。文章将通过具体示例展示如何从简单的图表开始,逐步过渡到更复杂的可视化技术,帮助初学者构建起强大的数据呈现能力。