14个Seaborn数据可视化图(上)

简介: 14个Seaborn数据可视化图

调查数据并从中提取信息和趋势的工具。


640.png

绿色代表新的开始和成长,也意味着更新和丰富。

数据可视化在数据挖掘中起着非常重要的作用。各种数据科学家花费了他们的时间通过可视化来探索数据。为了加快这一进程,我们需要有合适的工具。

没有规划的情况下,资源也无法转化为有价值的商品。因此,我希望本文能够为您提供关于所有可视化方法的架构。

目录

  1. 简介
  2. 了解你的数据
  3. 分布曲线
    a. 直方图b. 联合图c. 配对图d. Rug图
  4. 分布图a. 条形图b. 统计图c. 箱型图d. Violin图
  5. 高级绘制方法a. Strip图b. Swarm图
  6. 矩阵图a. Heat Mapb. Cluster Map
  7. 网格a. Facet Grid
  8. 回归图

简介

Seaborn是一个基于matplotlib的Python数据可视化库。它提供了一个高级界面,以绘制曲线和信息统计图形。

您可以在命令行中运行以下任何一个命令来安装Seaborn。

pipinstallseaborncondainstallseaborn

运行以下命令可以导入seaborn。

importseabornassns

了解你的数据

图中使用的数据集为著名的泰坦尼克数据集(图1),下面将数据集用变量df表示。

640.png

图1:泰坦尼克数据集

分布曲线

我们可以使用这些图来理解数据的平均值、中位数、范围、方差、偏差等。

a. 直方图

  • Dist plot给出了所选连续变量的直方图。
  • 这是单变量分析的一个例子。
  • 我们可以改变箱子的数量,即直方图中垂直条的数量
importseabornassnssns.distplot(x=df['age'], bins=10)

640.png

图2:乘客“年龄”分布图。

  • 这里x轴表示年龄,y轴表示频率。例如,对于Bins= 10的分布图,大约有50个人年龄在0到10岁之间

b.联合图

  • 它是两个变量的组合。
  • 这是一个二元分析的例子。
  • 我们还得到了变量之间的散点图来反映它们的线性关系。我们可以自定义散点图为六边形图,其中,颜色越深,出现的次数就越多。
importseabornassns#ForPlot1sns.jointplot(x=df['age'], y=df['Fare'], kind='scatter')#ForPlot2sns.jointplot(x=df['age'], y=df['Fare'], kind='hex')

640.png

图3:“年龄”和“票价”的联合图

  • 我们可以看到,年龄和票价之间并没有合适的线性关系。
  • kind = ' hex '提供了六边形图,kind = ' reg '提供了图形上的回归线。

c.配对图

  • 它取数据的所有数值属性,绘制两个不同变量的两两散点图和同一变量的直方图。
importseabornassnssns.pairplot(df)

640.png

图4:泰坦尼克号数据集配对图

d.Rug图

  • 它画了一条线,而不是像在直方图中那样二维分布图。
  • 这是单变量分析的一个例子。
importseabornassnssns.rugplot(x=df['Age'])

640.png

图5:乘客“年龄”的Rug图

分类图

这些图帮助我们理解分类变量。我们可以用它们进行单变量和双变量分析。

a.条形图

  • 这是一个二元分析的例子。
  • 在x轴上有一个分类变量,在y轴上有一个连续变量。
importseabornassnssns.barplot(x=df['Sex'], y=df['Fare'])

640.png

图6:“车费”和“性别”的条形图

  • 我们可以推断出女性的平均票价比男性高。

b.统计图

  • 它计算分类变量出现的次数。
  • 这是单变量分析的一个例子。
importseabornassnssns.countplot(df['Pclass'])

640.png

图7:是否幸存和' P-class '的计数图。

c.箱型图

  • 这是一个总结图。它给出了一个连续变量的最大值、最小值、平均值、第一个四分位数和第三个四分位数的信息。同时,它让我们掌握了离群值的信息。
  • 我们可以对一个连续变量进行绘图,也可以根据一个连续变量分析不同的分类变量。
importseabornassns#Forplot1sns.countplot(df['Pclass'])#Forplot2sns.boxplot(y=df['Age'], x=df['Sex'])

640.png

图8:a)“年龄”的箱形图,b)“年龄”和“性别”不同类别的箱形图

目录
相关文章
|
17天前
|
数据可视化 数据挖掘 定位技术
Python和Geopandas进行地理数据可视化
【10月更文挑战第22天】本文介绍了如何使用Python和Geopandas进行地理数据可视化和分析,涵盖从准备工作、加载数据、数据探索与处理、地理数据可视化、空间分析与查询到交互式地理数据可视化等内容。通过丰富的代码示例和案例演示,帮助读者掌握地理数据分析的基本方法,为实际应用提供支持。
59 19
|
13天前
|
移动开发 数据可视化 数据挖掘
利用Python实现数据可视化:以Matplotlib和Seaborn为例
【10月更文挑战第37天】本文旨在引导读者理解并掌握使用Python进行数据可视化的基本方法。通过深入浅出的介绍,我们将探索如何使用两个流行的库——Matplotlib和Seaborn,来创建引人入胜的图表。文章将通过具体示例展示如何从简单的图表开始,逐步过渡到更复杂的可视化技术,帮助初学者构建起强大的数据呈现能力。
|
29天前
|
数据可视化 数据挖掘 Python
使用Python进行数据可视化:探索与实践
【10月更文挑战第21天】本文旨在通过Python编程,介绍如何利用数据可视化技术来揭示数据背后的信息和趋势。我们将从基础的图表创建开始,逐步深入到高级可视化技巧,包括交互式图表和动态展示。文章将引导读者理解不同图表类型适用的场景,并教授如何使用流行的库如Matplotlib和Seaborn来制作美观且具有洞察力的可视化作品。
47 7
|
28天前
|
数据可视化 定位技术 Python
使用Python进行数据可视化
【10月更文挑战第22天】在这篇文章中,我们将深入探讨如何使用Python进行数据可视化。我们将从基础的图表开始,然后逐步进入更复杂的可视化技术。我们将通过实例代码来展示如何实现这些可视化,以便读者能够更好地理解和应用这些技术。
25 5
|
29天前
|
数据可视化 Python
使用Python进行数据可视化的初学者指南
【10月更文挑战第20天】本文旨在为编程新手提供一个简洁明了的入门指南,通过Python语言实现数据可视化。我们会介绍如何安装必要的库、理解数据结构,并利用这些知识来创建基本图表。文章将用通俗易懂的语言和示例代码,帮助读者快速掌握数据可视化的基础技能。
32 4
|
1月前
|
数据可视化 数据挖掘 Python
Seaborn 库创建吸引人的统计图表
【10月更文挑战第11天】本文介绍了如何使用 Seaborn 库创建多种统计图表,包括散点图、箱线图、直方图、线性回归图、热力图等。通过具体示例和代码,展示了 Seaborn 在数据可视化中的强大功能和灵活性,帮助读者更好地理解和应用这一工具。
41 3
|
1月前
|
数据可视化 开发者 Python
使用Python进行数据可视化:从入门到精通
【10月更文挑战第7天】本文将引导您通过Python的可视化库,如Matplotlib和Seaborn,来探索和展示数据。我们将通过实际代码示例,学习如何创建各种图表,包括条形图、散点图和直方图等,并讨论如何优化这些图表以更好地传达信息。无论您是初学者还是有一定基础的开发者,这篇文章都能帮助您提高数据可视化技能。
|
1月前
|
数据可视化 Python
Python编程之数据可视化入门
【10月更文挑战第4天】在数字时代的洪流中,数据如同星辰般璀璨,而将它们绘制成图表,便是我们探索宇宙的方式。本文将带你启航,用Python这艘航船,驶向数据可视化的奥秘。我们将从安装必要的工具包开始,逐步深入到数据的呈现,最后通过代码示例点亮知识的灯塔,指引你在数据海洋中航行。让我们握紧舵盘,乘风破浪,揭开数据背后的故事吧!
|
30天前
|
数据可视化 数据挖掘 定位技术
Python中利用Bokeh创建动态数据可视化
【10月更文挑战第14天】本文介绍了如何使用 Bokeh 库在 Python 中创建动态数据可视化。Bokeh 是一个强大的开源可视化工具,支持交互式图表和大规模数据集的可视化。文章从安装 Bokeh 开始,逐步讲解了如何创建动态折线图,并添加了交互式控件如按钮、滑块和下拉菜单,以实现数据更新频率的调节和颜色选择。通过这些示例,读者可以掌握 Bokeh 的基本用法,进一步探索其丰富功能,创建更具吸引力和实用性的动态数据可视化。
30 0
|
1月前
|
数据可视化 定位技术 Python
Python数据可视化--Matplotlib--入门
Python数据可视化--Matplotlib--入门
29 0
下一篇
无影云桌面