14个Seaborn数据可视化图(下)

简介: 14个Seaborn数据可视化图

d.Violin图

它类似于箱型图,但它也提供了关于数据分布的补充信息。

importseabornassnssns.violinplot(y=df['Age'], x=df['Sex'])

640.png

图9:“年龄”和“性别”之间的violin图

高级绘制方法

a.strip图

  • 这是一个连续变量和分类变量之间的图。
  • 它以散点图为主,但补充使用分类变量的分类编码。
importseabornassnssns.stripplot(y=df['Age'], x=df['Pclass'])

640.png

图10:“年龄”与“p-class”之间的条形图

  • 我们可以看到,1班和2班没有10岁左右的儿童,60岁以上的儿童多集中在1班。
  • 通常,这种图被用来填补缺失值。

b.swarm图

  • 这是一个strip图和violin图的结合。
  • 除了数据点的数量,它还提供了它们各自的分布。
importseabornassnssns.swarmplot(y=train['Age'], x=train['Pclass'])

640.png

图11:‘年龄’与‘P-class’之间的swarm图

矩阵图

这些是使用二维矩阵数据进行可视化的特殊类型的图形。由于矩阵数据的维数较大,很难对其进行分析和可视化。因此,通过为矩阵数据提供颜色编码,使这个更容易。

a.热力图

  • 在给定的原始数据集“df”中,我们有七个数值变量。那么,让我们在这七个变量之间生成一个相关矩阵。
df.corr()

640.png

图12:关联矩阵

  • 虽然只有49个值,但要读取每个值似乎非常困难。因为我们遍历数以千计的特征。
    所以,让我们尝试实现一些颜色编码,这会大大简化模型。
sns.heatmap(df.corr(), annot=True, cmap='viridis')

640.png

图13:泰坦尼克号数据集的关联矩阵热图。

  • 同样的矩阵现在表达了更多的信息。
  • 另一个非常明显的例子是使用heatmap来理解缺失的值。在图14中,黄色的虚线表示一个缺失的值,因此它使我们的任务更容易识别缺失的值。
sns.heatmap(df.isnull(),yticklabels=False,cbar=False,cmap='viridis')

640.png

图14:泰坦尼克号数据中缺失值的热图。

b.聚类图

  • 如果我们有一个矩阵数据,并想要根据其相似性对一些特征进行分组,聚类映射可以帮助我们。先看一下热图(图13),然后再看一下聚类图(图15)。
sns.clustermap(tran.corr(), annot='True',cmap='viridis')

640.png

图15:泰坦尼克号数据关联矩阵的聚类图

  • x-label和y-label是一样的,但是它们协调的方式不同。这是因为它们是根据它们的相似性分组的。
  • 顶部和左侧的类似流程图的结构描述了它们的相似程度。
  • 聚类图使用层次聚类来形成不同的集群。

网格

网格图为我们提供了对可视化的更多控制,并通过一行代码绘制各种各样的图形。

a.面网格

  • 假设我们想要绘制所有三类票中男性和女性的年龄分布,我们总共有6个图。
sns.FacetGrid(train, col='Pclass', row='Sex').map(sns.distplot, 'Age')

640.png

图16:“性别”和“p-class”的“年龄”分布图

  • 面网格可以按要求提供非常清晰的图形。
  • sns.FacetGrid( col = ‘col’, row = ‘row’, data = data) 提供一个包含col和行中所有唯一类别的空网格。之后,我们可以使用不同的图和常见的变量来进行特殊的变化。

回归图

这是一个更高级的统计图,它提供了散点图以及对数据的线性拟合。

sns.lmplot(x='Age', y='PassengerId', data=df, hue='Sex)

640.png

图17:男女乘客年龄与身份证的回归图。

图17为男女乘客身份证与年龄的线性回归拟合。

总结

在本文中,我们看到了14种使用seaborn的可视化技术。

我相信数据可视化增强了我们对数据解释的理解和潜力。它给我们提供了更令人满意的技能来表示数据,输入缺失值,识别异常值,检测异常,以及更多。

数据分析师就像警察一样,需要询问数据并通过它们得到信息。使用合适的工具来完成这项工作是非常必要的。因此,我希望这篇文章能够成为您查询数据的工具。

目录
相关文章
|
5月前
|
数据可视化 关系型数据库 MySQL
基于python大数据的的海洋气象数据可视化平台
针对海洋气象数据量大、维度多的挑战,设计基于ECharts的可视化平台,结合Python、Django与MySQL,实现数据高效展示与交互分析,提升科研与决策效率。
|
6月前
|
机器学习/深度学习 数据可视化 搜索推荐
基于python的汽车数据可视化、推荐及预测系统
本研究围绕汽车数据可视化、推荐及预测系统展开,结合大数据与人工智能技术,旨在提升用户体验与市场竞争力。内容涵盖研究背景、意义、相关技术如 Python、ECharts、协同过滤及随机森林回归等,探讨如何挖掘汽车数据价值,实现个性化推荐与智能预测,为汽车行业智能化发展提供支持。
|
6月前
|
数据采集 Web App开发 自然语言处理
新闻热点一目了然:Python爬虫数据可视化
新闻热点一目了然:Python爬虫数据可视化
|
6月前
|
数据采集 数据可视化 关系型数据库
基于python大数据的电影数据可视化分析系统
电影分析与可视化平台顺应电影产业数字化趋势,整合大数据处理、人工智能与Web技术,实现电影数据的采集、分析与可视化展示。平台支持票房、评分、观众行为等多维度分析,助力行业洞察与决策,同时提供互动界面,增强观众对电影文化的理解。技术上依托Python、MySQL、Flask、HTML等构建,融合数据采集与AI分析,提升电影行业的数据应用能力。
|
6月前
|
数据采集 搜索推荐 数据可视化
基于python大数据的商品数据可视化及推荐系统
本系统基于Python、Django与ECharts,构建大数据商品可视化及推荐平台。通过爬虫获取商品数据,利用可视化技术呈现销售趋势与用户行为,结合机器学习实现个性化推荐,助力电商精准营销与用户体验提升。
|
6月前
|
数据可视化 大数据 数据挖掘
基于python大数据的招聘数据可视化分析系统
本系统基于Python开发,整合多渠道招聘数据,利用数据分析与可视化技术,助力企业高效决策。核心功能包括数据采集、智能分析、可视化展示及权限管理,提升招聘效率与人才管理水平,推动人力资源管理数字化转型。
|
7月前
|
搜索推荐 算法 数据可视化
基于python大数据的招聘数据可视化及推荐系统
本研究聚焦于基于协同过滤的就业推荐系统设计与实现。随着就业压力增大和信息技术发展,传统求职方式面临挑战。通过分析用户行为与职位特征,协同过滤技术可实现个性化职位推荐,提升求职与招聘效率。研究涵盖系统架构、数据采集、算法实现及可视化展示,旨在优化就业匹配,促进人才与岗位精准对接,助力就业市场智能化发展。
|
9月前
|
数据可视化 算法 数据挖掘
Python 3D数据可视化:7个实用案例助你快速上手
本文介绍了基于 Python Matplotlib 库的七种三维数据可视化技术,涵盖线性绘图、散点图、曲面图、线框图、等高线图、三角剖分及莫比乌斯带建模。通过具体代码示例和输出结果,展示了如何配置三维投影环境并实现复杂数据的空间表示。这些方法广泛应用于科学计算、数据分析与工程领域,帮助揭示多维数据中的空间关系与规律,为深入分析提供技术支持。
365 0
Python 3D数据可视化:7个实用案例助你快速上手
|
10月前
|
人工智能 数据可视化 数据挖掘
如何使用Python进行数据可视化
Python是一种强大的编程语言,广泛应用于数据分析与可视化。常见的可视化库有Matplotlib、Seaborn和Plotly等。数据可视化通常包括以下步骤:准备数据(如列表或从文件读取)、选择合适的工具、绘制图表、优化样式(如标题和标签)以及保存或分享结果。例如,使用Matplotlib可通过简单代码绘制线图并添加标题和轴标签。实际应用中,可通过调整颜色、样式等进一步优化图表,甚至使用交互式工具提升效果。总之,Python的丰富工具为数据可视化提供了强大支持。
295 5
|
数据可视化 数据挖掘 DataX
Python 数据可视化的完整指南
Python 数据可视化在数据分析和科学研究中至关重要,它能帮助我们理解数据、发现规律并以直观方式呈现复杂信息。Python 提供了丰富的可视化库,如 Matplotlib、Seaborn、Plotly 和 Pandas 的绘图功能,使得图表生成简单高效。本文通过具体代码示例和案例,介绍了折线图、柱状图、饼图、散点图、箱形图、热力图和小提琴图等常用图表类型,并讲解了自定义样式和高级技巧,帮助读者更好地掌握 Python 数据可视化工具的应用。
850 3

推荐镜像

更多