跟着Iris案例学Seaborn之Histplot

简介: 跟着Iris案例学Seaborn之Histplot

本期,我们继续学习Seaborn中的第三种图形——Histograms(直方图),对应在Seaborn中的函数为histplot。Histograms直方图是数据集分布的图形表示。它们可以揭示数据的重要特征,例如:数据是否服从正态分布、偏向一侧或具有多个峰值。它们显示数据的不同区间或“区间”内的观测值频率或计数。直方图的 x 轴表示数据集中的值范围,分为等距的间隔或分箱;y轴表示落在每个条形框内的观测值的频率或计数。直方图中每个条形的高度对应于该区间中的观测值数。一、iris数据集简介

Iris数据集是一个非常著名的多变量数据集,由英国统计学家和生物学家罗纳德·费舍尔(Ronald Fisher)在1936年引入。它通常用于展示分类算法和聚类分析。Iris数据集包含了150个样本,每个样本有4个特征:萼片长度、萼片宽度、花瓣长度和花瓣宽度。这些样本分别属于3个不同的鸢尾花种类(Iris setosa、Iris virginica 和 Iris versicolor),每个种类各有50个样本。数据集的特征1.萼片长度 (Sepal Length): 以厘米为单位测量的花萼的长度。2.萼片宽度 (Sepal Width): 以厘米为单位测量的花萼的宽度。3.花瓣长度 (Petal Length): 以厘米为单位测量的花瓣的长度。4.花瓣宽度 (Petal Width): 以厘米为单位测量的花瓣的宽度。5.种类 (Species): 样本所属的鸢尾花种类。
具体数据集的链接如下:

通过百度网盘分享的文件:iris.csv

链接:https://pan.baidu.com/s/1we5Zb80xXecqY5Rhdqs8gA

提取码:6666

二、跟着iris数据集学histplot

2.1 导入数据集

import pandas as pdimport seaborn as snsimport matplotlib.pyplot as plt
# 设置中文字体plt.rcParams['font.family'] = 'SimHei' 
df=pd.read_csv('iris.csv')
df

825f8dca43fc4343cb7d048f786891b8.png

283f69cc8a2f8a7e2b11c148e5e556e3.png

一个150行、5列的数据集,无缺失数据。

2.2 简单的直方图我们用Seaborn中的histplot对sepal_width这一列简单做个直方图,看一下萼片宽度的大致分布。

# Histogram with KDEsns.histplot(data=df, x='sepal_width',              kde=True)plt.title('Histogram with KDE')plt.tight_layout()plt.show()

这里,我们也用kde做了直方图的加窗平滑,运行结果为:

1ed9de4e2e2bd5f382dc68a0860232d2.png

从图中,我们可以看到片宽度从2到4.5的简单分布。KDE曲线也证实它非常接近正态分布。

2.3 多柱直方图

#多柱直方图sns.histplot(data=df)

f176f82c47b991bce4f1dc89c13c8ab4.png

多柱直方图显示了不同颜色的萼片宽度、萼片长度、花瓣宽度和花瓣长度的分布。可以看到,histplot直接过滤掉了最后一列:Species,因为这一列没有数值

2.3 重叠直方图


sns.histplot(data=df, x='petal_length', hue='species')

8d1adf877a4aad702591470334cb70c9.png

从重叠直方图中可以看到,Virginica植物的花瓣长度要比setosa和versicolor植物大得多。

2.4 堆叠直方图

#堆叠直方图sns.histplot(df, x='sepal_length', hue='species',               multiple='stack',linewidth=0.5)

d23c92e0b18a0ed7e61bdbe2642ff5ad.png

堆叠直方图显示了不同花种萼片长度的差异。virginica植物的萼片长度比setosa植物大得多。

三、小结

本期,我们介绍了有关Seaborn中绘制直方图的工具函数histplot,当然,Seaborn的histplot函数也提供了许多定制选项,比如:可以轻松地添加核密度估计(通过设置kde=True,参加2.1),改变直方图的颜色和样式等,你可以根据自己的需求调整这些参数来优化你的图表。

当然,想要了解更多关于histplot的功能,可以参见官方文档:

https://seaborn.pydata.org/generated/seaborn.histplot.html

通过使用Seaborn的histplot函数,我们可以快速而有效地创建出既美观又信息丰富的直方图,这不仅有助于我们更好地理解数据,还能在报告和展示中提供直观的视觉支持。下期见

相关文章
|
6月前
|
数据采集 监控 数据库
Python异步编程实战:爬虫案例
🌟 蒋星熠Jaxonic,代码为舟的星际旅人。从回调地狱到async/await协程天堂,亲历Python异步编程演进。分享高性能爬虫、数据库异步操作、限流监控等实战经验,助你驾驭并发,在二进制星河中谱写极客诗篇。
Python异步编程实战:爬虫案例
|
7月前
|
设计模式 缓存 运维
Python装饰器实战场景解析:从原理到应用的10个经典案例
Python装饰器是函数式编程的精华,通过10个实战场景,从日志记录、权限验证到插件系统,全面解析其应用。掌握装饰器,让代码更优雅、灵活,提升开发效率。
521 0
|
9月前
|
数据采集 存储 NoSQL
Python爬虫案例:Scrapy+XPath解析当当网网页结构
Python爬虫案例:Scrapy+XPath解析当当网网页结构
|
10月前
|
数据可视化 算法 数据挖掘
Python 3D数据可视化:7个实用案例助你快速上手
本文介绍了基于 Python Matplotlib 库的七种三维数据可视化技术,涵盖线性绘图、散点图、曲面图、线框图、等高线图、三角剖分及莫比乌斯带建模。通过具体代码示例和输出结果,展示了如何配置三维投影环境并实现复杂数据的空间表示。这些方法广泛应用于科学计算、数据分析与工程领域,帮助揭示多维数据中的空间关系与规律,为深入分析提供技术支持。
407 0
Python 3D数据可视化:7个实用案例助你快速上手
|
搜索推荐 算法 程序员
6个案例15分钟让你了解Python套路
Python以其简洁易读的语法,成为编程初学者的首选。本文通过7个经典代码案例,带你快速了解Python编程的核心概念和常用技巧: 1. **九九乘法口诀**:使用嵌套循环打印乘法表。 2. **列表求和**:展示两种方法(for循环和内置函数sum())计算列表元素之和。 3. **素数判断**:编写函数判断一个数是否为素数。 4. **斐波那契数列**:生成指定长度的斐波那契数列。 5. **冒泡排序**:实现简单的冒泡排序算法。 6. **汉诺塔问题**:通过递归解决经典的汉诺塔问题。 这些案例不仅展示了Python的基础语法,更体现了编程思维的重要性,帮助初学者逐步掌握编程套路。
388 2
|
数据可视化 DataX Python
Seaborn 教程-绘图函数
Seaborn 教程-绘图函数
500 8
Seaborn 教程-主题(Theme)
Seaborn 教程-主题(Theme)
464 7
|
数据可视化 Python
以下是一些常用的图表类型及其Python代码示例,使用Matplotlib和Seaborn库。
通过这些思维导图和分析说明表,您可以更直观地理解和选择适合的数据可视化图表类型,帮助更有效地展示和分析数据。
675 8
|
Python
Seaborn 教程-模板(Context)
Seaborn 教程-模板(Context)
264 4
|
数据可视化 Python
Seaborn 教程
Seaborn 教程
248 5

推荐镜像

更多