跟着mpg案例学Seaborn之KDE

简介: 跟着mpg案例学Seaborn之KDE

本期,我们继续跟着案例学Seaborn之KDE在Seaborn中,KDE代表核密度估计(Kernel Density Estimation),这是一种用于估计概率密度函数的非参数方法。KDE(核密度估计)图是直方图(Histgram)的平滑版本,表示连续随机变量的概率密度函数。y轴表示观察到变量的特定值的密度或可能性,x轴表示变量本身的值。一、案例学习

我们继续使用mpg案例来看一下horsepower(马力)的KDE图。

#mpg数据集中horsepower的KDE Plots图sns.kdeplot(data=df, x='horsepower',            hue='cylinders', fill=True,           palette='viridis',            alpha=.5, linewidth=0.5)plt.title('mpg数据集中horsepower的KDE Plots图')

746104c3703cfa9ed0907554519fa488.png

从图中,我们可以看出在mpg数据集中,horsepower(马力)随着cylinders(气缸数量)的增加而增加,而大多数汽车有4、6或8个气缸。再来看一下weight汽车重量的KDE图。

#汽车重量的KDE Plotssns.kdeplot(data=df, x="weight",             hue="origin",multiple="stack")plt.title('汽车重量的KDE Plot')

a5ee6b4917a3744bfadd24f5fd76390d.png

从图中,我们可以看出多重量级的汽车原产地都是美国。

二、一些参数

kdeplot的核密度估计功能提供了许多自定义选项,例如:

  • bw_adjust 参数可以调整带宽(bandwidth),影响曲线的平滑程度。
  • 可以通过color和label参数来设置曲线的颜色和图例标签。
  • 通过multiple参数来改变曲线在图形上显示的方式,主要有三种:layer(图层式)、stack(堆叠式)、fill(填充式)。


比如,对于上面两幅图,我们调整一下bw_adjust,看一下对曲线平滑度的影响,设置bw_adjust=0.2.

79d2a8cae23390f3a0364e986eb500da.png

可以看到,bw_adjust调整为0.2以后,曲线变的很不平滑了。我们再来调整一下multiple的方式,multiple="layer"与multiple="fill"。

c63bb7dc7d661c90903ff2f460038d25.png


f63cdbc35ba485ce4914af6db68b17b6.png

三、总结KDE核密度估计图是探索和展示数据分布的强大工具,在数据可视化中,KDE图表常用于展示单变量或双变量数据的分布情况,它比直方图更平滑,可以更好地展示数据的分布形态。当然,想学习更多关于Seaborn中KDE的知识,请参考官方文档:https://seaborn.pydata.org/generated/seaborn.kdeplot.html

自己动手试试吧?

相关文章
|
20天前
|
数据可视化 DataX Python
Seaborn 教程-绘图函数
Seaborn 教程-绘图函数
46 8
|
20天前
Seaborn 教程-主题(Theme)
Seaborn 教程-主题(Theme)
60 7
|
20天前
|
Python
Seaborn 教程-模板(Context)
Seaborn 教程-模板(Context)
47 4
|
20天前
|
数据可视化 Python
Seaborn 教程
Seaborn 教程
42 5
|
23天前
|
数据可视化 Python
以下是一些常用的图表类型及其Python代码示例,使用Matplotlib和Seaborn库。
通过这些思维导图和分析说明表,您可以更直观地理解和选择适合的数据可视化图表类型,帮助更有效地展示和分析数据。
64 8
|
2月前
|
移动开发 数据可视化 数据挖掘
利用Python实现数据可视化:以Matplotlib和Seaborn为例
【10月更文挑战第37天】本文旨在引导读者理解并掌握使用Python进行数据可视化的基本方法。通过深入浅出的介绍,我们将探索如何使用两个流行的库——Matplotlib和Seaborn,来创建引人入胜的图表。文章将通过具体示例展示如何从简单的图表开始,逐步过渡到更复杂的可视化技术,帮助初学者构建起强大的数据呈现能力。
|
3月前
|
数据可视化 数据挖掘 Python
Seaborn 库创建吸引人的统计图表
【10月更文挑战第11天】本文介绍了如何使用 Seaborn 库创建多种统计图表,包括散点图、箱线图、直方图、线性回归图、热力图等。通过具体示例和代码,展示了 Seaborn 在数据可视化中的强大功能和灵活性,帮助读者更好地理解和应用这一工具。
|
3月前
|
数据采集 前端开发 NoSQL
Python编程异步爬虫实战案例
Python编程异步爬虫实战案例
84 2
|
3月前
|
数据采集 自然语言处理 API
Python反爬案例——验证码的识别
Python反爬案例——验证码的识别
52 2
|
3月前
|
iOS开发 MacOS Python
Python编程小案例—利用flask查询本机IP归属并输出网页图片
Python编程小案例—利用flask查询本机IP归属并输出网页图片
31 1