Py之seaborn:数据可视化seaborn库(二)的组合图可视化之密度图/核密度图分布可视化、箱型图/散点图、小提琴图/散点图组合可视化的简介、使用方法之最强攻略(建议收藏)

简介: Py之seaborn:数据可视化seaborn库(二)的组合图可视化之密度图/核密度图分布可视化、箱型图/散点图、小提琴图/散点图组合可视化的简介、使用方法之最强攻略(建议收藏)


目录

二、组合图可视化

1、密度图、核密度图分布可视化:distplot函数+kdeplot函数

2、箱型图、散点图组合可视化(仅第2变量必须为数值型)

3、小提琴图、散点图组合可视化(仅第2变量必须为数值型)


 

 

相关文章

Py之seaborn:seaborn库的简介、安装、使用方法之详细攻略

Py之seaborn:数据可视化seaborn库(一)的柱状图、箱线图(置信区间图)、散点图/折线图、核密度图/等高线图、盒形图/小提琴图/LV多框图的简介、使用方法之最强攻略(建议收藏)

Py之seaborn:数据可视化seaborn库(二)的组合图可视化之密度图/核密度图分布可视化、箱型图/散点图、小提琴图/散点图组合可视化的简介、使用方法之最强攻略(建议收藏)

Py之seaborn:数据可视化seaborn库(三)的矩阵图可视化之jointplot函数、JointGrid函数、pairplot函数、PairGrid函数、FacetGrid函数的简介、使用方法之最强攻略(建议收藏)

二、组合图可视化

1、密度图、核密度图分布可视化:distplot函数+kdeplot函数

distplot()函数:集合了matplotlib的hist()与核函数估计kdeplot的功能,增加了rugplot分布观测条显示与利用scipy库fit拟合参数分布的新颖用途。其中,直方图表示通过沿数据范围形成分箱,然后绘制条以显示落入每个分箱的观测次数的数据分布图

1.     fig, axes = plt.subplots(1,2,figsize=(10,6))
2.     sns.distplot(data_frame[cols[0]],             # 不写为x=data_frame[cols[0]],是因为这样可自动添加横坐标标签
3. #                  bins=10,                         # 自定义柱状宽度,不设置更好,会自动计算
4. #                  hist=True,
5.                  kde = True, norm_hist = False,   # 柱状图是否按照密度来显示,如果为 False,显示计数,尝试测试-----------------
6.                  rug = True,                      # 单变量的柱状图,hist、ked、rug:bool,是否显示箱柱状图/密度曲线/边际毛毯数据分布/阴影,尝试测试-----------------
7. #                 fit=norm,                       # fit 可结合scipy库在图像上做拟合,拟合标准正态分布
8.                 vertical = False,                 # 是否水平显示,True   
9.                 label='dis',                      # label 图例,
10. #                 axlabel=cols[0],                # axlabel x轴标注
11.                 ax = axes[0], 
12.                  )
13. 
14.         sns.kdeplot(data_frame[cols[0]],
15.                     shade=True,                       # shade(颜色填充KDE曲线下方的区域)
16.                     bw=bw01,
17.                     label='kde_bw%.2f'%bw01,
18. #                 axlabel=cols[0],                # label 图例,axlabel x轴标注
19.                     ax = axes[1], 
20.                     )

 

2、箱型图、散点图组合可视化(仅第2变量必须为数值型)

1.     sns.boxplot(x=cols[0],y=cols[1],data=data_frame,
2.                 hue=cols[2],                             # 该特征必须为类别型特征
3.                 linewidth=2, width=0.8, fliersize=3,     # 线宽、箱之间的间隔比例,异常点大小
4.                 whis = 1.5,                              # 设置IQR 
5.                 notch = True,                            # 设置是否以中值做凹槽,尝试测试-----------------
6. #             order = ['Thur','Fri','Sat','Sun'],  
7.                )
8.     sns.swarmplot(x=cols[0],y=cols[1],data=data_frame,
9. #                   color ='k',size = 3,alpha = 0.8,
10.                   )

 

3、小提琴图、散点图组合可视化(仅第2变量必须为数值型)

1.     sns.violinplot(x=cols[0],y=cols[1],data=data_frame,
2.                    hue=cols[2],                       # 该特征必须为类别型特征
3.                    scale = 'area',  # 测度小提琴图的宽度:area-面积相同,count-按照样本数量决定宽度,width-宽度一样
4.                    gridsize = 50,   # 设置小提琴图边线的平滑度,越高越平滑
5.                    inner = 'box',   # 设置内部显示类型 → box、quartile、point、stick、None,尝试测试-----------------
6. #                     split=True,      # 设置是否拆分小提琴图,前提条件是第三特征为二类别属性,尝试测试-----------------
7. #bw = 0.8        # 控制拟合程度,一般可以不设置
8.                )
9.     sns.swarmplot(x=cols[0],y=cols[1],data=data_frame,
10.                    hue=cols[2],                       # 该特征必须为类别型特征
11. #                   color="w", alpha=.5,
12.                   )


相关文章
|
1天前
|
数据可视化 数据挖掘 定位技术
Python 基于 Matplotlib 实现数据可视化(二)
Python 基于 Matplotlib 实现数据可视化(二)
13 0
|
2天前
|
数据可视化 算法 数据挖掘
PYTHON实现谱聚类算法和改变聚类簇数结果可视化比较
PYTHON实现谱聚类算法和改变聚类簇数结果可视化比较
|
2天前
|
Python 数据可视化 索引
PYTHON用GARCH、离散随机波动率模型DSV模拟估计股票收益时间序列与蒙特卡洛可视化
PYTHON用GARCH、离散随机波动率模型DSV模拟估计股票收益时间序列与蒙特卡洛可视化
14 0
PYTHON用GARCH、离散随机波动率模型DSV模拟估计股票收益时间序列与蒙特卡洛可视化
|
2天前
|
存储 机器学习/深度学习 数据可视化
Python面板时间序列数据预测:格兰杰因果关系检验Granger causality test药品销售实例与可视化
Python面板时间序列数据预测:格兰杰因果关系检验Granger causality test药品销售实例与可视化
41 6
|
2天前
|
机器学习/深度学习 数据可视化 算法
PYTHON用决策树分类预测糖尿病和可视化实例
PYTHON用决策树分类预测糖尿病和可视化实例
11 0
|
2天前
|
数据可视化 算法 Python
python中的copula:Frank、Clayton和Gumbel copula模型估计与可视化
python中的copula:Frank、Clayton和Gumbel copula模型估计与可视化
13 0
|
2天前
|
机器学习/深度学习 算法 搜索推荐
SciPy线性代数库详解:矩阵运算与方程求解
【4月更文挑战第17天】SciPy的`scipy.linalg`模块提供丰富的线性代数功能,包括矩阵运算、线性方程组求解、特征值问题和奇异值分解等,基于BLAS和LAPACK库确保效率与稳定性。关键操作如矩阵乘法使用`dot`函数,转置和共轭转置用`transpose`和`conj`,求解线性方程组有`solve`和迭代方法,计算特征值和向量用`eig`,奇异值分解则依赖`svd`。这个库对科学计算、数据分析和机器学习等领域至关重要。
|
2天前
|
算法 Serverless 计算机视觉
SciPy的科学计算库的基础知识与应用
【4月更文挑战第17天】**SciPy**是Python的开源科学计算库,基于NumPy,包含优化、积分、线性代数、信号处理等模块。本文介绍了SciPy的基本使用,如线性代数(矩阵运算、特征值)、优化(最小化问题)、积分以及信号处理(滤波)。安装SciPy可使用`pip install scipy`。此外,还展示了图像处理和常微分方程求解的例子。SciPy是科学计算的重要工具,适用于各种数值问题。参考文献包括SciPy和NumPy官方文档。
|
3天前
|
JSON API 数据格式
python的request库如何拿到json的返回值
python的request库如何拿到json的返回值
7 0
|
3天前
|
数据可视化 算法 API
Python数据可视化-seaborn Iris鸢尾花数据
Python数据可视化-seaborn Iris鸢尾花数据
11 0