Py之seaborn:数据可视化seaborn库(二)的组合图可视化之密度图/核密度图分布可视化、箱型图/散点图、小提琴图/散点图组合可视化的简介、使用方法之最强攻略(建议收藏)

简介: Py之seaborn:数据可视化seaborn库(二)的组合图可视化之密度图/核密度图分布可视化、箱型图/散点图、小提琴图/散点图组合可视化的简介、使用方法之最强攻略(建议收藏)

1、密度图、核密度图分布可视化:distplot函数+kdeplot函数


distplot()函数:集合了matplotlib的hist()与核函数估计kdeplot的功能,增加了rugplot分布观测条显示与利用scipy库fit拟合参数分布的新颖用途。其中,直方图表示通过沿数据范围形成分箱,然后绘制条以显示落入每个分箱的观测次数的数据分布图。


   fig, axes = plt.subplots(1,2,figsize=(10,6))

   sns.distplot(data_frame[cols[0]],             # 不写为x=data_frame[cols[0]],是因为这样可自动添加横坐标标签

#                  bins=10,                         # 自定义柱状宽度,不设置更好,会自动计算

#                  hist=True,

                kde = True, norm_hist = False,   # 柱状图是否按照密度来显示,如果为 False,显示计数,尝试测试-----------------

                rug = True,                      # 单变量的柱状图,hist、ked、rug:bool,是否显示箱柱状图/密度曲线/边际毛毯数据分布/阴影,尝试测试-----------------

#                 fit=norm,                       # fit 可结合scipy库在图像上做拟合,拟合标准正态分布

               vertical = False,                 # 是否水平显示,True  

               label='dis',                      # label 图例,

#                 axlabel=cols[0],                # axlabel x轴标注

               ax = axes[0],

                )

       sns.kdeplot(data_frame[cols[0]],

                   shade=True,                       # shade(颜色填充KDE曲线下方的区域)

                   bw=bw01,

                   label='kde_bw%.2f'%bw01,

   #                 axlabel=cols[0],                # label 图例,axlabel x轴标注

                   ax = axes[1],

                   )


image.png


2、箱型图、散点图组合可视化(仅第2变量必须为数值型)


   sns.boxplot(x=cols[0],y=cols[1],data=data_frame,

               hue=cols[2],                             # 该特征必须为类别型特征

               linewidth=2, width=0.8, fliersize=3,     # 线宽、箱之间的间隔比例,异常点大小

               whis = 1.5,                              # 设置IQR

               notch = True,                            # 设置是否以中值做凹槽,尝试测试-----------------

   #             order = ['Thur','Fri','Sat','Sun'],  

              )

   sns.swarmplot(x=cols[0],y=cols[1],data=data_frame,

#                   color ='k',size = 3,alpha = 0.8,

                 )


image.png


3、小提琴图、散点图组合可视化(仅第2变量必须为数值型)


   sns.violinplot(x=cols[0],y=cols[1],data=data_frame,

                  hue=cols[2],                       # 该特征必须为类别型特征

                  scale = 'area',  # 测度小提琴图的宽度:area-面积相同,count-按照样本数量决定宽度,width-宽度一样

                  gridsize = 50,   # 设置小提琴图边线的平滑度,越高越平滑

                  inner = 'box',   # 设置内部显示类型 → box、quartile、point、stick、None,尝试测试-----------------

#                     split=True,      # 设置是否拆分小提琴图,前提条件是第三特征为二类别属性,尝试测试-----------------

                  #bw = 0.8        # 控制拟合程度,一般可以不设置

              )

   sns.swarmplot(x=cols[0],y=cols[1],data=data_frame,

                  hue=cols[2],                       # 该特征必须为类别型特征

#                   color="w", alpha=.5,

                 )


image.png


















 


相关文章
|
5月前
|
数据可视化 关系型数据库 MySQL
基于python大数据的的海洋气象数据可视化平台
针对海洋气象数据量大、维度多的挑战,设计基于ECharts的可视化平台,结合Python、Django与MySQL,实现数据高效展示与交互分析,提升科研与决策效率。
|
6月前
|
机器学习/深度学习 数据可视化 搜索推荐
基于python的汽车数据可视化、推荐及预测系统
本研究围绕汽车数据可视化、推荐及预测系统展开,结合大数据与人工智能技术,旨在提升用户体验与市场竞争力。内容涵盖研究背景、意义、相关技术如 Python、ECharts、协同过滤及随机森林回归等,探讨如何挖掘汽车数据价值,实现个性化推荐与智能预测,为汽车行业智能化发展提供支持。
|
6月前
|
数据采集 Web App开发 自然语言处理
新闻热点一目了然:Python爬虫数据可视化
新闻热点一目了然:Python爬虫数据可视化
|
6月前
|
数据采集 数据可视化 关系型数据库
基于python大数据的电影数据可视化分析系统
电影分析与可视化平台顺应电影产业数字化趋势,整合大数据处理、人工智能与Web技术,实现电影数据的采集、分析与可视化展示。平台支持票房、评分、观众行为等多维度分析,助力行业洞察与决策,同时提供互动界面,增强观众对电影文化的理解。技术上依托Python、MySQL、Flask、HTML等构建,融合数据采集与AI分析,提升电影行业的数据应用能力。
|
6月前
|
数据采集 搜索推荐 数据可视化
基于python大数据的商品数据可视化及推荐系统
本系统基于Python、Django与ECharts,构建大数据商品可视化及推荐平台。通过爬虫获取商品数据,利用可视化技术呈现销售趋势与用户行为,结合机器学习实现个性化推荐,助力电商精准营销与用户体验提升。
|
6月前
|
数据可视化 大数据 数据挖掘
基于python大数据的招聘数据可视化分析系统
本系统基于Python开发,整合多渠道招聘数据,利用数据分析与可视化技术,助力企业高效决策。核心功能包括数据采集、智能分析、可视化展示及权限管理,提升招聘效率与人才管理水平,推动人力资源管理数字化转型。
|
7月前
|
搜索推荐 算法 数据可视化
基于python大数据的招聘数据可视化及推荐系统
本研究聚焦于基于协同过滤的就业推荐系统设计与实现。随着就业压力增大和信息技术发展,传统求职方式面临挑战。通过分析用户行为与职位特征,协同过滤技术可实现个性化职位推荐,提升求职与招聘效率。研究涵盖系统架构、数据采集、算法实现及可视化展示,旨在优化就业匹配,促进人才与岗位精准对接,助力就业市场智能化发展。
|
8月前
|
人工智能 Python
python基本数据类型简介
本文简要介绍了Python的基本数据类型,包括整型、浮点型、字符串、列表、字典和布尔类型,帮助读者对Python数据类型有初步了解。
233 0
|
9月前
|
数据可视化 算法 数据挖掘
Python 3D数据可视化:7个实用案例助你快速上手
本文介绍了基于 Python Matplotlib 库的七种三维数据可视化技术,涵盖线性绘图、散点图、曲面图、线框图、等高线图、三角剖分及莫比乌斯带建模。通过具体代码示例和输出结果,展示了如何配置三维投影环境并实现复杂数据的空间表示。这些方法广泛应用于科学计算、数据分析与工程领域,帮助揭示多维数据中的空间关系与规律,为深入分析提供技术支持。
363 0
Python 3D数据可视化:7个实用案例助你快速上手
|
10月前
|
人工智能 数据可视化 数据挖掘
如何使用Python进行数据可视化
Python是一种强大的编程语言,广泛应用于数据分析与可视化。常见的可视化库有Matplotlib、Seaborn和Plotly等。数据可视化通常包括以下步骤:准备数据(如列表或从文件读取)、选择合适的工具、绘制图表、优化样式(如标题和标签)以及保存或分享结果。例如,使用Matplotlib可通过简单代码绘制线图并添加标题和轴标签。实际应用中,可通过调整颜色、样式等进一步优化图表,甚至使用交互式工具提升效果。总之,Python的丰富工具为数据可视化提供了强大支持。
295 5

推荐镜像

更多