数据挖掘从入门到放弃(五)seaborn 的数据可视化

简介: 数据挖掘从入门到放弃(五)seaborn 的数据可视化

网络异常,图片无法展示
|

数据可视化可以让我们很直观的发现数据中隐藏的规律,察觉到变量之间的互动关系,帮助我们更好地解释现象和发现数据价值,做到一图胜千文的说明效果。

官网

python 数据分析的可视化库有:


  • matplotlib 是可视化的必备技能库,比较底层,api 很多,学起来不太容易。
  • seaborn 是建构于 matplotlib 基础上,能满足绝大多数可视化需求。
  • matplotlib 和 seabron 是静态可视化库,pyecharts 有很好的 web 兼容性,可以进行可视化动态效果。


seaborn 是一个面向对象可视化库,本次使用 seaborn 自带的 tips(餐厅小费)数据集进行数据的分布探索,在遇到新的数据集合时候,分析问题不至于无从下手;


Seaborn 通过 sns.set()方法实现主题风格更改,可以设置 5 种风格的图表背景:darkgrid, whitegrid, dark, white, ticks,通过参数 style 设置,默认情况下为 darkgrid 风格:


import seaborn as sns

复制代码


1、分布图(连续性变量):distplot()


# 1、分布图(连续性变量):distplot()

复制代码


网络异常,图片无法展示
|


2、数量统计图(离散变量):countplot()


# 2、数量统计图(离散变量):countplot()

复制代码


网络异常,图片无法展示
|


# countplot() 中x和y只能指定一个,指定x轴则y轴展示数量,指定y轴则x轴展示数量

复制代码


网络异常,图片无法展示
|


3、两个变量的散点图:scatterplot()


# 3、两个变量的散点图:scatterplot()

复制代码


网络异常,图片无法展示
|


4、根据属性值域绘制散点图:relplot()


# 4、根据属性值域绘制散点图:relplot()

复制代码


网络异常,图片无法展示
|


5、两个变量的联合分布图 jointplot()


# 5、两个变量的联合分布图jointplot()

复制代码


网络异常,图片无法展示
|


网络异常,图片无法展示
|


6、箱线图:boxplot()


# 6、箱线图:boxplot()

复制代码


网络异常,图片无法展示
|


7、不重叠散点图:swarmplot()


# 7、不重叠散点图:swarmplot()

复制代码


网络异常,图片无法展示
|


8、有个变量属性的重叠散点图:stripplot()


# 8、有个变量属性的重叠散点图:stripplot()

复制代码


网络异常,图片无法展示
|


# 一般swarmplot(),stripplot() 同boxplot()和violinplot()一同使用,既可以观察总体分布,也能看个体分布情况

复制代码


网络异常,图片无法展示
|


9、小提琴图跟 boxplot()用途一样


# 9、小提琴图跟boxplot()用途一样

复制代码


网络异常,图片无法展示
|


10、绘制条件关系的多图网格:FacetGrid()


# 10、绘制条件关系的多图网格:FacetGrid()

复制代码


网络异常,图片无法展示
|


# 比较随性的绘图方法,很灵活

复制代码


11、barplot()函数


若输出的值域是离散值,我们可以将其转换成 1/0 的连续性,然后看特征属性的贡献度;


# 11、barplot()函数,直观绘制曲线图

复制代码


网络异常,图片无法展示
|


一般掌握以上的绘图方法就能够确保够用,主要是熟能生巧,能够快速找到数据之间的关系,筛选有价值的数据字段,快速完成特征工程。

目录
相关文章
|
机器学习/深度学习 存储 传感器
【机器学习入门与实践】合集入门必看系列,含数据挖掘项目实战
【机器学习入门与实践】合集入门必看系列,含数据挖掘项目实战
|
机器学习/深度学习 数据可视化 算法
【机器学习入门与实践】数据挖掘-二手车价格交易预测(含EDA探索、特征工程、特征优化、模型融合等)
【机器学习入门与实践】数据挖掘-二手车价格交易预测(含EDA探索、特征工程、特征优化、模型融合等)
|
机器学习/深度学习 数据挖掘 TensorFlow
数据挖掘从入门到放弃(七):TensorFlow 和 keras 实现线性回归 LinearRegression
数据挖掘从入门到放弃(七):TensorFlow 和 keras 实现线性回归 LinearRegression
199 0
|
机器学习/深度学习 算法 数据挖掘
数据挖掘从入门到放弃(六):K-means 聚类
数据挖掘从入门到放弃(六):K-means 聚类
127 0
|
存储 算法 数据挖掘
数据挖掘从入门到放弃(四):手撕(绘)关联规则挖掘算法
数据挖掘从入门到放弃(四):手撕(绘)关联规则挖掘算法
172 0
|
机器学习/深度学习 算法 数据挖掘
数据挖掘从入门到放弃(三):朴素贝叶斯
数据挖掘从入门到放弃(三):朴素贝叶斯
193 0
|
机器学习/深度学习 算法 数据挖掘
数据挖掘从入门到放弃(二):决策树
数据挖掘从入门到放弃(二):决策树
153 0
|
机器学习/深度学习 自然语言处理 算法
数据挖掘从入门到放弃(一):线性回归和逻辑回归
数据挖掘从入门到放弃(一):线性回归和逻辑回归
186 0
|
大数据 数据挖掘 前端开发
【经验】零基础该如何入门数据挖掘?
在天池创立之初,我们的使命就是:让无法触及大数据的人能够触及到真正企业级的大数据。秉承着这样的理念,我们在天池平台上培养和锻炼了一批又一批的大数据人才。
1819 0

热门文章

最新文章

下一篇
无影云桌面