网络异常,图片无法展示
|
数据可视化可以让我们很直观的发现数据中隐藏的规律,察觉到变量之间的互动关系,帮助我们更好地解释现象和发现数据价值,做到一图胜千文的说明效果。
python 数据分析的可视化库有:
- matplotlib 是可视化的必备技能库,比较底层,api 很多,学起来不太容易。
- seaborn 是建构于 matplotlib 基础上,能满足绝大多数可视化需求。
- matplotlib 和 seabron 是静态可视化库,pyecharts 有很好的 web 兼容性,可以进行可视化动态效果。
seaborn 是一个面向对象可视化库,本次使用 seaborn 自带的 tips(餐厅小费)数据集进行数据的分布探索,在遇到新的数据集合时候,分析问题不至于无从下手;
Seaborn 通过 sns.set()方法实现主题风格更改,可以设置 5 种风格的图表背景:darkgrid, whitegrid, dark, white, ticks,通过参数 style 设置,默认情况下为 darkgrid 风格:
import seaborn as sns
复制代码
1、分布图(连续性变量):distplot()
# 1、分布图(连续性变量):distplot()
复制代码
网络异常,图片无法展示
|
2、数量统计图(离散变量):countplot()
# 2、数量统计图(离散变量):countplot()
复制代码
网络异常,图片无法展示
|
# countplot() 中x和y只能指定一个,指定x轴则y轴展示数量,指定y轴则x轴展示数量
复制代码
网络异常,图片无法展示
|
3、两个变量的散点图:scatterplot()
# 3、两个变量的散点图:scatterplot()
复制代码
网络异常,图片无法展示
|
4、根据属性值域绘制散点图:relplot()
# 4、根据属性值域绘制散点图:relplot()
复制代码
网络异常,图片无法展示
|
5、两个变量的联合分布图 jointplot()
# 5、两个变量的联合分布图jointplot()
复制代码
网络异常,图片无法展示
|
网络异常,图片无法展示
|
6、箱线图:boxplot()
# 6、箱线图:boxplot()
复制代码
网络异常,图片无法展示
|
7、不重叠散点图:swarmplot()
# 7、不重叠散点图:swarmplot()
复制代码
网络异常,图片无法展示
|
8、有个变量属性的重叠散点图:stripplot()
# 8、有个变量属性的重叠散点图:stripplot()
复制代码
网络异常,图片无法展示
|
# 一般swarmplot(),stripplot() 同boxplot()和violinplot()一同使用,既可以观察总体分布,也能看个体分布情况
复制代码
网络异常,图片无法展示
|
9、小提琴图跟 boxplot()用途一样
# 9、小提琴图跟boxplot()用途一样
复制代码
网络异常,图片无法展示
|
10、绘制条件关系的多图网格:FacetGrid()
# 10、绘制条件关系的多图网格:FacetGrid()
复制代码
网络异常,图片无法展示
|
# 比较随性的绘图方法,很灵活
复制代码
11、barplot()函数
若输出的值域是离散值,我们可以将其转换成 1/0 的连续性,然后看特征属性的贡献度;
# 11、barplot()函数,直观绘制曲线图
复制代码
网络异常,图片无法展示
|
一般掌握以上的绘图方法就能够确保够用,主要是熟能生巧,能够快速找到数据之间的关系,筛选有价值的数据字段,快速完成特征工程。