本期,我们来学习Seaborn中的第二个图形——Countplot。Countplot显示类别每个类别的出现次数。x 轴表示变量的类别,而 y 轴表示每个类别的计数或频率。每个类别都由一个条形表示,其中条形的高度对应于该类别在数据集中的出现次数。
下面,我们来看一下在Titanic案例中的Countplot。
在Titanic案例中,我们可以用survived、pclass、who等这几列来学习一下countplot图的用法。
一、Titanic船上存活数量分布图
ax=sns.countplot(data=df, x='alive', palette='Blues')for container in ax.containers: ax.bar_label(container)plt.title('船上乘客存活数量图')plt.xlabel('存活人数')plt.ylabel('数量')
运行结果为:
整条船上,存活下来342人,死亡549人。
二、不同类型的人存活数量分布图
# 分组条形图ax1=sns.countplot(data=df, y="who", hue="alive", palette='Blues')for container in ax1.containers: ax1.bar_label(container)plt.title('不同类型的人存活数量分布图')plt.xlabel('数量')plt.ylabel('人员类型') plt.tight_layout()plt.show()
运行结果为:
可以看到,大多数妇女和儿童都还活着,而男性则生还的比较少。三、Tips:为图形中添加标签在上述代码中,我们可以发现,我使用了两行如下代码:
for container in ax1.containers: ax1.bar_label(container)
这两行代码的用途是为每个条形柱子加上数值标签,Seaborn本身不直接提供添加文本标签的函数,我们可以利用matplotlib的功能来实现上述需求。四、小结Seaborn的countplot是一个非常实用的工具,它可以帮助我们快速地对分类数据进行可视化分析。countplot图形尤其适用于以下两种情况:1. 类别变量的频率分布:每个条形代表一个类别,条形的高度表示该类别中观测值的频率或计数,这有助于识别最常见或最不常见的类别。2. 查看不同分类变量之间的关系。当然,关于更多更详细的countplot的功能请参见官方文档:https://seaborn.pydata.org/generated/seaborn.countplot.html