数据可视化
导入相关库:
import pandas as pd import numpy as np import matplotlib.pyplot as plt
导入数据:
text = pd.read_csv(r'result.csv') text.head() # 可视化展示泰坦尼克号数据集中男女中生存人数分布情况 sex = text.groupby('Sex')['Survived'].sum() sex.plot.bar() plt.title('survived_count') plt.show()
# 可视化展示泰坦尼克号数据集中男女中生存人与死亡人数的比例图 text.groupby(['Sex','Survived'])['Survived'].count().unstack().plot(kind='bar',stacked='True') plt.title('survived_count') plt.ylabel('count')
# 可视化展示泰坦尼克号数据集中不同票价的人生存和死亡人数分布情况 fare_sur = text.groupby(['Fare'])['Survived'].value_counts().sort_values(ascending=False) fare_sur
# 排序后绘折线图 fig = plt.figure(figsize=(20, 18)) fare_sur.plot(grid=True) plt.legend() plt.show()
# 可视化展示泰坦尼克号数据集中不同仓位等级的人生存和死亡人员的分布情况 import seaborn as sns sns.countplot(x="Pclass", hue="Survived", data=text)
# 可视化展示泰坦尼克号数据集中不同年龄的人生存与死亡人数分布情况 facet = sns.FacetGrid(text, hue="Survived",aspect=3) facet.map(sns.kdeplot,'Age',shade= True) facet.set(xlim=(0, text['Age'].max())) facet.add_legend()