接上篇,我们继续使用Pandas对电商购物用户行为进行数据分析。
一、统计数据集中哪一天的成交额最大
dfc_max=df.groupby('invoice_date').agg({'price':'sum'})dfc_max.sort_values(by='price',ascending=False)
数据集中,成交额最高的一天为2021年10月28日,额度在13万左右;成交额最低的一天为2022年8月20日,额度在4.8万左右。
二、统计数据集中服装类产品男女的购买情况
df_clothing=df[df['category']=='Clothing']df_clothing
统计一下男女购买者的数量
dfc_count=df_clothing['gender'].value_counts()dfc_count
画个饼图看看:
import matplotlib.pyplot as pltplt.figure()plt.pie(dfc_count, labels=dfc_count.index, autopct='%1.1f%%')plt.show()
从服装购买量上看,男女比例在4:6左右。
三、看看化妆品的购买情况
df_cosmetics=df[df['category']=='Cosmetics']df_cosmeticscount=df_cosmetics['gender'].value_counts()df_cosmeticscount
画个饼图:
呃,男女购买者的比例也基本上是4:6,看来这个数据集是作者精心筛选过的
四、统计服装、鞋子、化妆品三类总数的情况
df_total=df[(df['category']=='Cosmetics')|(df['category']=='Clothing')|(df['category']=='Shoes')]df_total
统计一下男女购买者的数量
df_totalc=df_total['gender'].value_counts()df_totalc
直观的画个饼图看看:
呃,三大类加起来男女购买者的数量比例依然为4:6,数据集作者用心了啊 。OK,好了,关于用Pandas对电商购物用户行为数据分析就结束了,如果感兴趣,后续,可以继续使用这个数据集来对您感兴趣的题目进行分析