Polars实践(2):阿里天池——淘宝用户购物行为分析

简介: Polars实践(2):阿里天池——淘宝用户购物行为分析

本期,我们继续使用Polars来对阿里天池数据集——淘宝用户行为进行分析。一、用户行为分析总览本节主要用Polars来看一下,在行为类型这一列中,4种行为的占比分别是多少?(pv 商品详情页pv,等价于点击;buy 商品购买;cart将商品加入购物车;fav 收藏商品)Polars实现代码如下:

df_type=df1.group_by('行为类型').len()df_type

ce181ddd2319ebdfe811ee33090147fd.png

用matplotlib画个饼图直观的看一下

import matplotlib.pyplot as pltplt.figure()plt.pie(df_type['len'], labels=df_type['行为类型'], autopct='%1.1f%%')plt.legend(df_type['行为类型'], loc="best")plt.show()

190957f6145df344cefe7a98c02b8fcb.png

可以看到,在整个数据集中,商品点击PV数量最多,购买行为数量占比最少。二、看看只进行了一次点击操作(PV)的用户

# 筛选出行为类型等于pv的行,即只有点击的用户filtered_df = df1.filter(pl.col("行为类型")=='pv')# 找出这些行中用户ID只进行了一次点击的客户。unique_group_values = filtered_df.group_by('用户ID').len().sort(by="len",descending=False)unique_group_values

c65bbb0e8ca99bf916a0795e28a4aeb3.png

#找出只进行了一次PV点击的用户fiopv=unique_group_values.filter(pl.col('len')==1)fiopv

a379e723e0b74502bcc570187faa0615.png

整个数据集中,共有666个用户只进行了一次点击PV操作。

三、统计哪个用户的用户行为最多

#统计每个用户ID在此期间进行了多少次行为类型操作bemax=df1.group_by('用户ID').agg(pl.col('行为类型').count())bemax

d65fdb5467fa316cb8546355523e2696.png

#排序,找出行为类型最小、最大的用户bemax.sort(by="行为类型",descending=False)

7c4c268471616a9858a9072152d5a7fb.png

用户ID为503757的用户在整个数据集中进行了848次操作,我们来看看他(她)到底都进行了哪些操作?

#筛选出最多行为类型的用户的数据,即用户ID为503757的用户
be5max=df1.filter(pl.col('用户ID')==503757)be5max

34935c582cba6265cc4d233deeecb6a6.png

来看看他(她)买东西(buy)的具体情况:

#看看操作最多的这位买家都买了些什么,都在什么时间买的be5max.filter(pl.col('行为类型')=='buy')

5f242823a1144c4b6e32d9acb5e283b0.png

这位买家集中在一天当中的10点进行操作,其中2017年12月1日同一时间一次购买了5件商品,看来是直接购物车买单结算了 本期就分析到这里,未完待续,敬请期待!

相关文章
|
2月前
|
数据挖掘 大数据 API
Polars实践(1):阿里天池——淘宝用户购物行为分析
Polars实践(1):阿里天池——淘宝用户购物行为分析
79 0
|
2月前
|
存储 数据采集 数据挖掘
Polars实践(4):阿里天池——淘宝用户购物行为分析
Polars实践(4):阿里天池——淘宝用户购物行为分析
70 0
|
2月前
|
Python
Polars实践(3):阿里天池——淘宝用户购物行为分析
Polars实践(3):阿里天池——淘宝用户购物行为分析
46 0
|
3月前
|
数据采集 数据可视化 搜索推荐
Python爬虫技术从去哪儿网获取旅游数据,对攻略进行可视化分析,提供全面的旅游攻略和个性化的出行建议
本文利用Python爬虫技术从去哪儿网获取旅游数据,通过数据处理和可视化分析,提供了全面的旅游攻略和个性化出行建议,同时探讨了热门目的地、出游方式、时间段以及玩法的偏好,为旅游行业和游客提供了有价值的参考信息。
182 8
|
6月前
|
人工智能
阿里上线AI电商工具“绘蛙”,让你的商品第一时间被种草
【2月更文挑战第15天】阿里上线AI电商工具“绘蛙”,让你的商品第一时间被种草
617 2
阿里上线AI电商工具“绘蛙”,让你的商品第一时间被种草
|
搜索推荐
142 推荐系统架构(淘宝和京东)
142 推荐系统架构(淘宝和京东)
189 0
|
监控 算法 搜索推荐
推荐算法在商城系统实践
推荐算法在商城系统实践
228 0
|
数据挖掘 API
淘宝商品数据分析怎么操作?从哪些方面下手?
淘宝商品数据分析怎么操作?从哪些方面下手?
|
搜索推荐 算法 前端开发
每日好店——淘宝店铺推荐系统实践
每日好店——淘宝店铺推荐系统实践
828 0
|
安全 测试技术
赛事直播攻略:最新推出「体育比分网站APP竞猜源码解决方案」
随着体育比赛的普及和人们对于赛事直播的需求不断增加,越来越多企业和机构希望搭建自己的赛事平台。为了帮助用户更加高效、便捷地搭建自己的赛事平台,东莞梦幻网络公司推出了一款名为「体育比分网站APP竞猜源码解决方案」的产品,旨在为用户提供节省费用和开发时间的解决方案。本篇文章将为大家介绍如何使用这款产品进行赛事直播,并给出一些实用的攻略。
下一篇
无影云桌面