Pandas实战(2):电商购物用户行为数据分析

简介: Pandas实战(2):电商购物用户行为数据分析

接上篇,我们继续使用Pandas对电商购物用户行为进行数据分析。

一、增加单价一列,看看价格最高与最低的商品

df['single_price']=df['price']/df['quantity']df

92e69517b0de0bceb63cd9018246d82f.png

1.1  找到单价最贵的20件商品

#找到单价最贵的商品df1=df.sort_values(by='single_price',ascending=False)df1[:10]

单价前20名,清一色的Technology,清一色的电子产品,呵呵呵。1.2 找到单价最便宜的20件商品

df1[-20:]

8fcadc01dcae3d22c0590dae38d58e43.png

单价排名后20名,清一色的Food & Beverage,清一色食品饮料

二、支付方式统计分析

dfp=df.groupby('payment_method').agg({'price':'sum'})dfp


f5fc63d3ca931291b2d431bf9fa67be5.png


画个饼图:

64786aa2ad19864f49f5451cf3aadf8b.png

银行卡支付最高,微信支付最低。三、数据集中顾客购买时间统计将时间列变为datetime格式。

#转换时间为datetime格式from datetime import datetimedf['invoice_date']=df['invoice_date'].apply(lambda x : datetime.strptime(x,"%d/%m/%Y"))

按时间列聚合,并统计购买行为次数,同时做相应的列重命名及index重命名。

#按时间列进行聚合并统计相应购买行为次数。dfd = df.groupby('invoice_date').agg({'invoice_date':'count'})dfd=dfd.rename(columns={'invoice_date': 'count1'})dfd.sort_values(by='count1',ascending=False)dfd=dfd.reset_index()dfd

f4bd928dc50402481c5a5a6225b34003.png

画个折线图看看:


import matplotlib.pyplot as pltfrom matplotlib.pyplot import rcParamsimport numpy as np
rcParams['font.sans-serif'] = ['SimHei']rcParams['axes.unicode_minus'] = False# 绘制折线图plt.figure(figsize=(10, 6))plt.plot(dfd['invoice_date'].to_numpy(), dfd['count1'].to_numpy(), marker='o')  # marker='o' 会在每个数据点上绘制一个圆圈plt.title('数据集每日的购物数量统计')plt.xlabel('日期')plt.ylabel('数量')plt.grid(True)plt.show()

d14aa9afb3de6f1fca1cb8125373a45e.png

这一个数据集中每日的消费者购物数量是均衡的,没有爆量的结果,看来数据集的编写者是用心筛选过的 未完待续!

相关文章
|
4天前
|
消息中间件 数据挖掘 Kafka
Apache Kafka流处理实战:构建实时数据分析应用
【10月更文挑战第24天】在当今这个数据爆炸的时代,能够快速准确地处理实时数据变得尤为重要。无论是金融交易监控、网络行为分析还是物联网设备的数据收集,实时数据处理技术都是不可或缺的一部分。Apache Kafka作为一款高性能的消息队列系统,不仅支持传统的消息传递模式,还提供了强大的流处理能力,能够帮助开发者构建高效、可扩展的实时数据分析应用。
27 5
|
27天前
|
数据采集 数据可视化 数据挖掘
基于Python的数据分析与可视化实战
本文将引导读者通过Python进行数据分析和可视化,从基础的数据操作到高级的数据可视化技巧。我们将使用Pandas库处理数据,并利用Matplotlib和Seaborn库创建直观的图表。文章不仅提供代码示例,还将解释每个步骤的重要性和目的,帮助读者理解背后的逻辑。无论你是初学者还是有一定基础的开发者,这篇文章都将为你提供有价值的见解和技能。
58 0
|
1月前
|
SQL 数据采集 数据可视化
深入 Python 数据分析:高级技术与实战应用
本文系统地介绍了Python在高级数据分析中的应用,涵盖数据读取、预处理、探索及可视化等关键环节,并详细展示了聚类分析、PCA、时间序列分析等高级技术。通过实际案例,帮助读者掌握解决复杂问题的方法,提升数据分析技能。使用pandas、matplotlib、seaborn及sklearn等库,提供了丰富的代码示例,便于实践操作。
152 64
|
23天前
|
机器学习/深度学习 数据采集 算法
探索Python科学计算的边界:NumPy、Pandas与SciPy在大规模数据分析中的高级应用
【10月更文挑战第5天】随着数据科学和机器学习领域的快速发展,处理大规模数据集的能力变得至关重要。Python凭借其强大的生态系统,尤其是NumPy、Pandas和SciPy等库的支持,在这个领域占据了重要地位。本文将深入探讨这些库如何帮助科学家和工程师高效地进行数据分析,并通过实际案例来展示它们的一些高级应用。
41 0
探索Python科学计算的边界:NumPy、Pandas与SciPy在大规模数据分析中的高级应用
|
30天前
|
数据采集 数据挖掘 API
Python数据分析加速器:深度挖掘Pandas与NumPy的高级功能
在Python数据分析的世界里,Pandas和NumPy无疑是两颗璀璨的明星,它们为数据科学家和工程师提供了强大而灵活的工具集,用于处理、分析和探索数据。今天,我们将一起深入探索这两个库的高级功能,看看它们如何成为数据分析的加速器。
34 1
|
21天前
|
供应链 监控 数据挖掘
淘宝商品详情数据接口:解锁电商数据分析新密码
在数字化时代,电商竞争激烈,精准的数据分析成为制胜关键。淘宝商品详情数据接口如同一把神奇的钥匙,为商家提供商品名称、价格、销量、评价等详细信息,助力洞察市场趋势、优化商品策略、提升运营效率。通过实时更新的数据,商家可以及时调整定价、促销和库存管理,增强竞争力。未来,该接口将带来更多智能化的数据分析工具和精准的市场预测模型,助力电商从业者在竞争中脱颖而出。
|
25天前
|
数据采集 数据可视化 数据挖掘
Python 数据分析实战:使用 Pandas 进行数据清洗与可视化
【10月更文挑战第3天】Python 数据分析实战:使用 Pandas 进行数据清洗与可视化
69 0
|
2月前
|
数据挖掘 Python
Pandas数据分析实战(2):2023美国财富1000强公司情况
Pandas数据分析实战(2):2023美国财富1000强公司情况
38 0
|
2月前
|
数据采集 数据挖掘 Python
Pandas数据分析实战(1):2023美国财富1000强公司情况
Pandas数据分析实战(1):2023美国财富1000强公司情况
41 0
|
3月前
|
数据采集 数据可视化 数据挖掘
数据分析大神养成记:Python+Pandas+Matplotlib助你飞跃!
在数字化时代,数据分析至关重要,而Python凭借其强大的数据处理能力和丰富的库支持,已成为该领域的首选工具。Python作为基石,提供简洁语法和全面功能,适用于从数据预处理到高级分析的各种任务。Pandas库则像是神兵利器,其DataFrame结构让表格型数据的处理变得简单高效,支持数据的增删改查及复杂变换。配合Matplotlib这一数据可视化的魔法棒,能以直观图表展现数据分析结果。掌握这三大神器,你也能成为数据分析领域的高手!
63 2