Pandas实战(2):电商购物用户行为数据分析

简介: Pandas实战(2):电商购物用户行为数据分析

接上篇,我们继续使用Pandas对电商购物用户行为进行数据分析。

一、增加单价一列,看看价格最高与最低的商品

df['single_price']=df['price']/df['quantity']df

92e69517b0de0bceb63cd9018246d82f.png

1.1  找到单价最贵的20件商品

#找到单价最贵的商品df1=df.sort_values(by='single_price',ascending=False)df1[:10]

单价前20名,清一色的Technology,清一色的电子产品,呵呵呵。1.2 找到单价最便宜的20件商品

df1[-20:]

8fcadc01dcae3d22c0590dae38d58e43.png

单价排名后20名,清一色的Food & Beverage,清一色食品饮料

二、支付方式统计分析

dfp=df.groupby('payment_method').agg({'price':'sum'})dfp


f5fc63d3ca931291b2d431bf9fa67be5.png


画个饼图:

64786aa2ad19864f49f5451cf3aadf8b.png

银行卡支付最高,微信支付最低。三、数据集中顾客购买时间统计将时间列变为datetime格式。

#转换时间为datetime格式from datetime import datetimedf['invoice_date']=df['invoice_date'].apply(lambda x : datetime.strptime(x,"%d/%m/%Y"))

按时间列聚合,并统计购买行为次数,同时做相应的列重命名及index重命名。

#按时间列进行聚合并统计相应购买行为次数。dfd = df.groupby('invoice_date').agg({'invoice_date':'count'})dfd=dfd.rename(columns={'invoice_date': 'count1'})dfd.sort_values(by='count1',ascending=False)dfd=dfd.reset_index()dfd

f4bd928dc50402481c5a5a6225b34003.png

画个折线图看看:


import matplotlib.pyplot as pltfrom matplotlib.pyplot import rcParamsimport numpy as np
rcParams['font.sans-serif'] = ['SimHei']rcParams['axes.unicode_minus'] = False# 绘制折线图plt.figure(figsize=(10, 6))plt.plot(dfd['invoice_date'].to_numpy(), dfd['count1'].to_numpy(), marker='o')  # marker='o' 会在每个数据点上绘制一个圆圈plt.title('数据集每日的购物数量统计')plt.xlabel('日期')plt.ylabel('数量')plt.grid(True)plt.show()

d14aa9afb3de6f1fca1cb8125373a45e.png

这一个数据集中每日的消费者购物数量是均衡的,没有爆量的结果,看来数据集的编写者是用心筛选过的 未完待续!

相关文章
|
7月前
|
自然语言处理 数据挖掘 数据处理
告别低效代码:用对这10个Pandas方法让数据分析效率翻倍
本文将介绍 10 个在数据处理中至关重要的 Pandas 技术模式。这些模式能够显著减少调试时间,提升代码的可维护性,并构建更加清晰的数据处理流水线。
262 3
告别低效代码:用对这10个Pandas方法让数据分析效率翻倍
|
7月前
|
监控 安全 数据挖掘
构建自定义电商数据分析API
在电商业务中,构建自定义数据分析API可实现销售、用户行为等指标的实时分析。本文介绍如何设计并搭建高效、可扩展的API,助力企业快速响应市场变化,提升决策效率。
188 0
|
7月前
|
数据采集 数据可视化 搜索推荐
Python数据分析全流程指南:从数据采集到可视化呈现的实战解析
在数字化转型中,数据分析成为企业决策核心,而Python凭借其强大生态和简洁语法成为首选工具。本文通过实战案例详解数据分析全流程,涵盖数据采集、清洗、探索、建模、可视化及自动化部署,帮助读者掌握从数据到业务价值的完整技能链。
897 0
|
数据采集 数据可视化 数据挖掘
Pandas数据应用:天气数据分析
本文介绍如何使用 Pandas 进行天气数据分析。Pandas 是一个强大的 Python 数据处理库,适合处理表格型数据。文章涵盖加载天气数据、处理缺失值、转换数据类型、时间序列分析(如滚动平均和重采样)等内容,并解决常见报错如 SettingWithCopyWarning、KeyError 和 TypeError。通过这些方法,帮助用户更好地进行气候趋势预测和决策。
406 71
|
8月前
|
数据采集 供应链 搜索推荐
电商数据分析师进阶指南:高效运用API的N种技巧!
电商数据分析师如何合理运用电商API,已成为推动业务增长的重要课题。本文从电商API概述、运用步骤到实际案例,全面解析其在数据分析中的作用。通过明确数据需求、掌握调用技巧、清洗与分析数据,再到可视化呈现,分析师可挖掘用户行为、优化库存及支持精准营销。同时,面对数据安全、质量和技术挑战,需强化安全措施、提升技能并培养专业人才。合理运用电商API,将为企业解锁数据潜能,助力电商行业持续发展。
|
存储 数据采集 数据可视化
Pandas数据应用:电子商务数据分析
本文介绍如何使用 Pandas 进行电子商务数据分析,涵盖数据加载、清洗、预处理、分析与可视化。通过 `read_csv` 等函数加载数据,利用 `info()` 和 `describe()` 探索数据结构和统计信息。针对常见问题如缺失值、重复记录、异常值等,提供解决方案,如 `dropna()`、`drop_duplicates()` 和正则表达式处理。结合 Matplotlib 等库实现数据可视化,探讨内存不足和性能瓶颈的应对方法,并总结常见报错及解决策略,帮助提升电商企业的数据分析能力。
581 73
|
12月前
|
SQL JSON 数据可视化
基于 DIFY 的自动化数据分析实战
本文介绍如何使用DIFY搭建数据分析自动化流程,实现从输入需求到查询数据库、LLM分析再到可视化输出的全流程。基于经典的employees数据集和DIFY云端环境,通过LLM-SQL解析、SQL执行、LLM数据分析及ECharts可视化等模块,高效完成数据分析任务。此方案适用于人力资源分析、薪酬管理等数据密集型业务,显著提升效率并降低成本。
15102 16
|
12月前
|
存储 分布式计算 大数据
基于阿里云大数据平台的实时数据湖构建与数据分析实战
在大数据时代,数据湖作为集中存储和处理海量数据的架构,成为企业数据管理的核心。阿里云提供包括MaxCompute、DataWorks、E-MapReduce等在内的完整大数据平台,支持从数据采集、存储、处理到分析的全流程。本文通过电商平台案例,展示如何基于阿里云构建实时数据湖,实现数据价值挖掘。平台优势包括全托管服务、高扩展性、丰富的生态集成和强大的数据分析工具。
|
12月前
|
数据采集 机器学习/深度学习 数据挖掘
利用Beautiful Soup和Pandas进行网页数据抓取与清洗处理实战
本文通过一个实战案例,介绍如何使用Python中的Beautiful Soup库抓取网页数据,并用Pandas进行清洗和处理。首先,确保安装了requests、beautifulsoup4和pandas库。接着,通过requests获取HTML内容,使用Beautiful Soup解析并提取新闻标题、发布时间和正文。然后,利用Pandas对数据进行清洗,包括去除多余空格、替换特殊字符、删除无效数据等。最后,根据需求进行数据处理(如过滤关键词)并保存为CSV或Excel文件。这个案例适合初学者和有一定经验的用户,帮助快速掌握这两个强大的工具。
434 3
|
12月前
|
搜索推荐 小程序 数据挖掘
互联网运营为何必须做好用户行为数据分析
近年来互联网运营已经成为大多数企业不可或缺的一部分。随着互联网技术的不断发展和数字化转型的推进,越来越多的企业都在加速向互联网运营转型,而在这一过程当中,分析用户行为数据是至关重要的。接下来,我们就来探讨一下其中的原因。

热门文章

最新文章