Pandas透视表及应用(二)

简介: 这个文本是关于使用Pandas进行数据分析的教程,主要关注会员数据的处理和业务指标的计算。

Pandas透视表及应用(一)+https://developer.aliyun.com/article/1543896?spm=a2c6h.13148508.setting.33.1fa24f0eyCLrzp




整体等级分布




报表可视化






从业务角度,将会员数据拆分成线上和线下,比较每月线上线下会员的运营情况


将“会员来源”字段进行拆解,统计线上线下会员增量





各地区会销比


会销比的计算和分析会销比的作用


会销比 = 会员消费的金额 / 全部客户消费的金额


由于数据脱敏的原因,没有全部客户消费金额的数据,所以用如下方式替换


会销比 = 会员消费的订单数 / 全部销售订单数


会销比统计的是会员消费占所有销售金额的比例


通过会销比可以衡量会员的整体质量  


加载数据
custom_consume=pd.read_excel('data/会员消费报表.xlsx')
all_orders=pd.read_excel('data/全国销售订单数量表.xlsx')
custom_consume.head()
all_orders.head()


为会员消费报表添加年月列




merge连接相当于SQL的join


剔除电商数据,统计会员购买订单数量:



全部订单数




计算各地区会销比



会员连带率分析


统计订单的数量:需要对"订单号"去重,并且只要"下单"的数据,"退单"的不要



统计消费商品数量



计算连带率



会员复购率分析



上面计算的数据为所有数据的复购率,我们要统计每年的复购率,所以要先对数据进行订单日期筛选,这里我们定义一个函数




统计2018年01月~2018年12月复购率和2018年02月~2019年01月复购率


计算2018年的复购率




计算2018年02月~2019年01月的复购率



计算复购率环比


相关文章
|
6天前
|
数据采集 数据可视化 数据挖掘
Pandas数据应用:天气数据分析
本文介绍如何使用 Pandas 进行天气数据分析。Pandas 是一个强大的 Python 数据处理库,适合处理表格型数据。文章涵盖加载天气数据、处理缺失值、转换数据类型、时间序列分析(如滚动平均和重采样)等内容,并解决常见报错如 SettingWithCopyWarning、KeyError 和 TypeError。通过这些方法,帮助用户更好地进行气候趋势预测和决策。
98 71
|
3天前
|
分布式计算 数据可视化 数据挖掘
Pandas数据应用:社交媒体分析
本文介绍如何使用Pandas进行社交媒体数据分析,涵盖数据获取、预处理、探索性分析和建模的完整流程。通过API获取数据并转换为DataFrame格式,处理缺失值和数据类型转换问题。利用Matplotlib等库进行可视化,展示不同类型帖子的数量分布。针对大规模数据集提供内存优化方案,并结合TextBlob进行情感分析。最后总结常见问题及解决方案,帮助读者掌握Pandas在社交媒体数据分析中的应用。
124 96
|
5天前
|
存储 数据采集 数据可视化
Pandas数据应用:电子商务数据分析
本文介绍如何使用 Pandas 进行电子商务数据分析,涵盖数据加载、清洗、预处理、分析与可视化。通过 `read_csv` 等函数加载数据,利用 `info()` 和 `describe()` 探索数据结构和统计信息。针对常见问题如缺失值、重复记录、异常值等,提供解决方案,如 `dropna()`、`drop_duplicates()` 和正则表达式处理。结合 Matplotlib 等库实现数据可视化,探讨内存不足和性能瓶颈的应对方法,并总结常见报错及解决策略,帮助提升电商企业的数据分析能力。
101 73
|
2天前
|
存储 数据采集 数据可视化
Pandas数据应用:医疗数据分析
Pandas是Python中强大的数据操作和分析库,广泛应用于医疗数据分析。本文介绍了使用Pandas进行医疗数据分析的常见问题及解决方案,涵盖数据导入、预处理、清洗、转换、可视化等方面。通过解决文件路径错误、编码不匹配、缺失值处理、异常值识别、分类变量编码等问题,结合Matplotlib等工具实现数据可视化,并提供了解决常见报错的方法。掌握这些技巧可以提高医疗数据分析的效率和准确性。
39 22
|
1天前
|
数据采集 数据挖掘 数据处理
Pandas数据应用:金融数据分析
本文介绍如何使用Pandas进行金融数据分析,涵盖数据导入、清洗、转换等基础操作。通过处理缺失值、重复值及数据类型不匹配等问题,结合时间序列分析和大规模数据处理技巧,帮助读者掌握常见问题的解决方案。案例分析展示了计算每日收益率并绘制图表的具体步骤。
30 14
|
7天前
|
数据采集 数据可视化 索引
Pandas数据应用:股票数据分析
本文介绍了如何使用Pandas库进行股票数据分析。首先,通过pip安装并导入Pandas库。接着,从本地CSV文件读取股票数据,并解决常见的解析错误。然后,利用head()、info()等函数查看数据基本信息,进行数据清洗,处理缺失值和重复数据。再者,结合Matplotlib和Seaborn进行数据可视化,绘制收盘价折线图。最后,进行时间序列分析,设置日期索引、重采样和计算移动平均线。通过这些步骤,帮助读者掌握Pandas在股票数据分析中的应用。
37 5
|
4月前
|
数据挖掘 Python
pandas中的groupby函数应用
pandas中的groupby函数应用
29 0
pandas中的groupby函数应用
|
4月前
|
数据挖掘 数据处理 Python
Pandas表格样式美化指南:应用条形图
Pandas表格样式美化指南:应用条形图
55 0
|
4月前
|
Python
pandas中的applymap函数应用
pandas中的applymap函数应用
29 0
|
4月前
|
Python
Pandas中的apply函数应用
Pandas中的apply函数应用
29 0