数据分析! Python分析中秋月饼,那几种口味才是 最好吃的?

简介: Python数据分析

中秋节,又称祭月节、月光诞、月夕、秋节、仲秋节、拜月节、月娘节、月亮节、团圆节等,是中国民间的传统节日。自古便有祭月、赏月、吃月饼、玩花灯、赏桂花、饮桂花酒等民俗,流传至今,经久不息。

本期我们通过分析某宝中秋月饼的销售情况,看看哪些口味月饼卖得好,哪些地方月饼卖得好,希望对小伙伴们有所帮助。

涉及到的库:

Pandas — 数据处理

Pyecharts — 数据可视化

jieba — 分词

collections — 数据统计

可视化部分:

Bar — 柱状图

Pie — 饼状图

Map— 地图

Stylecloud — 词云图

  1. 导入模块

image.png

  1. Pandas数据处理

2.1 读取数据

image.png

image.png

结果:
2.2 去除重复值

image.png

(4520, 5)

(1885, 5)

一共有4520条数据,去重后还有1885条数据(某宝一个店铺会在不同页面推荐,导致重复数据比较多)。

2.3 空值处理

处理购买人数为空的记录:

image.png

2.4 处理付款情况字段

image.png

image.png

image.png

付款人数超过10000后会直接用"万"替代,这里我们需要将其恢复,直接转换为销量(销量=售价*人数):
image.png

结果:

  1. Pyecharts数据可视化

3.1 月饼商品销量Top10

代码:

image.png

image.png

效果:
商品名称太长显示不全,我们调整一下边距:

image.png

image.png

这样是不是好多了。

image.png

还可以来些其他(比如:形状)设置:
3.2 月饼销量排名TOP10店铺

代码:

image.png

效果:

image.png

稻香村的月饼销量遥遥领先。

3.3 全国各地区月饼销量

image.png

结果:

image.png

从地域分布图来看,店铺主要分布在北京、山东、浙江、广东、云南等东南地区。
3.4 不同价格区间的月饼销量占比

image.png

可视化 | Python分析中秋月饼,这几种口味才是yyds
可以看到,50元以下的月饼销量占比达到了52%,超过了半数的月饼售价在50元以内,100元以下的月饼销量占比更是达到了85%之多,虽然也有价格在1000元以上的,但整体价格还是比较实惠的。

3.5 月饼口味分布

image.png

流心、五仁、蛋黄莲蓉、豆沙 yyds!!!

3.6 词云图

image.png

相关文章
|
1天前
|
数据采集 数据可视化 数据挖掘
如何利用Python中的Pandas库进行数据分析和可视化
Python的Pandas库是一种功能强大的工具,可以用于数据分析和处理。本文将介绍如何使用Pandas库进行数据分析和可视化,包括数据导入、清洗、转换以及基本的统计分析和图表绘制。通过学习本文,读者将能够掌握利用Python中的Pandas库进行高效数据处理和可视化的技能。
|
3天前
|
机器学习/深度学习 数据可视化 算法
使用Python进行数据分析的5个必备技巧
【5月更文挑战第9天】本文介绍了Python数据分析的五个关键技巧:1) 使用Pandas进行数据处理和清洗;2) 利用NumPy进行高效数值计算;3) 通过Matplotlib和Seaborn创建可视化图表;4) 使用Scikit-learn执行机器学习任务;5) 在Jupyter Notebook中进行交互式分析和文档分享。这些技巧能提升数据分析的效率和准确性。
|
3天前
|
语音技术 开发者 Python
python之pyAudioAnalysis:音频特征提取分析文档示例详解
python之pyAudioAnalysis:音频特征提取分析文档示例详解
10 0
|
3天前
|
数据可视化 大数据 Python
python大数据分析处理
python大数据分析处理
10 0
|
4天前
|
数据采集 数据可视化 数据挖掘
Python 与 PySpark数据分析实战指南:解锁数据洞见
Python 与 PySpark数据分析实战指南:解锁数据洞见
|
4天前
|
机器学习/深度学习 人工智能 大数据
AI时代Python金融大数据分析实战:ChatGPT让金融大数据分析插上翅膀
AI时代Python金融大数据分析实战:ChatGPT让金融大数据分析插上翅膀
|
5天前
|
机器学习/深度学习 自然语言处理 算法
Python遗传算法GA对长短期记忆LSTM深度学习模型超参数调优分析司机数据|附数据代码
Python遗传算法GA对长短期记忆LSTM深度学习模型超参数调优分析司机数据|附数据代码
|
5天前
|
Python Perl
Python中的字符串分析:判断字符串中是否包含字母
Python中的字符串分析:判断字符串中是否包含字母
10 0
|
5天前
|
机器学习/深度学习 数据可视化 决策智能
Python中使用Gradient Boosting Decision Trees (GBDT)进行特征重要性分析
Python中使用Gradient Boosting Decision Trees (GBDT)进行特征重要性分析
15 0
|
5天前
|
机器学习/深度学习 Python
python实现判别分析
python实现判别分析
12 1