python每日分析练习:产品季度销售的比较分析

简介: python每日分析练习:产品季度销售的比较分析

作者介绍:10年大厂数据\经营分析经验,现任大厂数据部门负责人。

会一些的技术:数据分析、算法、SQL、大数据相关、python

欢迎加入社区:码上找工作

作者专栏每日更新:

LeetCode解锁1000题: 打怪升级之旅

python数据分析可视化:企业实战案例

备注说明:方便大家阅读,统一使用python,带必要注释,公众号 数据分析螺丝钉 一起打怪升级

这次我们将关注一家零售公司的季度销售分析。

假设场景

一家零售公司希望分析其过去一年内各季度的销售表现,以便更好地理解其业务趋势,评估不同产品类别的表现,并优化未来的销售策略。

分析目的

理解季度销售趋势:分析公司整体和各产品类别的销售趋势。

评估产品类别表现:确定哪些产品类别表现最佳,哪些需要改进。

优化销售策略:基于分析结果,提出改进销售策略的建议。

分析步骤

数据准备:模拟包含各季度销售额和产品类别信息的数据。

季度销售趋势分析:可视化整体和按产品类别细分的季度销售额。

产品类别表现评估:对比不同产品类别的销售表现。

策略建议:根据分析结果,提出销售策略优化建议。

可视化改进前

初始图表尝试同时展示总销售趋势和各产品类别销售情况,导致图表复杂、难以解读。

第一次可视化改进后

简化图表设计,分别展示总销售趋势和产品类别销售比重,提高了信息的可读性和易懂性。

第一次改进后分析结论

季度趋势:销售额在第四季度显著增长,可能受假日季节影响。

产品类别:产品类别C和B表现优秀,而A类别表现不佳,需进一步分析原因。

策略建议:针对A产品的表现需要进一步做分析


可以看到第一次改进分析不出来每个产品的趋势变化和原因按这个分析结论估计很难得到读者的认可

第二次可视化改进

通过上述堆叠柱状图,我们可以更清晰地看到每个季度总销售额的变化趋势,以及不同产品类别(A、B、C)对总销售额的贡献。这种图表设计使得:

  • 同时观察总销售趋势和各个产品类别的表现变得更加直观。
  • 可以轻松识别哪些产品类别在特定季度内表现较好或需要改进。
  • 支持更加精确的销售策略调整,针对特定产品类别或季度采取行动。

但是这个图表怎么说呢,三个产品变化需要比较详细的看,然后B的颜色比较深好像在告诉读者应该关注B,C的波动看着大,实际是由于在AB的基础上堆叠导致,这个图只能大概看出整体的趋势,堆叠图不是很适用于分析多产品变化

第三次可视化改进

现在图表显示了三个产品类别的销售数据,每个类别占据了图表中的一个部分,并且都清晰地标注了波动原因。图表的布局更紧凑,重点在于一眼看到问题,然后各个产品间不会出现视觉上的重叠,同时把ABC三个产品的销售总额的饼图展示出来,这是两个图拼接的

分析结论

总的看A产品的销售额全年最低需要进一步分析,C产品最高

Category A Sales

       趋势:Category A 在Q1 - Q2展现出销售平稳,这是由于一个成功的营销活动,标注为 "Marketing Boost"。然后在Q3-Q4没有继续营销出现下滑

       结论:营销活动对Category A的销售有积极影响。建议未来继续投资营销和推广。

Category B Sales

       趋势:Category B 在Q3显示出销售额的显著增长,这被归因于 "Increased Demand"。

       结论:需求的增加反映出Category B的市场接受度好,可能是由于产品创新或市场需求的变化。为了支持这一趋势,公司应该关注产品供应和库存管理,确保能满足市场需求。

Category C Sales

       趋势:Category C 在年末出现销售下滑,这被标注为 "End-of-Year Dip"。

       结论:尽管一般认为假日季会带来销售高峰,Category C却遇到了销售下降。这是因为市场竞争加剧或消费者偏好的季节性变化。需要深入分析这一趋势背后的原因,并考虑调整产品定价、促销或者销售策略,以强化假日季销售。

本文的excel数据欢迎 关注公众号 数据分析螺丝钉 回复关键词 python可视化 领取,包含更多免费资料,一起每日学习升级打怪,关注不迷路


最后再对比一下改进前后的 差异

参考代码

# 绘制三个紧凑的子图,每个子图对应一个产品类别的销售趋势,包括Y轴刻度和波动原因的标注
 
# 设置子图的风格和尺寸
sns.set(style="whitegrid")
 
# 创建一个figure和三个subplot,共享x轴
fig, axes = plt.subplots(3, 1, figsize=(12, 8), sharex=True)
 
# 自定义每个产品的颜色
category_colors = {'A': 'skyblue', 'B': 'mediumseagreen', 'C': 'salmon'}
 
# 定义波动原因的标注位置
annotations = {
    'A': {'Q2': 'Marketing Boost'},
    'B': {'Q3': 'Increased Demand'},
    'C': {'Q4': 'End-of-Year Dip'}
}
 
# 生成每个子图
for i, (ax, category) in enumerate(zip(axes, categories)):
    # 过滤数据
    category_data = df_retail[df_retail['Category'] == category]
    # 绘制线图
    sns.lineplot(ax=ax, data=category_data, x='Quarter', y='Sales', marker='o', label=f"{category} Sales", color=category_colors[category])
    # 添加标题
    ax.set_title(f"Category {category} Sales")
    # 添加Y轴标签
    ax.set_ylabel("Sales")
    # 设置Y轴刻度范围和标签
    ax.set_ylim(category_data['Sales'].min() - 5000, category_data['Sales'].max() + 5000)
    ax.set_yticks([category_data['Sales'].min(), category_data['Sales'].max()])
    # 标注波动原因
    if category in annotations:
        for quarter, text in annotations[category].items():
            y_value = category_data[category_data['Quarter'] == quarter]['Sales'].values[0]
            ax.text(quarter, y_value, text, fontsize=9, ha='center', va='bottom')
    # 移除网格线
    ax.grid(False)
 
# 调整布局
plt.tight_layout()
plt.show()
相关文章
|
1月前
|
机器学习/深度学习 数据采集 TensorFlow
使用Python实现智能食品消费模式分析的深度学习模型
使用Python实现智能食品消费模式分析的深度学习模型
132 70
|
6天前
|
机器学习/深度学习 数据可视化 数据挖掘
使用Python实现基于矩阵分解的长期事件(MFLEs)时间序列分析
在现代数据分析中,高维时间序列数据的处理和预测极具挑战性。基于矩阵分解的长期事件(MFLEs)分析技术应运而生,通过降维和时间序列特性结合,有效应对大规模数据。MFLE利用矩阵分解提取潜在特征,降低计算复杂度,过滤噪声,并发现主要模式。相比传统方法如ARIMA和深度学习模型如LSTM,MFLE在多变量处理、计算效率和可解释性上更具优势。通过合理应用MFLE,可在物联网、金融等领域获得良好分析效果。
25 0
使用Python实现基于矩阵分解的长期事件(MFLEs)时间序列分析
|
8天前
|
数据可视化 算法 数据挖掘
Python时间序列分析工具Aeon使用指南
**Aeon** 是一个遵循 scikit-learn API 风格的开源 Python 库,专注于时间序列处理。它提供了分类、回归、聚类、预测建模和数据预处理等功能模块,支持多种算法和自定义距离度量。Aeon 活跃开发并持续更新至2024年,与 pandas 1.4.0 版本兼容,内置可视化工具,适合数据探索和基础分析任务。尽管在高级功能和性能优化方面有提升空间,但其简洁的 API 和完整的基础功能使其成为时间序列分析的有效工具。
60 37
Python时间序列分析工具Aeon使用指南
|
4天前
|
机器学习/深度学习 运维 数据可视化
Python时间序列分析:使用TSFresh进行自动化特征提取
TSFresh 是一个专门用于时间序列数据特征自动提取的框架,支持分类、回归和异常检测等机器学习任务。它通过自动化特征工程流程,处理数百个统计特征(如均值、方差、自相关性等),并通过假设检验筛选显著特征,提升分析效率。TSFresh 支持单变量和多变量时间序列数据,能够与 scikit-learn 等库无缝集成,适用于大规模时间序列数据的特征提取与模型训练。其工作流程包括数据格式转换、特征提取和选择,并提供可视化工具帮助理解特征分布及与目标变量的关系。
39 16
Python时间序列分析:使用TSFresh进行自动化特征提取
|
1月前
|
机器学习/深度学习 数据采集 TensorFlow
使用Python实现智能食品消费习惯分析的深度学习模型
使用Python实现智能食品消费习惯分析的深度学习模型
152 68
|
10天前
|
分布式计算 DataWorks 数据处理
产品测评 | 上手分布式Python计算服务MaxFrame产品最佳实践
MaxFrame是阿里云自研的分布式计算框架,专为大数据处理设计,提供高效便捷的Python开发体验。其主要功能包括Python编程接口、直接利用MaxCompute资源、与MaxCompute Notebook集成及镜像管理功能。本文基于MaxFrame最佳实践,详细介绍了在DataWorks中使用MaxFrame创建数据源、PyODPS节点和MaxFrame会话的过程,并展示了如何通过MaxFrame实现分布式Pandas处理和大语言模型数据处理。测评反馈指出,虽然MaxFrame具备强大的数据处理能力,但在文档细节和新手友好性方面仍有改进空间。
|
18天前
|
数据采集 人工智能 分布式计算
🚀 MaxFrame 产品深度体验评测:Python 分布式计算的未来
在数据驱动的时代,大数据分析和AI模型训练对数据预处理的效率要求极高。传统的Pandas工具在小数据集下表现出色,但面对大规模数据时力不从心。阿里云推出的Python分布式计算框架MaxFrame,以“Pandas风格”为核心设计理念,旨在降低分布式计算门槛,同时支持超大规模数据处理。MaxFrame不仅保留了Pandas的操作习惯,还通过底层优化实现了高效的分布式调度、内存管理和容错机制,并深度集成阿里云大数据生态。本文将通过实践评测,全面解析MaxFrame的能力与价值,展示其在大数据和AI场景中的卓越表现。
40 4
🚀 MaxFrame 产品深度体验评测:Python 分布式计算的未来
|
6天前
|
人工智能 分布式计算 大数据
MaxFrame 产品评测:大数据与AI融合的Python分布式计算框架
MaxFrame是阿里云MaxCompute推出的自研Python分布式计算框架,支持大规模数据处理与AI应用。它提供类似Pandas的API,简化开发流程,并兼容多种机器学习库,加速模型训练前的数据准备。MaxFrame融合大数据和AI,提升效率、促进协作、增强创新能力。尽管初次配置稍显复杂,但其强大的功能集、性能优化及开放性使其成为现代企业与研究机构的理想选择。未来有望进一步简化使用门槛并加强社区建设。
41 7
|
3天前
|
数据采集 缓存 API
python爬取Boss直聘,分析北京招聘市场
本文介绍了如何使用Python爬虫技术从Boss直聘平台上获取深圳地区的招聘数据,并进行数据分析,以帮助求职者更好地了解市场动态和职位需求。
|
1月前
|
机器学习/深度学习 数据采集 数据挖掘
使用Python实现智能食品消费市场分析的深度学习模型
使用Python实现智能食品消费市场分析的深度学习模型
130 36