【python】python 电子产品销售分析可视化(数据集+源码)【独一无二】

简介: 【python】python 电子产品销售分析可视化(数据集+源码)【独一无二】

一、设计要求

主要实现了对电子产品销售数据的读取、处理、分析和可视化。具体而言,代码从CSV文件中读取数据,并展示初始数据内容。随后,通过各种条件查询操作,筛选出符合特定条件的数据记录,如价格大于100元、品牌为Samsung等。代码还进行了数据的计算与处理,添加了价格含税列和年龄段列,修改了特定条件下的字段值,并删除了不必要的列。排序操作按价格和年龄对数据进行升序和降序排序。此外,代码还进行了分组统计分析,计算每个品牌的平均价格、各年龄段的订单数量以及各性别的总消费金额。最后,通过折线图、柱状图和饼状图等可视化手段,直观展示了前20条记录的价格变化、前30个品牌的价格占比以及按性别和年龄段分组的统计结果。这些操作共同实现了对销售数据的全面分析与可视化呈现,为进一步的市场分析和决策提供了数据支持。

👉👉👉 源码获取 关注【测试开发自动化】公众号,回复 “电子产品” 获取。👈👈👈


二、代码分析

导入库和配置

import pandas as pd
import matplotlib.pyplot as plt

plt.rcParams['font.sans-serif']=['SimHei'] # 用来正常显示中文标签
plt.rcParams['axes.unicode_minus'] = False # 用来正常显示负号

实现思路:

  1. 导入必要的库:pandas用于数据处理,matplotlib.pyplot用于数据可视化。
  2. 配置matplotlib以支持中文字符和负号的正常显示,确保在绘图时能够正确显示中文标签和负数。

👉👉👉 源码获取 关注【测试开发自动化】公众号,回复 “电子产品” 获取。👈👈👈

显示初始数据

print("初始数据内容:")
print(data.head())

初始数据内容: Unnamed: 0 event_time order_id

… age sex local 0 0 2020-04-24 11:50:39 UTC

2294359932054536986 … 24.0 女 海南 1 1 2020-04-24

11:50:39 UTC 2294359932054536986 … 24.0 女 海南 2 2

2020-04-24 14:37:43 UTC 2294444024058086220 … 38.0 女 北京 3

3 2020-04-24 14:37:43 UTC 2294444024058086220 … 38.0 女 北京

4 4 2020-04-24 19:16:21 UTC 2294584263154074236 … 32.0

女 广东

实现思路:

  1. 打印初始数据的前五条记录,以了解数据的基本结构和内容。

简单条件查询

price_gt_100 = data[data['price'] > 100]
print("价格大于100的记录:")
print(price_gt_100)

价格大于100的记录:

Unnamed: 0 event_time … sex local 0 0 2020-04-24 11:50:39 UTC … 女 海南 1 1

2020-04-24 11:50:39 UTC … 女 海南 4 4

2020-04-24 19:16:21 UTC … 女 广东 6 6

2020-04-26 09:33:47 UTC … 男 北京 7 7

2020-04-26 09:33:47 UTC … 男 北京 … …

… … … … 564160 2633512 2020-11-21 10:06:01 UTC …

女 北京 564162 2633514 2020-11-21 10:08:54 UTC … 女 上海

564163 2633515 2020-11-21 10:08:54 UTC … 女 上海 564164

2633516 2020-11-21 10:10:01 UTC … 男 上海 564165 2633517

2020-11-21 10:10:13 UTC … 女 北京

实现思路:

  1. 使用布尔索引查询price大于100的记录。
  2. 打印查询结果。

计算列数据的添加

data['price_with_tax'] = data['price'] * 1.10
print("添加税后价格的记录:")

👉👉👉 源码获取 关注【测试开发自动化】公众号,回复 “电子产品” 获取。👈👈👈


添加税后价格的记录:

Unnamed: 0 event_time … local price_with_tax

0 0 2020-04-24 11:50:39 UTC … 海南 178.211

1 1 2020-04-24 11:50:39 UTC … 海南 178.211

2 2 2020-04-24 14:37:43 UTC … 北京 85.272

3 3 2020-04-24 14:37:43 UTC … 北京 85.272

4 4 2020-04-24 19:16:21 UTC … 广东 239.327

实现思路:

  1. 计算每条记录的价格加上10%的税费,并将结果存储在一个新列price_with_tax中。
  2. 打印更新后的数据。

添加一行新数据

new_data = {
    'event_time': '2020-04-25 10:00:00 UTC',
    'order_id': 2.29460E+18,
    ...
}
data = data.append(new_data, ignore_index=True)

实现思路:

  1. 构造一条新数据,将其存储在一个字典中。
  2. 使用append方法将新数据添加到DataFrame中。

修改特定条件的数据

data.loc[data['category_code'].isnull(), 'category_code'] = 'unknown'
print("修改category_code为空后的记录:")

实现思路:

  1. 找出所有category_code为空的记录,并将其category_code修改为unknown
  2. 打印更新后的数据。

数据删除操作

👉👉👉 源码获取 关注【测试开发自动化】公众号,回复 “电子产品” 获取。👈👈👈

data = data.drop(columns=['local'])
print("删除'local'列后的记录:")

实现思路:

  1. 删除指定的列(如local),以简化数据结构。
  2. 打印更新后的数据。

数据排序处理

sorted_by_price = data.sort_values(by='price')
print("按价格升序排序后的记录:")

实现思路:

  1. 按照price列的值对数据进行升序排序。
  2. 打印排序后的数据。

分组统计查询

mean_price_by_brand = data.groupby('brand')['price'].mean()
print("按品牌分组的平均价格:")

实现思路:

  1. brand分组,计算每个品牌的平均价格。
  2. 打印分组后的统计结果。

数据可视化

👉👉👉 源码获取 关注【测试开发自动化】公众号,回复 “电子产品” 获取。👈👈👈

plt.figure(figsize=(10, 6))
plt.plot(indices, prices, marker='o', linestyle='-', color='b')

折线图用于显示前20条记录的价格变化趋势。代码通过提取数据的前20条记录并获取其索引和价格,然后使用matplotlib的plot函数绘制折线图。在图表中,设置了图表的大小、标题、标签,并添加了网格线以便于观察数据点的变化。折线图清晰地展示了不同记录的价格走势,适合用来分析短期内价格的波动情况。

柱状图则用于展示前20条记录的价格分布情况。通过类似的方式提取前20条记录的价格数据,然后使用matplotlib的bar函数绘制柱状图。柱状图直观地显示了每条记录的价格差异,帮助识别高价和低价产品的数量及其价格区间。图表同样设置了标题和标签,便于理解图表的内容。柱状图可以很好地用于比较不同记录的价格,并在价格分析中提供清晰的视觉参考。


👉👉👉 源码获取 关注【测试开发自动化】公众号,回复 “电子产品” 获取。👈👈👈

最后,饼状图用于展示前30个品牌的总价格占比。代码首先计算每个品牌的总价格,并选取前30个品牌的数据。然后使用matplotlib的pie函数绘制饼状图。通过饼状图,可以直观地看到各品牌在总价格中的占比,帮助分析哪些品牌占据了主要的市场份额。饼状图设置了标签和百分比显示,增强了数据的可读性和直观性。整体而言,这些可视化图表通过不同的方式展示了销售数据的特征和统计结果,为数据分析提供了丰富的视觉支持,便于更深入地理解和挖掘数据中的信息。


👉👉👉 源码获取 关注【测试开发自动化】公众号,回复 “电子产品” 获取。👈👈👈

实现思路:

  1. 设置绘图的画布大小。
  2. 绘制折线图,显示前20条记录的价格变化情况。

总结

通过一系列步骤实现了电子产品销售数据的读取、处理和可视化分析。每个步骤都有明确的目的,从数据的读取和初步展示,到各种条件查询、数据处理,再到详细的分组统计和可视化,整个流程设计清晰、逻辑严谨,能够有效地对电子产品销售数据进行全面分析。


👉👉👉 源码获取 关注【测试开发自动化】公众号,回复 “电子产品” 获取。👈👈👈

————————————————


                           CSDN-米玛收割机专用版权

                     

原文链接:https://blog.csdn.net/weixin_44244190/article/details/139584587

相关文章
|
7天前
|
数据采集 人工智能 分布式计算
🚀 MaxFrame 产品深度体验评测:Python 分布式计算的未来
在数据驱动的时代,大数据分析和AI模型训练对数据预处理的效率要求极高。传统的Pandas工具在小数据集下表现出色,但面对大规模数据时力不从心。阿里云推出的Python分布式计算框架MaxFrame,以“Pandas风格”为核心设计理念,旨在降低分布式计算门槛,同时支持超大规模数据处理。MaxFrame不仅保留了Pandas的操作习惯,还通过底层优化实现了高效的分布式调度、内存管理和容错机制,并深度集成阿里云大数据生态。本文将通过实践评测,全面解析MaxFrame的能力与价值,展示其在大数据和AI场景中的卓越表现。
24 4
🚀 MaxFrame 产品深度体验评测:Python 分布式计算的未来
|
1月前
|
数据可视化 编译器 Python
Manim:数学可视化的强大工具 | python小知识
Manim(Manim Community Edition)是由3Blue1Brown的Grant Sanderson开发的数学动画引擎,专为数学和科学可视化设计。它结合了Python的灵活性与LaTeX的精确性,支持多领域的内容展示,能生成清晰、精确的数学动画,广泛应用于教育视频制作。安装简单,入门容易,适合教育工作者和编程爱好者使用。
276 7
|
2月前
|
JSON 开发工具 git
基于Python和pygame的植物大战僵尸游戏设计源码
本项目是基于Python和pygame开发的植物大战僵尸游戏,包含125个文件,如PNG图像、Python源码等,提供丰富的游戏开发学习素材。游戏设计源码可从提供的链接下载。关键词:Python游戏开发、pygame、植物大战僵尸、源码分享。
|
2月前
|
存储 数据可视化 数据挖掘
使用Python进行数据分析和可视化
本文将引导你理解如何使用Python进行数据分析和可视化。我们将从基础的数据结构开始,逐步深入到数据处理和分析的方法,最后通过实际的代码示例来展示如何创建直观的数据可视化。无论你是初学者还是有经验的开发者,这篇文章都将为你提供有价值的见解和技巧。让我们一起探索数据的世界,发现隐藏在数字背后的故事!
|
2月前
|
机器学习/深度学习 数据可视化 数据挖掘
使用Python进行数据分析和可视化
【10月更文挑战第42天】本文将介绍如何使用Python进行数据分析和可视化。我们将从数据导入、清洗、探索性分析、建模预测,以及结果的可视化展示等方面展开讲解。通过这篇文章,你将了解到Python在数据处理和分析中的强大功能,以及如何利用这些工具来提升你的工作效率。
|
2月前
|
数据可视化 搜索推荐 Shell
Python与Plotly:B站每周必看榜单的可视化解决方案
Python与Plotly:B站每周必看榜单的可视化解决方案
|
2月前
|
机器学习/深度学习 算法 PyTorch
用Python实现简单机器学习模型:以鸢尾花数据集为例
用Python实现简单机器学习模型:以鸢尾花数据集为例
162 1
|
2月前
|
数据采集 数据可视化 数据挖掘
使用Python进行数据分析和可视化
【10月更文挑战第33天】本文将介绍如何使用Python编程语言进行数据分析和可视化。我们将从数据清洗开始,然后进行数据探索性分析,最后使用matplotlib和seaborn库进行数据可视化。通过阅读本文,你将学会如何运用Python进行数据处理和可视化展示。
|
Linux C语言 开发者
源码安装Python学会有用还能装逼 | 解决各种坑
相信朋友们都看过这个零基础学习Python的开篇了
468 0
源码安装Python学会有用还能装逼 | 解决各种坑
下一篇
开通oss服务