【python】python 电子产品销售分析可视化(数据集+源码)【独一无二】

简介: 【python】python 电子产品销售分析可视化(数据集+源码)【独一无二】

一、设计要求

主要实现了对电子产品销售数据的读取、处理、分析和可视化。具体而言,代码从CSV文件中读取数据,并展示初始数据内容。随后,通过各种条件查询操作,筛选出符合特定条件的数据记录,如价格大于100元、品牌为Samsung等。代码还进行了数据的计算与处理,添加了价格含税列和年龄段列,修改了特定条件下的字段值,并删除了不必要的列。排序操作按价格和年龄对数据进行升序和降序排序。此外,代码还进行了分组统计分析,计算每个品牌的平均价格、各年龄段的订单数量以及各性别的总消费金额。最后,通过折线图、柱状图和饼状图等可视化手段,直观展示了前20条记录的价格变化、前30个品牌的价格占比以及按性别和年龄段分组的统计结果。这些操作共同实现了对销售数据的全面分析与可视化呈现,为进一步的市场分析和决策提供了数据支持。

👉👉👉 源码获取 关注【测试开发自动化】公众号,回复 “电子产品” 获取。👈👈👈


二、代码分析

导入库和配置

import pandas as pd
import matplotlib.pyplot as plt

plt.rcParams['font.sans-serif']=['SimHei'] # 用来正常显示中文标签
plt.rcParams['axes.unicode_minus'] = False # 用来正常显示负号

实现思路:

  1. 导入必要的库:pandas用于数据处理,matplotlib.pyplot用于数据可视化。
  2. 配置matplotlib以支持中文字符和负号的正常显示,确保在绘图时能够正确显示中文标签和负数。

👉👉👉 源码获取 关注【测试开发自动化】公众号,回复 “电子产品” 获取。👈👈👈

显示初始数据

print("初始数据内容:")
print(data.head())

初始数据内容: Unnamed: 0 event_time order_id

… age sex local 0 0 2020-04-24 11:50:39 UTC

2294359932054536986 … 24.0 女 海南 1 1 2020-04-24

11:50:39 UTC 2294359932054536986 … 24.0 女 海南 2 2

2020-04-24 14:37:43 UTC 2294444024058086220 … 38.0 女 北京 3

3 2020-04-24 14:37:43 UTC 2294444024058086220 … 38.0 女 北京

4 4 2020-04-24 19:16:21 UTC 2294584263154074236 … 32.0

女 广东

实现思路:

  1. 打印初始数据的前五条记录,以了解数据的基本结构和内容。

简单条件查询

price_gt_100 = data[data['price'] > 100]
print("价格大于100的记录:")
print(price_gt_100)

价格大于100的记录:

Unnamed: 0 event_time … sex local 0 0 2020-04-24 11:50:39 UTC … 女 海南 1 1

2020-04-24 11:50:39 UTC … 女 海南 4 4

2020-04-24 19:16:21 UTC … 女 广东 6 6

2020-04-26 09:33:47 UTC … 男 北京 7 7

2020-04-26 09:33:47 UTC … 男 北京 … …

… … … … 564160 2633512 2020-11-21 10:06:01 UTC …

女 北京 564162 2633514 2020-11-21 10:08:54 UTC … 女 上海

564163 2633515 2020-11-21 10:08:54 UTC … 女 上海 564164

2633516 2020-11-21 10:10:01 UTC … 男 上海 564165 2633517

2020-11-21 10:10:13 UTC … 女 北京

实现思路:

  1. 使用布尔索引查询price大于100的记录。
  2. 打印查询结果。

计算列数据的添加

data['price_with_tax'] = data['price'] * 1.10
print("添加税后价格的记录:")

👉👉👉 源码获取 关注【测试开发自动化】公众号,回复 “电子产品” 获取。👈👈👈


添加税后价格的记录:

Unnamed: 0 event_time … local price_with_tax

0 0 2020-04-24 11:50:39 UTC … 海南 178.211

1 1 2020-04-24 11:50:39 UTC … 海南 178.211

2 2 2020-04-24 14:37:43 UTC … 北京 85.272

3 3 2020-04-24 14:37:43 UTC … 北京 85.272

4 4 2020-04-24 19:16:21 UTC … 广东 239.327

实现思路:

  1. 计算每条记录的价格加上10%的税费,并将结果存储在一个新列price_with_tax中。
  2. 打印更新后的数据。

添加一行新数据

new_data = {
    'event_time': '2020-04-25 10:00:00 UTC',
    'order_id': 2.29460E+18,
    ...
}
data = data.append(new_data, ignore_index=True)

实现思路:

  1. 构造一条新数据,将其存储在一个字典中。
  2. 使用append方法将新数据添加到DataFrame中。

修改特定条件的数据

data.loc[data['category_code'].isnull(), 'category_code'] = 'unknown'
print("修改category_code为空后的记录:")

实现思路:

  1. 找出所有category_code为空的记录,并将其category_code修改为unknown
  2. 打印更新后的数据。

数据删除操作

👉👉👉 源码获取 关注【测试开发自动化】公众号,回复 “电子产品” 获取。👈👈👈

data = data.drop(columns=['local'])
print("删除'local'列后的记录:")

实现思路:

  1. 删除指定的列(如local),以简化数据结构。
  2. 打印更新后的数据。

数据排序处理

sorted_by_price = data.sort_values(by='price')
print("按价格升序排序后的记录:")

实现思路:

  1. 按照price列的值对数据进行升序排序。
  2. 打印排序后的数据。

分组统计查询

mean_price_by_brand = data.groupby('brand')['price'].mean()
print("按品牌分组的平均价格:")

实现思路:

  1. brand分组,计算每个品牌的平均价格。
  2. 打印分组后的统计结果。

数据可视化

👉👉👉 源码获取 关注【测试开发自动化】公众号,回复 “电子产品” 获取。👈👈👈

plt.figure(figsize=(10, 6))
plt.plot(indices, prices, marker='o', linestyle='-', color='b')

折线图用于显示前20条记录的价格变化趋势。代码通过提取数据的前20条记录并获取其索引和价格,然后使用matplotlib的plot函数绘制折线图。在图表中,设置了图表的大小、标题、标签,并添加了网格线以便于观察数据点的变化。折线图清晰地展示了不同记录的价格走势,适合用来分析短期内价格的波动情况。

柱状图则用于展示前20条记录的价格分布情况。通过类似的方式提取前20条记录的价格数据,然后使用matplotlib的bar函数绘制柱状图。柱状图直观地显示了每条记录的价格差异,帮助识别高价和低价产品的数量及其价格区间。图表同样设置了标题和标签,便于理解图表的内容。柱状图可以很好地用于比较不同记录的价格,并在价格分析中提供清晰的视觉参考。


👉👉👉 源码获取 关注【测试开发自动化】公众号,回复 “电子产品” 获取。👈👈👈

最后,饼状图用于展示前30个品牌的总价格占比。代码首先计算每个品牌的总价格,并选取前30个品牌的数据。然后使用matplotlib的pie函数绘制饼状图。通过饼状图,可以直观地看到各品牌在总价格中的占比,帮助分析哪些品牌占据了主要的市场份额。饼状图设置了标签和百分比显示,增强了数据的可读性和直观性。整体而言,这些可视化图表通过不同的方式展示了销售数据的特征和统计结果,为数据分析提供了丰富的视觉支持,便于更深入地理解和挖掘数据中的信息。


👉👉👉 源码获取 关注【测试开发自动化】公众号,回复 “电子产品” 获取。👈👈👈

实现思路:

  1. 设置绘图的画布大小。
  2. 绘制折线图,显示前20条记录的价格变化情况。

总结

通过一系列步骤实现了电子产品销售数据的读取、处理和可视化分析。每个步骤都有明确的目的,从数据的读取和初步展示,到各种条件查询、数据处理,再到详细的分组统计和可视化,整个流程设计清晰、逻辑严谨,能够有效地对电子产品销售数据进行全面分析。


👉👉👉 源码获取 关注【测试开发自动化】公众号,回复 “电子产品” 获取。👈👈👈

————————————————


                           CSDN-米玛收割机专用版权

                     

原文链接:https://blog.csdn.net/weixin_44244190/article/details/139584587

相关文章
|
10天前
|
机器学习/深度学习 算法 搜索推荐
从理论到实践,Python算法复杂度分析一站式教程,助你轻松驾驭大数据挑战!
【10月更文挑战第4天】在大数据时代,算法效率至关重要。本文从理论入手,介绍时间复杂度和空间复杂度两个核心概念,并通过冒泡排序和快速排序的Python实现详细分析其复杂度。冒泡排序的时间复杂度为O(n^2),空间复杂度为O(1);快速排序平均时间复杂度为O(n log n),空间复杂度为O(log n)。文章还介绍了算法选择、分而治之及空间换时间等优化策略,帮助你在大数据挑战中游刃有余。
34 4
|
7天前
|
数据可视化 算法 Python
基于OpenFOAM和Python的流场动态模态分解:从数据提取到POD-DMD分析
本文介绍了如何利用Python脚本结合动态模态分解(DMD)技术,分析从OpenFOAM模拟中提取的二维切片数据,以深入理解流体动力学现象。通过PyVista库处理VTK格式的模拟数据,进行POD和DMD分析,揭示流场中的主要能量结构及动态特征。此方法为研究复杂流动系统提供了有力工具。
19 2
基于OpenFOAM和Python的流场动态模态分解:从数据提取到POD-DMD分析
|
3天前
|
自然语言处理 算法 数据挖掘
探讨如何利用Python中的NLP工具,从被动收集到主动分析文本数据的过程
【10月更文挑战第11天】本文介绍了自然语言处理(NLP)在文本分析中的应用,从被动收集到主动分析的过程。通过Python代码示例,详细展示了文本预处理、特征提取、情感分析和主题建模等关键技术,帮助读者理解如何有效利用NLP工具进行文本数据分析。
17 2
|
数据采集 人工智能 算法
Python学习十大公开免费数据集介绍
很多行友说,想做项目学习和练手没有数据怎么办。又想给行哥投稿赚钱,没有数据拿头分析啊。先别急,这里行哥给大家推荐一些数据来源,足够你去好好分析数据,这些数据用来学习和找工作都不是问题
1043 0
Python学习十大公开免费数据集介绍
|
6天前
|
存储 程序员 开发者
Python编程基础:从入门到实践
【10月更文挑战第8天】在本文中,我们将一起探索Python编程的奇妙世界。无论你是初学者还是有一定经验的开发者,这篇文章都将为你提供有价值的信息。我们将从Python的基本概念开始,然后逐步深入到更复杂的主题,如数据结构、函数和类。最后,我们将通过一些实际的代码示例来巩固我们的知识。让我们一起开始这段Python编程之旅吧!
|
7天前
|
机器学习/深度学习 数据采集 数据挖掘
探索Python编程的奥秘
【10月更文挑战第7天】本文将带你走进Python的世界,探索其背后的逻辑与魅力。我们将从基础语法开始,逐步深入到函数、面向对象编程等高级特性,最后通过实际项目案例,让你体验Python的强大与便捷。无论你是编程新手,还是有一定基础的开发者,都能在这篇文章中找到你需要的信息和启发。
|
8天前
|
IDE 开发工具 Python
Python 编程入门:打造你的第一个程序
【10月更文挑战第6天】编程,这个听起来高大上又充满神秘感的领域,其实就像学习骑自行车一样。一开始你可能会觉得难以掌握平衡,但一旦你学会了,就能自由地穿梭在广阔的道路上。本文将带你走进 Python 的世界,用最简单的方式让你体验编写代码的乐趣。不需要复杂的理论,我们将通过一个简单的例子——制作一个猜数字游戏,来实践学习。准备好了吗?让我们开始吧!
|
5天前
|
数据采集 开发框架 数据处理
探索Python的灵活性:简化日常编程任务
【10月更文挑战第7天】 【10月更文挑战第9天】 在本文中,我们将深入探讨Python编程语言的强大功能和灵活性。通过具体的代码示例,我们会展示如何利用Python简化日常编程任务,提高效率。无论是数据处理、自动化脚本还是Web开发,Python都能提供简洁而强大的解决方案。我们还将讨论一些最佳实践,帮助你编写更清晰、更高效的代码。
10 1
|
10天前
|
存储 人工智能 Java
Python编程入门:从基础到实战
【10月更文挑战第4天】本文旨在为初学者提供一个全面而深入的Python编程学习路径。我们将从Python的基本语法和概念开始,然后逐步深入到更复杂的主题,如数据结构、面向对象编程和异常处理等。最后,我们将通过一些实际的项目案例,帮助读者将理论知识应用到实践中去。无论你是编程新手,还是有一定经验的开发者,都可以在这篇文章中找到适合自己的学习内容。让我们一起开启Python编程的学习之旅吧!
|
9天前
|
存储 人工智能 数据挖掘
探索Python编程:从基础到进阶
【10月更文挑战第5天】在数字时代的浪潮中,掌握编程技能已成为一项宝贵的能力。本文旨在为初学者提供一个深入浅出的Python编程之旅,从基本概念到实际应用,逐步揭示编程之美。无论你是编程新手还是希望深化理解,跟随这篇文章的脚步,你将学会如何用Python语言构建你的第一个程序,并了解代码背后的逻辑。让我们开始吧,解锁编程的秘密,开启你的技术成长之路!