python_面向对象基础_数据分析

简介: 数据可视化

主要目的

对于文本格式和JSON格式数据进行分析,将其中数据提炼出来绘制折线图。


主要实现步骤

1.设计一个完成对数据的封装
2.设计一个抽象类,定义数据读取相关功能,使用其子类实现具体功能
3.读取文件,生成数据对象
4.进行数据计算
5.绘制图表


定义数据封装类

"""
数据定义封装的类
"""


# 定义销售情况的封装类
class Record:

    def __init__(self, date, order_id, money, province):
        self.date = date            # 订单日期
        self.order_id = order_id    # 订单ID
        self.money = money          # 订单金额
        self.province = province    # 销售省份

    def __str__(self):
        return f"{self.date}, {self.order_id}, {self.money}, {self.province}"


定义文件读取操作的类

"""
和文件相关的类定义
"""
import json

from 面向对象_数据分析实战.data_define import Record


# 定义一个抽象类,做顶层设计,确定有哪些功能需要实现
class FileReader:

    def read_data(self) -> list[Record]:
        """读取文件数据,将每一月数据转换成 Record 对象,将他们封装到list内返回"""
        pass


class TextFileReader(FileReader):
    def __init__(self, path):
        self.path = path

    # 复写抽象方法
    def read_data(self) -> list[Record]:
        f = open(self.path, "r", encoding="UTF-8")
        record_list: list[Record] = []
        for line in f.readlines():
            line = line.strip()  # 消除读到数据中的换行符
            data_list = line.split(",")
            record = Record(data_list[0], data_list[1], int(data_list[2]), data_list[3])
            record_list.append(record)  # 封装

        f.close()
        return record_list


class JsonFileReader(FileReader):

    def __init__(self, path):
        self.path = path

    # 复写抽象方法
    def read_data(self) -> list[Record]:
        f = open(self.path, "r", encoding="UTF-8")
        record_list: list[Record] = []

        for line in f.readlines():
            data_dict = json.loads(line)
            record = Record(data_dict["date"], data_dict["order_id"], int(data_dict["money"]), data_dict["province"])
            record_list.append(record)

        f.close()
        return record_list


# 测试
if __name__ == '__main__':
    json_file_reader = JsonFileReader("D:/桌面/2011年2月销售数据JSON.txt")
    list1 = json_file_reader.read_data()
    for l in list1:
        print(l.__str__())


主类调用定义方法,完成数据分析


"""
面向对象,数据分析案例实战

1.设计一个完成对数据的封装
2.设计一个抽象类,定义数据读取相关功能,使用其子类实现具体功能
3.读取文件,生成数据对象
4.进行数据计算
5.绘制图表
"""


from file_define import FileReader, TextFileReader, JsonFileReader
from data_define import Record
from pyecharts.charts import Bar
from pyecharts.options import *
from pyecharts.globals import ThemeType

text_file_reader = TextFileReader("D:/桌面/2011年1月销售数据.txt")
json_file_reader = JsonFileReader("D:/桌面/2011年2月销售数据JSON.txt")

jan_data: list[Record] = text_file_reader.read_data()
feb_data: list[Record] = json_file_reader.read_data()

# 将两个月份数据合并
all_data: list[Record] = jan_data + feb_data

# 开始数据计算,使用字典进行计算存储
# {"2011-01-01": 1564, "2011-01-02": 300, ...}
data_dict = {
   
   }
for record in all_data:
    if record.date in data_dict.keys():
        # 当前日期有记录,直接累加
        data_dict[record.date] += record.money
    else:
        data_dict[record.date] = record.money

# 可视化图标开发
bar = Bar(init_opts=InitOpts(theme=ThemeType.LIGHT))

bar.add_xaxis(list(data_dict.keys()))  # 添加X轴数据
bar.add_yaxis("销售额", list(data_dict.values()), label_opts=LabelOpts(is_show=False))  # 田间Y轴数据
bar.set_global_opts(
    title_opts=TitleOpts(title="每日销售额")
)

bar.render("2011年1,2月份每日销售额柱状图.html")

其中注意的几个点

对于数据的封装

充分使用类中的成员属性和成员方法,切实的拟合类的实现,对于类中的一些魔术方法也要加以了解使用。

对于注释

写代码时注意写上注释,一方面方便记录思路,另一方面防止自己以后看不懂自己写的代码

对于设计层面

一些功能可以使用相似结构去完成的可以采取抽象类设计方法,顶层抽象类只负责规定需要实现哪些功能,具体的实现交给负责实现的子类去完成,如此设计逻辑清晰,可以满足多种功能差别实现。

对于类的构造方法

可以在此处给类的成员属性赋上值

全局展示设置

在绘图中可以自定义标题、图标颜色、主题、样式


图片展示


image.png

目录
相关文章
|
2月前
|
机器学习/深度学习 数据采集 数据可视化
Python 数据分析:从零开始构建你的数据科学项目
【10月更文挑战第9天】Python 数据分析:从零开始构建你的数据科学项目
58 2
|
2月前
|
机器学习/深度学习 数据可视化 算法
使用Python进行数据分析:从零开始的指南
【10月更文挑战第9天】使用Python进行数据分析:从零开始的指南
46 1
|
28天前
|
数据采集 存储 数据挖掘
Python数据分析:Pandas库的高效数据处理技巧
【10月更文挑战第27天】在数据分析领域,Python的Pandas库因其强大的数据处理能力而备受青睐。本文介绍了Pandas在数据导入、清洗、转换、聚合、时间序列分析和数据合并等方面的高效技巧,帮助数据分析师快速处理复杂数据集,提高工作效率。
62 0
|
13天前
|
机器学习/深度学习 数据可视化 数据挖掘
使用Python进行数据分析和可视化
【10月更文挑战第42天】本文将介绍如何使用Python进行数据分析和可视化。我们将从数据导入、清洗、探索性分析、建模预测,以及结果的可视化展示等方面展开讲解。通过这篇文章,你将了解到Python在数据处理和分析中的强大功能,以及如何利用这些工具来提升你的工作效率。
|
2月前
|
Python
Python面向对象(2)
【10月更文挑战第14天】
Python面向对象(2)
|
2月前
|
设计模式 程序员 C语言
Python面向对象
【10月更文挑战第13天】
Python面向对象
|
22天前
|
机器学习/深度学习 数据采集 数据挖掘
解锁 Python 数据分析新境界:Pandas 与 NumPy 高级技巧深度剖析
Pandas 和 NumPy 是 Python 中不可或缺的数据处理和分析工具。本文通过实际案例深入剖析了 Pandas 的数据清洗、NumPy 的数组运算、结合两者进行数据分析和特征工程,以及 Pandas 的时间序列处理功能。这些高级技巧能够帮助我们更高效、准确地处理和分析数据,为决策提供支持。
38 2
|
29天前
|
存储 数据挖掘 数据处理
Python数据分析:Pandas库的高效数据处理技巧
【10月更文挑战第26天】Python 是数据分析领域的热门语言,Pandas 库以其高效的数据处理功能成为数据科学家的利器。本文介绍 Pandas 在数据读取、筛选、分组、转换和合并等方面的高效技巧,并通过示例代码展示其实际应用。
36 2
|
2月前
|
数据采集 数据可视化 数据挖掘
R语言与Python:比较两种数据分析工具
R语言和Python是目前最流行的两种数据分析工具。本文将对这两种工具进行比较,包括它们的历史、特点、应用场景、社区支持、学习资源、性能等方面,以帮助读者更好地了解和选择适合自己的数据分析工具。
34 2
|
12天前
|
数据采集 数据可视化 数据挖掘
掌握Python数据分析,解锁数据驱动的决策能力
掌握Python数据分析,解锁数据驱动的决策能力