【Python • 集合】如何使复杂类型对象支持集合操作

简介: 【Python • 集合】如何使复杂类型对象支持集合操作

项目场景:

有两个集合,每次运算时,都需要对两个集合取差集找出两个集合的差异,或者取并集用来去重,其中的元素都是复杂类型的对象。


问题描述

众所周知,集合是无序的,且没有重复的。在本例中,定义了一个class,然后创建对象,每次往定义的结合中加元素时,同样的元素,加到集合却可以无限添加,通过调试发现,每次添加的元素Hash值是不同的。

首先定义一个Person类,用于测试,

class Person:
    def __init__(self, name, age):
        self.name = name
        self.age = age
    def get_name(self):
        return self.name
    def get_age(self):
        return self.age

在main.py中新建一个集合,向集合中添加Person类型的对象,在person_list中是所有将要添加的对象,其中有一个是重复的,是为了验证是否可以去重专门添加的,

from Model.Person import Person
def main():
    person_set = set()
    person_list = [
        Person("张三", 24),
        Person("李四", 15),
        Person("王五", 28),
        Person("张麻子", 30),
        Person("二营长", 19),
        Person("张三", 24)
    ]
    for p in person_list:
        person_set.add(p)
    print("Person set")
    for p in person_set:
        print(p)
if __name__ == '__main__':
    main()

运行后,结果如下,可以看到,在集合person_set中添加了6个对象,每个集合的hash值都是不一样的,

此时,再加一个test_person_set,用来

test_person_list = [
        Person("李四", 15),
        Person("王五", 28),
        Person("张麻子", 30),
    ]
    test_person_set = set()
    for person in test_person_list:
        test_person_set.add(person)

person_set做差,

result_set = person_set - test_person_set
    print("Result Person set")
    for p in result_set:
        print(p)

此时,输出运行结果,还是person_set中的6个元素,


原因分析:

在Python的对象中,有__str__方法,用来将对象转换成字符串,相当于java的toString()方法,__eq__方法,提供两个对象的比较运算,当使用==运算符连接两个对象时触发,而最关键的是__hash__方法,获取对象的hash值。

在Python的集合操作中,判断两个元素是否相等,应该是用对象的hash值来判断是否是同一个对象(只是猜测,并未找到实质证据,也未找到Python的源码),并且来使用eq来判断是否两个元素相等。


解决方案:

基于以上猜测,我在Person类中加入了eqhash方法,两者任意一个缺失都不能解决这个问题,Person类的对象最终如下,

class Person:
    def __init__(self, name, age):
        self.name = name
        self.age = age
    def get_name(self):
        return self.name
    def get_age(self):
        return self.age
    def __str__(self):
        return self.get_name() + str(self.get_age())
    def __eq__(self, other):
        return self.name == other.name and self.age == other.age
    def __hash__(self):
        return hash(self.name+str(self.get_age()))

此时再次运行main.py,运行结果就正确了,

完整代码:

目录结构

main.py

from Model.Person import Person
def main():
    person_set = set()
    person_list = [
        Person("张三", 24),
        Person("李四", 15),
        Person("王五", 28),
        Person("张麻子", 30),
        Person("二营长", 19),
        Person("张三", 30)
    ]
    test_person_list = [
        Person("李四", 15),
        Person("王五", 28),
        Person("张麻子", 30),
    ]
    test_person_set = set()
    for person in test_person_list:
        test_person_set.add(person)
    for p in person_list:
        person_set.add(p)
    result_set = person_set - test_person_set
    print("Result Person set")
    for p in result_set:
        print(p)
if __name__ == '__main__':
    main()

person.py

class Person:
    def __init__(self, name, age):
        self.name = name
        self.age = age
    def get_name(self):
        return self.name
    def get_age(self):
        return self.age
    def __str__(self):
        return self.get_name() + str(self.get_age())
    def __eq__(self, other):
        return self.name == other.name and self.age == other.age
    def __hash__(self):
        return hash(self.name+str(self.get_age()))
目录
相关文章
|
2月前
|
安全 网络安全 文件存储
思科设备巡检命令Python脚本大集合
【10月更文挑战第18天】
89 1
思科设备巡检命令Python脚本大集合
|
2月前
|
存储 索引 Python
Python散列类型(1)
【10月更文挑战第9天】
|
2月前
|
计算机视觉 Python
Python实用记录(一):如何将不同类型视频按关键帧提取并保存图片,实现图片裁剪功能
这篇文章介绍了如何使用Python和OpenCV库从不同格式的视频文件中按关键帧提取图片,并展示了图片裁剪的方法。
91 0
|
4天前
|
存储 数据处理 Python
Python如何显示对象的某个属性的所有值
本文介绍了如何在Python中使用`getattr`和`hasattr`函数来访问和检查对象的属性。通过这些工具,可以轻松遍历对象列表并提取特定属性的所有值,适用于数据处理和分析任务。示例包括获取对象列表中所有书籍的作者和检查动物对象的名称属性。
15 2
|
12天前
|
数据可视化 Python
以下是一些常用的图表类型及其Python代码示例,使用Matplotlib和Seaborn库。
通过这些思维导图和分析说明表,您可以更直观地理解和选择适合的数据可视化图表类型,帮助更有效地展示和分析数据。
54 8
|
18天前
|
缓存 监控 算法
Python内存管理:掌握对象的生命周期与垃圾回收机制####
本文深入探讨了Python中的内存管理机制,特别是对象的生命周期和垃圾回收过程。通过理解引用计数、标记-清除及分代收集等核心概念,帮助开发者优化程序性能,避免内存泄漏。 ####
30 3
|
1月前
|
Python
在 Python 中实现各种类型的循环判断
在 Python 中实现各种类型的循环判断
33 2
|
2月前
|
存储 数据安全/隐私保护 索引
|
2月前
|
Python
【10月更文挑战第6天】「Mac上学Python 11」基础篇5 - 字符串类型详解
本篇将详细介绍Python中的字符串类型及其常见操作,包括字符串的定义、转义字符的使用、字符串的连接与格式化、字符串的重复和切片、不可变性、编码与解码以及常用内置方法等。通过本篇学习,用户将掌握字符串的操作技巧,并能灵活处理文本数据。
61 1
【10月更文挑战第6天】「Mac上学Python 11」基础篇5 - 字符串类型详解
|
2月前
|
Python
【10月更文挑战第6天】「Mac上学Python 10」基础篇4 - 布尔类型详解
本篇将详细介绍Python中的布尔类型及其应用,包括布尔值、逻辑运算、关系运算符以及零值的概念。布尔类型是Python中的一种基本数据类型,广泛应用于条件判断和逻辑运算中,通过本篇的学习,用户将掌握如何使用布尔类型进行逻辑操作和条件判断。
67 1
【10月更文挑战第6天】「Mac上学Python 10」基础篇4 - 布尔类型详解
下一篇
DataWorks