python 集合的所有基础知识

简介: python 集合的所有基础知识

Python 集合(Set)是一种无序、可变的容器,用于存储唯一的元素(无重复值)。以下是关于集合的所有基础知识:

1. 集合的定义

集合使用大括号 {} 定义,元素之间用逗号分隔,也可以通过 set() 函数创建:

# 普通集合
numbers = {
   1, 2, 3, 4, 5}
fruits = {
   "apple", "banana", "cherry"}

# 空集合(必须用 set(),不能用 {},后者会被视为空字典)
empty_set = set()

# 从其他可迭代对象创建集合
list_to_set = set([1, 2, 3, 3, 4])  # {1, 2, 3, 4}(自动去重)
str_to_set = set("hello")           # {'h', 'e', 'l', 'o'}(字符去重)

集合的特性

  • 元素唯一:自动去除重复值
  • 无序性:元素没有固定顺序,不能通过索引访问
  • 元素必须可哈希:如字符串、数字、元组等,列表等可变类型不能作为元素

2. 集合的基本操作

  • 添加元素

    fruits = {
         "apple", "banana"}
    fruits.add("cherry")  # 添加单个元素
    print(fruits)  # {'apple', 'banana', 'cherry'}
    
    # 添加多个元素(可迭代对象)
    fruits.update(["orange", "grape"])
    print(fruits)  # {'apple', 'banana', 'cherry', 'orange', 'grape'}
    
  • 删除元素

    fruits = {
         "apple", "banana", "cherry"}
    
    # remove():删除指定元素,不存在则报错
    fruits.remove("banana")
    
    # discard():删除指定元素,不存在也不报错
    fruits.discard("orange")
    
    # pop():随机删除并返回一个元素(集合无序,无法预测删除哪个)
    removed = fruits.pop()
    
    # clear():清空集合
    fruits.clear()
    
  • 集合长度

    print(len({
         1, 2, 3, 4}))  # 4
    
  • 检查元素是否存在

    fruits = {
         "apple", "banana"}
    print("apple" in fruits)     # True
    print("orange" not in fruits) # True
    

3. 集合的运算

集合支持多种数学集合运算:

  • 并集:两个集合中所有元素的组合(去重)

    a = {
         1, 2, 3}
    b = {
         3, 4, 5}
    print(a | b)          # {1, 2, 3, 4, 5}
    print(a.union(b))     # 同上
    
  • 交集:两个集合中共同存在的元素

    print(a & b)          # {3}
    print(a.intersection(b))  # 同上
    
  • 差集:属于第一个集合但不属于第二个集合的元素

    print(a - b)          # {1, 2}
    print(a.difference(b))  # 同上
    
  • 对称差集:属于两个集合中的任意一个但不同时属于两个集合的元素

    print(a ^ b)          # {1, 2, 4, 5}
    print(a.symmetric_difference(b))  # 同上
    

4. 集合的关系判断

a = {
   1, 2, 3, 4}
b = {
   2, 3}
c = {
   5, 6}

# 子集:b 是 a 的子集吗?
print(b.issubset(a))  # True
print(b <= a)         # True

# 超集:a 是 b 的超集吗?
print(a.issuperset(b))  # True
print(a >= b)           # True

# 不相交:a 和 c 没有共同元素吗?
print(a.isdisjoint(c))  # True(无交集)

5. 集合推导式

一种简洁创建集合的方式:

# 基本形式:{表达式 for 变量 in 可迭代对象}
squares = {
   x**2 for x in range(10)}  # {0, 1, 4, 9, 16, 25, 36, 49, 64, 81}

# 带条件的集合推导式
even_numbers = {
   x for x in range(20) if x % 2 == 0}  # {0, 2, 4, ..., 18}

# 从字符串创建并去重
unique_chars = {
   c for c in "hello world" if c != " "}  # {'h', 'e', 'l', 'o', 'w', 'r', 'd'}

6. 冻结集合(Frozenset)

冻结集合是不可变的集合,创建后不能修改,可作为字典的键或其他集合的元素:

# 创建冻结集合
fs = frozenset([1, 2, 3, 4])

# 冻结集合不能添加/删除元素
# fs.add(5)  # 报错

# 可以进行集合运算
fs2 = frozenset([3, 4, 5])
print(fs & fs2)  # frozenset({3, 4})

# 可以作为字典的键
d = {
   fs: "frozenset as key"}

7. 集合的应用场景

  1. 去重:快速去除列表等可迭代对象中的重复元素

    lst = [1, 2, 2, 3, 3, 3]
    unique_lst = list(set(lst))  # [1, 2, 3](注意顺序可能改变)
    
  2. 成员关系测试:判断元素是否存在(集合的查找效率高于列表)

  3. 集合运算:如找出两个列表的共同元素、不同元素等

    list1 = [1, 2, 3, 4]
    list2 = [3, 4, 5, 6]
    common = list(set(list1) & set(list2))  # [3, 4]
    
  4. 数据过滤:筛选符合条件的唯一元素

集合是处理唯一性数据和集合运算的理想选择,其内部实现为哈希表,因此查找、添加和删除元素的效率都很高(平均时间复杂度为 O(1))。在需要处理大量元素且关注唯一性或集合关系时,使用集合会比列表更高效。

目录
相关文章
|
5月前
|
存储 JSON 算法
Python集合:高效处理无序唯一数据的利器
Python集合是一种高效的数据结构,具备自动去重、快速成员检测和无序性等特点,适用于数据去重、集合运算和性能优化等场景。本文通过实例详解其用法与技巧。
173 0
|
4月前
|
存储 Java 索引
(Python基础)新时代语言!一起学习Python吧!(二):字符编码由来;Python字符串、字符串格式化;list集合和tuple元组区别
字符编码 我们要清楚,计算机最开始的表达都是由二进制而来 我们要想通过二进制来表示我们熟知的字符看看以下的变化 例如: 1 的二进制编码为 0000 0001 我们通过A这个字符,让其在计算机内部存储(现如今,A 字符在地址通常表示为65) 现在拿A举例: 在计算机内部 A字符,它本身表示为 65这个数,在计算机底层会转为二进制码 也意味着A字符在底层表示为 1000001 通过这样的字符表示进行转换,逐步发展为拥有127个字符的编码存储到计算机中,这个编码表也被称为ASCII编码。 但随时代变迁,ASCII编码逐渐暴露短板,全球有上百种语言,光是ASCII编码并不能够满足需求
217 4
|
5月前
|
机器学习/深度学习 数据采集 并行计算
多步预测系列 | LSTM、CNN、Transformer、TCN、串行、并行模型集合研究(Python代码实现)
多步预测系列 | LSTM、CNN、Transformer、TCN、串行、并行模型集合研究(Python代码实现)
500 2
|
安全 网络安全 文件存储
思科设备巡检命令Python脚本大集合
【10月更文挑战第18天】
643 1
思科设备巡检命令Python脚本大集合
|
10月前
|
存储 缓存 安全
Python frozenset 集合详解:不可变集合的终极指南
frozenset是Python中一个常被忽视但极具价值的不可变集合类型。本文深入解析其本质、操作方法与应用场景,揭示其通过不可变性带来的安全性与性能优势。从底层实现到实战案例,涵盖字典键使用、缓存优化及类型注解等高级场景。同时对比性能数据,提供最佳实践指南,并展望Python 3.11+中的优化。掌握frozenset,可为代码带来更强健性与效率,适合多种特定需求场景。
389 5
|
11月前
|
存储 人工智能 索引
Python数据结构:列表、元组、字典、集合
Python 中的列表、元组、字典和集合是常用数据结构。列表(List)是有序可变集合,支持增删改查操作;元组(Tuple)与列表类似但不可变,适合存储固定数据;字典(Dictionary)以键值对形式存储,无序可变,便于快速查找和修改;集合(Set)为无序不重复集合,支持高效集合运算如并集、交集等。根据需求选择合适的数据结构,可提升代码效率与可读性。
|
存储 缓存 API
解密 Python 集合的实现原理
解密 Python 集合的实现原理
324 12
|
存储 API 索引
Python 的集合是怎么实现的?
Python 的集合是怎么实现的?
148 9
|
存储 自然语言处理 数据处理
使用Python计算多个集合的交集详解
使用Python计算多个集合的交集详解
550 1
|
存储 索引 Python
Python常用数据结构——集合
Python常用数据结构——集合
402 3

推荐镜像

更多