Python中的集合(Set)

简介: Python中的集合(Set)

Python中的集合(Set)是一种无序、不重复的数据结构,它的主要特性包括:

  1. 无序性:集合中的元素没有特定的顺序,你不能通过索引访问集合中的元素。

  2. 唯一性:集合中的元素是唯一的,如果尝试添加一个已经存在的元素到集合中,该操作将被忽略。

  3. 哈希表实现:Python集合在内部使用哈希表进行存储和查找,因此对集合的操作通常具有良好的时间复杂度。

创建集合的方式有以下两种:

  • 使用大括号 {} 和逗号分隔的元素列表:

    s = {
         1, 2, 3, 4}
    
  • 使用 set() 函数和一个可迭代对象(如列表、元组等):

    s = set([1, 2, 3, 4])
    

空集合的创建必须使用 set() 函数,因为 {} 用于创建空字典:

empty_set = set()

集合的一些常用方法和操作包括:

  • 添加元素:add(element)
  • 删除元素:remove(element)discard(element)
  • 清空集合:clear()
  • 集合大小(元素数量):len(s)
  • 并集:union(other_set), 可用 | 运算符表示
  • 交集:intersection(other_set), 可用 & 运算符表示
  • 差集(集合A中存在但不在集合B中的元素):difference(other_set), 可用 - 运算符表示
  • 对称差集(两个集合中存在但不在对方的元素):symmetric_difference(other_set), 可用 ^ 运算符表示
  • 判断是否为子集:issubset(other_set), 可用 <= 运算符表示
  • 判断是否为超集:issuperset(other_set), 可用 >= 运算符表示
  • 判断是否相等:== 运算符

例如:

s1 = {
   1, 2, 3}
s2 = {
   2, 3, 4}

# 添加元素
s1.add(5)

# 删除元素
s1.remove(2)

# 并集
union_set = s1.union(s2)

# 交集
intersection_set = s1.intersection(s2)

# 差集
difference_set = s1.difference(s2)

# 对称差集
sym_diff_set = s1.symmetric_difference(s2)

# 判断子集和超集
print(s1.issubset(s2))  # 输出:False
print(s1.issuperset(s2))  # 输出:False

这些基本操作和方法使得集合在处理无序、不重复数据时非常有用,例如去除列表中的重复元素、计算多个集合的交集或并集等。

目录
相关文章
|
6月前
|
存储 JavaScript Java
(Python基础)新时代语言!一起学习Python吧!(四):dict字典和set类型;切片类型、列表生成式;map和reduce迭代器;filter过滤函数、sorted排序函数;lambda函数
dict字典 Python内置了字典:dict的支持,dict全称dictionary,在其他语言中也称为map,使用键-值(key-value)存储,具有极快的查找速度。 我们可以通过声明JS对象一样的方式声明dict
417 1
|
7月前
|
存储 JSON 算法
Python集合:高效处理无序唯一数据的利器
Python集合是一种高效的数据结构,具备自动去重、快速成员检测和无序性等特点,适用于数据去重、集合运算和性能优化等场景。本文通过实例详解其用法与技巧。
216 0
|
8月前
|
存储 索引 Python
python 集合的所有基础知识
python 集合的所有基础知识
816 0
|
6月前
|
存储 Java 索引
(Python基础)新时代语言!一起学习Python吧!(二):字符编码由来;Python字符串、字符串格式化;list集合和tuple元组区别
字符编码 我们要清楚,计算机最开始的表达都是由二进制而来 我们要想通过二进制来表示我们熟知的字符看看以下的变化 例如: 1 的二进制编码为 0000 0001 我们通过A这个字符,让其在计算机内部存储(现如今,A 字符在地址通常表示为65) 现在拿A举例: 在计算机内部 A字符,它本身表示为 65这个数,在计算机底层会转为二进制码 也意味着A字符在底层表示为 1000001 通过这样的字符表示进行转换,逐步发展为拥有127个字符的编码存储到计算机中,这个编码表也被称为ASCII编码。 但随时代变迁,ASCII编码逐渐暴露短板,全球有上百种语言,光是ASCII编码并不能够满足需求
294 4
|
7月前
|
机器学习/深度学习 数据采集 并行计算
多步预测系列 | LSTM、CNN、Transformer、TCN、串行、并行模型集合研究(Python代码实现)
多步预测系列 | LSTM、CNN、Transformer、TCN、串行、并行模型集合研究(Python代码实现)
831 2
|
安全 网络安全 文件存储
思科设备巡检命令Python脚本大集合
【10月更文挑战第18天】
771 1
思科设备巡检命令Python脚本大集合
|
算法 Java 数据处理
从HashSet到TreeSet,Java集合框架中的Set接口及其实现类以其“不重复性”要求,彻底改变了处理唯一性数据的方式。
从HashSet到TreeSet,Java集合框架中的Set接口及其实现类以其“不重复性”要求,彻底改变了处理唯一性数据的方式。HashSet基于哈希表实现,提供高效的元素操作;TreeSet则通过红黑树实现元素的自然排序,适合需要有序访问的场景。本文通过示例代码详细介绍了两者的特性和应用场景。
227 6
|
存储 NoSQL 关系型数据库
Redis 集合(Set)
10月更文挑战第17天
197 5
|
存储 Java 数据处理
Java Set接口凭借其独特的“不重复”特性,在集合框架中占据重要地位
【10月更文挑战第16天】Java Set接口凭借其独特的“不重复”特性,在集合框架中占据重要地位。本文通过快速去重和高效查找两个案例,展示了Set如何简化数据处理流程,提升代码效率。使用HashSet可轻松实现数据去重,而contains方法则提供了快速查找的功能,彰显了Set在处理大量数据时的优势。
228 2
|
存储 Java 开发者
在 Java 中,如何遍历一个 Set 集合?
【10月更文挑战第30天】开发者可以根据具体的需求和代码风格选择合适的遍历方式。增强for循环简洁直观,适用于大多数简单的遍历场景;迭代器则更加灵活,可在遍历过程中进行更多复杂的操作;而Lambda表达式和`forEach`方法则提供了一种更简洁的函数式编程风格的遍历方式。
4685 113

推荐镜像

更多
下一篇
开通oss服务