Python - 基础数据类型 set 集合

简介: Python - 基础数据类型 set 集合

集合的简介


  • 集合是一个无序、不重复的序列
  • 它的基本用法包括成员检测和消除重复元素
  • 集合对象也支持像 联合,交集,差集,对称差分等数学运算
  • 集合中所有的元素放在 {} 中间,并用逗号分开

 

集合的栗子


这里会有个重点知识

# 声明
basket = {'apple', 'orange', 'apple', 'pear', 'orange', 'banana'}
print(basket)
set_ = {1, 1, 1, 1, 2}
print(set_)
# 输出结果
{'orange', 'pear', 'banana', 'apple'}
{1, 2}


自动去重了,每个元素只保留一个,且是无序的

 

再来看一个栗子

set_ = {{1, }, {1, }}
print(set_)
set_ = {[1, ], [2, ]}
print(set_)
# 输出结果
    set_ = {{1, }, {1, }}
TypeError: unhashable type: 'set'
    set_ = {[1, ], [2, ]}
TypeError: unhashable type: 'list'


为什么报错?

重点:因为 set 集合只能包含不可变对象元素,而列表、集合本身都是可变对象,所以会报错

 

集合和列表的区别


  • 列表中的元素允许重复,集合中的元素不允许重复
  • 列表是有序的,提供了索引操作,集合是无序的,没有索引操作
set_ = {1, 1, 1, 1, 2}
set[1]
# 输出结果
    set[1]
TypeError: 'type' object is not subscriptable


提示该类型不能下标

 

特殊集合


如何创建一个空集合

set_ = {}
print(set_, type(set_))
# 输出结果
{} <class 'dict'>


不可以直接 { },这样默认是一个空字典哦

 

正确写法

set_ = set()
print(set_, type(set_))
# 输出结果
set() <class 'set'>


常见运算操作


运算符 |

合并多个集合

>>> {1, 2} | {3, 4}

{1, 2, 3, 4}

>>> {1, 2} | {3, 4} | {5, 6}

{1, 2, 3, 4, 5, 6}

 

运算符 -

从集合中删除元素

>>> {1, 2, 3, 4} - {3, 4, 5, 6}

{1, 2}

 

运算符 &

取交集,返回两个集合都包含的元素

>>> {1, 2, 3} & {3, 4, 5}

{3}

 

运算符 ^

取差集

>>> {1, 2, 3} ^ {3, 4, 5}

{1, 2, 4, 5}

 

关键字 in

检查集合中是否包含指定元素

>>> 'polo'in {'www', 'polo', 'com'}

True

>>> 'yy'in {'www', 'yyy', 'com'}

False

 

常见函数


len(set)

获取集合的长度

>>> len({1, 2, 3})

3

>>> len({1, 2, 3, 4})

4

 

max(set)

获取集合中最大的元素

>>> max({1, 2})

2

>>> max({1, 3, 2})

3

 

min(set)

获取集合中最小的元素

>>> min({1, 2})

1

>>> min({1, 3, 2})

1

 

集合常见方法


add(item)

向集合中新增一个元素 item

# add
set_ = {1, 2, 3}
set_.add(1)
set_.add(4)
set_.add("5")
print(set_)
# 输出结果
{1, 2, 3, 4, '5'}


remove(item)

从集合中删除指定元素 item

# remove
set_ = {1, 2, 3}
set_.remove(2)
print(set_)
# 输出结果
{1, 3}


clear()

移除集合中的所有元素

# remove
set_ = {1, 2, 3}
print(set_)
set_.clear()
print(set_)
# 输出结果
{1, 2, 3}
set()


pop()

移除集合首位元素,并返回该元素值

# pop
a = {1, 2, 3, 4}
print(a.pop())
print(a.pop())
print(a)
# 输出结果
1
2
{3, 4}


difference()

从源集合中找出目标集合中没有的元素集合

# difference
a = {1, 2, 3, 4}
b = {2, 3, 5}
print(a.difference(b))
# 输出结果
{1, 4}



union()

返回两个集合的并集

# union
set1 = {1, 2, 3}
set2 = {3, 4, 5}
print(set1.union(set2))
# 输出结果
{1, 2, 3, 4, 5}


intersection()

返回两个集合的交集

# intersection
set1 = {1, 2, 3}
set2 = {3, 4, 5}
print(set1.intersection(set2))
# 输出结果
{3}


issubset()

判断指定集合是否为子集

# issubset
set1 = {1, 2}
set2 = {1, 2, 3}
print(set1.issubset(set2))
# 输出结果
True


issuperset()

判断指定集合是否为超集

# issuperset
set1 = {1, 2, 3}
set2 = {1, 2}
print(set1.issuperset(set2))
# 输出结果
True


集合总结


因为集合是不可重复的,所以可以利用它来处理一些需要避免重复插入的场景,比如为了避免某一学生的信息重复录入

相关文章
|
2月前
|
安全 网络安全 文件存储
思科设备巡检命令Python脚本大集合
【10月更文挑战第18天】
89 1
思科设备巡检命令Python脚本大集合
|
2月前
|
存储 NoSQL 关系型数据库
Redis 集合(Set)
10月更文挑战第17天
42 5
|
2月前
|
算法 Java 数据处理
从HashSet到TreeSet,Java集合框架中的Set接口及其实现类以其“不重复性”要求,彻底改变了处理唯一性数据的方式。
从HashSet到TreeSet,Java集合框架中的Set接口及其实现类以其“不重复性”要求,彻底改变了处理唯一性数据的方式。HashSet基于哈希表实现,提供高效的元素操作;TreeSet则通过红黑树实现元素的自然排序,适合需要有序访问的场景。本文通过示例代码详细介绍了两者的特性和应用场景。
50 6
|
2月前
|
存储 Java 数据处理
Java Set接口凭借其独特的“不重复”特性,在集合框架中占据重要地位
【10月更文挑战第16天】Java Set接口凭借其独特的“不重复”特性,在集合框架中占据重要地位。本文通过快速去重和高效查找两个案例,展示了Set如何简化数据处理流程,提升代码效率。使用HashSet可轻松实现数据去重,而contains方法则提供了快速查找的功能,彰显了Set在处理大量数据时的优势。
36 2
|
19天前
|
Python
Python 中一些常见的数据类型
Python 中一些常见的数据类型
70 8
|
24天前
|
Python
Python中不同数据类型之间如何进行转换?
Python中不同数据类型之间如何进行转换?
25 6
|
24天前
|
存储 开发者 Python
Python 的数据类型
Python 的数据类型
32 6
|
1月前
set集合
HashSet(无序,唯一): 基于 HashMap 实现的,底层采用 HashMap 来保存元素。 LinkedHashSet: LinkedHashSet 是 HashSet 的子类,并且其内部是通过 LinkedHashMap 来实现的。 TreeSet(有序,唯一): 红黑树(自平衡的排序二叉树)。
|
1月前
|
存储 Java
判断一个元素是否在 Java 中的 Set 集合中
【10月更文挑战第30天】使用`contains()`方法可以方便快捷地判断一个元素是否在Java中的`Set`集合中,但对于自定义对象,需要注意重写`equals()`方法以确保正确的判断结果,同时根据具体的性能需求选择合适的`Set`实现类。
|
1月前
|
存储 Java 开发者
在 Java 中,如何遍历一个 Set 集合?
【10月更文挑战第30天】开发者可以根据具体的需求和代码风格选择合适的遍历方式。增强for循环简洁直观,适用于大多数简单的遍历场景;迭代器则更加灵活,可在遍历过程中进行更多复杂的操作;而Lambda表达式和`forEach`方法则提供了一种更简洁的函数式编程风格的遍历方式。
下一篇
DataWorks