python数据结构之 set

简介:

在数学概念中,被意为整合元素的定义区域

在python中,set最大的作用是用来去重

 

set常见操作:

In [158]: s ={1,1,1,1,2,22,33,3,3,3}

 

In [159]: s

Out[159]: {1,2, 3, 22, 33}

 

在定义一个集合的时候,只能使用大括号定义最少一个值,不然会被认为字典进行定义

在set中不能加入不可哈希的对象类型

 

In [161]:hash('a')

Out[161]:4952964627402403516

 

查看列表的哈希值,可以发现这个对象不可被哈希

In [162]: a =[1,2,3]

 

In [163]:hash(a)

---------------------------------------------------------------------------

TypeError                               Traceback (most recent call last)

<ipython-input-163-fe724719d9a1>in <module>()

----> 1hash(a)

 

TypeError:unhashable type: 'list'

 

set元素必须是可以哈希运算,但是需要元素可以迭代的

只要是能被迭代的元素都可以被加入到set中

In [171]:list(s)

Out[171]:['abc', b'abc']

 

In [172]: a =list(s)

 

In [173]: a

Out[173]:['abc', b'abc']

 

In [174]:set(a)

Out[174]:{'abc', b'abc'}

 

set.add增加元素

增加一个元素到set中,如果存在则什么都不做,因为存在其值

In [176]:s.add(1)

 

In [177]: s

Out[177]: {1,'abc', b'abc'}

 

In [178]:s.add(2)

 

In [179]: s

Out[179]: {1,'abc', 2, b'abc'}

set可以收集多个集合,同样的可以合并多个集合

 

使用update进行更新

 

In [180]:s.update({1,2,3},{5,7},(1,9,1))

In [181]: s

Out[181]: {1,'abc', 2, b'abc', 3, 5, 7, 9}

 

In [185]:s.update({1})

 

In [186]: s

Out[186]: {1,'abc', 2, b'abc', 3, 5, 7, 4, 9}

 

In [187]:s.update({10})

 

In [188]: s

Out[188]: {1,'abc', 2, b'abc', 3, 5, 7, 4, 9, 10}

 

set.remove删除

remove,将要删除的值转为hash,并按当前hash值定位其位置进行删除,这个hash将作为一个key进行操作

 

In [193]: s

Out[193]: {1,2, b'abc', 3, 5, 7, 4, 9, 10}

 

In [194]:s.remove(b'abc')

 

In [195]: s

Out[195]: {1,2, 3, 4, 5, 7, 9, 10}

 

查找元素的过程是非常快,因为是直接定义hash,并非是从头到尾去遍历

 

discard 从集合移除一个元素

与remove功能一样,但是discard并不会弹出异常:

remove 删除一个异常索引会报出keyerror

In [196]:s.remove('hahaha')

---------------------------------------------------------------------------

KeyError                                Traceback (most recent call last)

<ipython-input-196-185a5cf4c543>in <module>()

----> 1s.remove('hahaha')

 

KeyError:'hahaha'

 

discard 删除一个索引则不会返回任何信息

In [197]:s.discard('hahaha')

 

In [198]:

 

pop  随机挑选一个弹出并返回

pop只是随机弹出,并不能跟参数

In [202]:s.pop()

Out[202]: 2

 

In [203]:s.pop()

Out[203]: 3

 

In [204]: s

Out[204]: {4,5, 7, 9, 10}

 

clear  清除集合内所有元素,但是要考虑GC内存回收问题

 

set修改及查询

在set中没有修改的概念,只有两种操作:

删除元素 和追加元素

查询:非线性结构,无法进行索引查询

遍历:可以遍历所有可迭代的元素

 

成员运算符

成员运算符 in , not in ,效率很高

非线性结构如果找哈希值,时间复杂度相当于索引遍历列表大O(1)

看似通过值在遍历,实际上是用哈希值进行定位

 

可哈希的类型

数值型:int、float、complex

布尔类:True、False

字符串: str Bytes

Tuple、None都是不可变类型,称为哈希类型

 

对比list和set执行效率

 

查看set执行效率

导入模块timeit

import timeit

 

In [3]:%%timeit lst1 = set(range(1000))

  ...: a = -1 in lst1

  ...:

 

38.1 ns ± 0.0493 ns per loop(mean ± std. dev. of 7 runs, 10000000 loops each)

 

查看list效率

In [1]:%%timeit lst1 = list(range(1000))

  ...: a = -1 in lst1

  ...:

14.7 μs ± 99.3ns per loop (mean ± std. dev. of 7 runs, 100000 loops each)


总结:

线性结构查询的复杂度是O(n), 随着规模增大耗时间越来越高

set和字典都属于特殊结构,其中都存了hash作为key,时间复杂度可以做到O(1),查询时间与数据规模无关

 

 

 本文转自zuzhou 51CTO博客,原文链接:http://blog.51cto.com/yijiu/1968671

相关文章
|
3月前
|
存储 JavaScript Java
(Python基础)新时代语言!一起学习Python吧!(四):dict字典和set类型;切片类型、列表生成式;map和reduce迭代器;filter过滤函数、sorted排序函数;lambda函数
dict字典 Python内置了字典:dict的支持,dict全称dictionary,在其他语言中也称为map,使用键-值(key-value)存储,具有极快的查找速度。 我们可以通过声明JS对象一样的方式声明dict
296 1
|
3月前
|
Java 数据挖掘 数据处理
(Pandas)Python做数据处理必选框架之一!(一):介绍Pandas中的两个数据结构;刨析Series:如何访问数据;数据去重、取众数、总和、标准差、方差、平均值等;判断缺失值、获取索引...
Pandas 是一个开源的数据分析和数据处理库,它是基于 Python 编程语言的。 Pandas 提供了易于使用的数据结构和数据分析工具,特别适用于处理结构化数据,如表格型数据(类似于Excel表格)。 Pandas 是数据科学和分析领域中常用的工具之一,它使得用户能够轻松地从各种数据源中导入数据,并对数据进行高效的操作和分析。 Pandas 主要引入了两种新的数据结构:Series 和 DataFrame。
520 0
|
6月前
|
存储 监控 安全
企业上网监控系统中红黑树数据结构的 Python 算法实现与应用研究
企业上网监控系统需高效处理海量数据,传统数据结构存在性能瓶颈。红黑树通过自平衡机制,确保查找、插入、删除操作的时间复杂度稳定在 O(log n),适用于网络记录存储、设备信息维护及安全事件排序等场景。本文分析红黑树的理论基础、应用场景及 Python 实现,并探讨其在企业监控系统中的实践价值,提升系统性能与稳定性。
192 1
|
存储 开发者 索引
Python 中常见的数据结构
这些数据结构各有特点和适用场景,在不同的编程任务中发挥着重要作用。开发者需要根据具体需求选择合适的数据结构,以提高程序的效率和性能
516 156
|
存储 算法 搜索推荐
Python 中数据结构和算法的关系
数据结构是算法的载体,算法是对数据结构的操作和运用。它们共同构成了计算机程序的核心,对于提高程序的质量和性能具有至关重要的作用
486 153
|
存储 开发者 Python
Python 中的数据结构与其他编程语言数据结构的区别
不同编程语言都有其设计理念和应用场景,开发者需要根据具体需求和语言特点来选择合适的数据结构
527 151
|
存储 索引 Python
Python编程数据结构的深入理解
深入理解 Python 中的数据结构是提高编程能力的重要途径。通过合理选择和使用数据结构,可以提高程序的效率和质量
536 156
|
存储 缓存 监控
局域网屏幕监控系统中的Python数据结构与算法实现
局域网屏幕监控系统用于实时捕获和监控局域网内多台设备的屏幕内容。本文介绍了一种基于Python双端队列(Deque)实现的滑动窗口数据缓存机制,以处理连续的屏幕帧数据流。通过固定长度的窗口,高效增删数据,确保低延迟显示和存储。该算法适用于数据压缩、异常检测等场景,保证系统在高负载下稳定运行。 本文转载自:https://www.vipshare.com
355 66
|
10月前
|
存储 人工智能 索引
Python数据结构:列表、元组、字典、集合
Python 中的列表、元组、字典和集合是常用数据结构。列表(List)是有序可变集合,支持增删改查操作;元组(Tuple)与列表类似但不可变,适合存储固定数据;字典(Dictionary)以键值对形式存储,无序可变,便于快速查找和修改;集合(Set)为无序不重复集合,支持高效集合运算如并集、交集等。根据需求选择合适的数据结构,可提升代码效率与可读性。

推荐镜像

更多