python内置数据结构之set

简介:

内置数据结构set

    定义:
        可变的、无序的、不重复的元素的集合.
        常用于: 去重
    set是可迭代对象
    set中的元素必须是可hash的
    set中的值不能通过索引访问
  • set定义,初始化

        set() -> new empty set object
        set(iterable) -> new set object
    
        注意:
            定义set时,可用{}来表示,但不能为空
        如下:
            >>> type({})      # '{}'表示定义的是dict
            <class 'dict'>
            >>> type({1})     
            <class 'set'>


  • set方法


    • 增 

          add(elem)
          添加一个元素至set
      
          update(*others)
          将可迭代对象添加至set



    •     remove(elem)
          删除set中指定的元素,如果找不到抛出KeyError
      
          discard(elem) 
          删除set中指定的元素,如果找不到,就什么都不做
      
          pop() --> elem
          随机弹出set中某元素,并输出至标准输出
          如果找不到抛出KeyError
      
          clear()
          清空set内所有元素
      
          问: 为什么抛出的异常是KeyError,而不是ValueError?
          说明set是通过Key来查询值是否存在,而不是通过value的对比.



    •     非线性结构,无法索引



    •     修改,还不如直接删除,再增一个新元素


  • set成员运算符比较

        比较set和list查询效率:
        lst1 = list(range(100))
        lst2 = list(range(1000000))
        -1 in lst1、-1 in lst2     # 使用此语句测试效率
        s1 = set(range(100))
        s2 = set(range(1000000))
        -1 in s1、-1 in s2         # 使用此语句测试效率
    
        测试结果:
            list相差数量级的倍数
            set相差无几


  • set和线性结构

        线性结构在查询效率方面,查询的数据的量级越大,所消耗的时间则会越多.
        set、dict等,内部使用hash作为key,在查询上时间复杂度为O(1).即查询时间,跟数据量级无关.


  • 可hash对象

        整型
        字符型
        tuple
        None
        bytes(保存的是对应的字符编码)   

        使用内置的hash()函数来判断此对象是否是可hash的.

        例:
            >>> hash([1])          # 列表不可hash
            Traceback (most recent call last):
              File "<stdin>", line 1, in <module>
            TypeError: unhashable type: 'list'                                                                                                                                                                                                                                                          本文转自 撒旦搞时间 51CTO博客,原文链接:http://blog.51cto.com/12074120/1970702,如需转载请自行联系原作者

相关文章
|
1月前
|
存储 JavaScript Java
(Python基础)新时代语言!一起学习Python吧!(四):dict字典和set类型;切片类型、列表生成式;map和reduce迭代器;filter过滤函数、sorted排序函数;lambda函数
dict字典 Python内置了字典:dict的支持,dict全称dictionary,在其他语言中也称为map,使用键-值(key-value)存储,具有极快的查找速度。 我们可以通过声明JS对象一样的方式声明dict
169 1
|
1月前
|
Java 数据挖掘 数据处理
(Pandas)Python做数据处理必选框架之一!(一):介绍Pandas中的两个数据结构;刨析Series:如何访问数据;数据去重、取众数、总和、标准差、方差、平均值等;判断缺失值、获取索引...
Pandas 是一个开源的数据分析和数据处理库,它是基于 Python 编程语言的。 Pandas 提供了易于使用的数据结构和数据分析工具,特别适用于处理结构化数据,如表格型数据(类似于Excel表格)。 Pandas 是数据科学和分析领域中常用的工具之一,它使得用户能够轻松地从各种数据源中导入数据,并对数据进行高效的操作和分析。 Pandas 主要引入了两种新的数据结构:Series 和 DataFrame。
373 0
|
4月前
|
存储 监控 安全
企业上网监控系统中红黑树数据结构的 Python 算法实现与应用研究
企业上网监控系统需高效处理海量数据,传统数据结构存在性能瓶颈。红黑树通过自平衡机制,确保查找、插入、删除操作的时间复杂度稳定在 O(log n),适用于网络记录存储、设备信息维护及安全事件排序等场景。本文分析红黑树的理论基础、应用场景及 Python 实现,并探讨其在企业监控系统中的实践价值,提升系统性能与稳定性。
156 1
|
存储 开发者 索引
Python 中常见的数据结构
这些数据结构各有特点和适用场景,在不同的编程任务中发挥着重要作用。开发者需要根据具体需求选择合适的数据结构,以提高程序的效率和性能
478 156
|
11月前
|
存储 缓存 监控
局域网屏幕监控系统中的Python数据结构与算法实现
局域网屏幕监控系统用于实时捕获和监控局域网内多台设备的屏幕内容。本文介绍了一种基于Python双端队列(Deque)实现的滑动窗口数据缓存机制,以处理连续的屏幕帧数据流。通过固定长度的窗口,高效增删数据,确保低延迟显示和存储。该算法适用于数据压缩、异常检测等场景,保证系统在高负载下稳定运行。 本文转载自:https://www.vipshare.com
311 66
|
8月前
|
存储 人工智能 索引
Python数据结构:列表、元组、字典、集合
Python 中的列表、元组、字典和集合是常用数据结构。列表(List)是有序可变集合,支持增删改查操作;元组(Tuple)与列表类似但不可变,适合存储固定数据;字典(Dictionary)以键值对形式存储,无序可变,便于快速查找和修改;集合(Set)为无序不重复集合,支持高效集合运算如并集、交集等。根据需求选择合适的数据结构,可提升代码效率与可读性。
|
存储 索引 Python
Python编程数据结构的深入理解
深入理解 Python 中的数据结构是提高编程能力的重要途径。通过合理选择和使用数据结构,可以提高程序的效率和质量
295 59
|
存储 开发者 Python
Python 中的数据结构与其他编程语言数据结构的区别
不同编程语言都有其设计理念和应用场景,开发者需要根据具体需求和语言特点来选择合适的数据结构
319 55
|
11月前
|
存储 运维 监控
探索局域网电脑监控软件:Python算法与数据结构的巧妙结合
在数字化时代,局域网电脑监控软件成为企业管理和IT运维的重要工具,确保数据安全和网络稳定。本文探讨其背后的关键技术——Python中的算法与数据结构,如字典用于高效存储设备信息,以及数据收集、异常检测和聚合算法提升监控效率。通过Python代码示例,展示了如何实现基本监控功能,帮助读者理解其工作原理并激发技术兴趣。
222 20

推荐镜像

更多