Python 集合探索:解密高效数据操作和快速算法的奇妙世界

简介: Python 集合探索:解密高效数据操作和快速算法的奇妙世界

前言

在 Python 的众多数据结构中,集合(Sets)是一个引人注目且实用的概念。集合提供了一种存储无顺序、唯一元素的数据结构,它们不仅可以帮助我们高效处理数据,还能应用于各种算法和问题。


本博客将带您踏上一段关于 Python 集合的探索之旅。我们将深入了解集合的基本概念、使用方法和相关操作,了解集合与其他数据结构的比较优势,以及如何利用集合来解决实际问题。


准备好开始探索 Python 集合的奇妙世界了吗?让我们一起深入了解集合的魅力,开启这段令人兴奋的学习之旅吧!🚗🚗🚗

什么是 python 集合


在Python中,集合是一个独特的元素集合。换句话说,集合是无序的,元素们彼此之间不重复的容器。当需要存储多个项目,但不关心顺序或重复时,通常可以使用集合。Python集合可以包含不同类型(整数,浮点数,元组,字符串等)的不可变类型数据,也就是说集合中不能包含列表,因为列表是可变类型。


这是因为,为了保证元素的唯一性,集合(set)内部对元素的实现依赖于散列(hash)技术。散列技术要求元素必须是不可变的类型才能确保散列值不变,因此保持集合的正确运行。列表由于是可变类型,所以不能哈希化,也就不能被加入到集合中。


集合在Python中定义为在大括号{}内放置一个逗号分隔的列表。也可以通过调用内置的 “set()” 函数从一些其他集合类型比如列表,元组构建出一个集合。

set1 = {1,13.14,'zhangsan',(3,4,5)}
print(type(set1))
print(set1)

set2 = set('zhangsan')
print(type(set2))
print(set2)


这里我们可以发现,输出集合的顺序跟我们定义集合的时候的顺序是不同的,这也体现了集合的无序性。同时因为集合的无序性,集合不支持下标操作。

set1 = {1,13.14,'zhangsan',(3,4,5)}
print(set1[0])


但是当我们需要创建一个空集合的时候,我们不能 set1 = {} ,因为这种方式是我们用来创建空字典的方式。如果我们想要创建空字典,需使用 set1 = set() 函数。

set1 = {}
print(type(set1))
set2 = set()
print(type(set2))
print(set2)

集合具有去重性

set1 = {1,2,10,10,20,20}
print(set1)


集合的特性

  1. 集合具有无序性,不支持下标操作。
  2. 集合具有去重性,可以自动去除掉重复的数据。


集合常见的操作

1)增加数据

😶‍🌫️ 1.add()

add函数可以增加单个数据,也可以增加序列。

set1 = {1,13.14,'zhangsan',(3,4,5)}
set1.add(80)
print(set1)
set1.add(('wangwu','zhaoliu'))
print(set1)

🥶 2.update()

update 增加数据只能增加序列,而不能增加单个数据。

set1 = {1,13.14,'zhangsan',(3,4,5)}
set1.update(1)
print(set1)

set1 = {1,13.14,'zhangsan',(3,4,5)}
set1.update((20,60))
print(set1)

update与add函数不同的是,add函数可以增加单个数据以及序列,而update函数只允许增加序列,并且add增加序列会将整个序列当成一个数据,而update增加序列,会将序列里的数据拆分成单个数据加入集合中。


2)删除数据

👺 1.remove()

remove函数删除指定的数据,但是如果集合中不含该数据,那么就会报错。

set1 = {1,13.14,'zhangsan',(3,4,5)}
set1.remove('zhangsan')
print(set1)

set1 = {1,13.14,'zhangsan',(3,4,5)}
set1.remove('lisi')


💀 2.discard()

discard删除指定的数据,如果集合中不存在也不会报错。

set1 = {1,13.14,'zhangsan',(3,4,5)}
set1.discard('zhangsan')
print(set1)
set1.discard('lisi')

😎 3.pop()

pop随机删除集合中的数据,并且返回这个数据。

set1 = {1,13.14,'zhangsan',(3,4,5)}
tmp = set1.pop()
print(set1)
print(tmp)

再次运行。


3)查找数据

in 查找数据是否在集合中,如果在则返回True,不存在返回Fasle。

not in 查找数据是否不在结合中,如果不存在返回True,存在返回False。

set1 = {1,13.14,'zhangsan',(3,4,5)}
print('zhangsan' in set1)
print('lisi' in set1)
print('zhangsan' not in set1)
print('lisi' not in set1)


相关文章
|
1月前
|
机器学习/深度学习 算法 前端开发
别再用均值填充了!MICE算法教你正确处理缺失数据
MICE是一种基于迭代链式方程的缺失值插补方法,通过构建后验分布并生成多个完整数据集,有效量化不确定性。相比简单填补,MICE利用变量间复杂关系,提升插补准确性,适用于多变量关联、缺失率高的场景。本文结合PMM与线性回归,详解其机制并对比效果,验证其在统计推断中的优势。
870 11
别再用均值填充了!MICE算法教你正确处理缺失数据
|
1月前
|
算法 搜索推荐 JavaScript
基于python智能推荐算法的全屋定制系统
本研究聚焦基于智能推荐算法的全屋定制平台网站设计,旨在解决消费者在个性化定制中面临的选择难题。通过整合Django、Vue、Python与MySQL等技术,构建集家装设计、材料推荐、家具搭配于一体的一站式智能服务平台,提升用户体验与行业数字化水平。
|
1月前
|
存储 监控 算法
监控电脑屏幕的帧数据检索 Python 语言算法
针对监控电脑屏幕场景,本文提出基于哈希表的帧数据高效检索方案。利用时间戳作键,实现O(1)级查询与去重,结合链式地址法支持多条件检索,并通过Python实现插入、查询、删除操作。测试表明,相较传统列表,检索速度提升80%以上,存储减少15%,具备高实时性与可扩展性,适用于大规模屏幕监控系统。
117 5
|
1月前
|
数据采集 Web App开发 数据可视化
Python零基础爬取东方财富网股票行情数据指南
东方财富网数据稳定、反爬宽松,适合爬虫入门。本文详解使用Python抓取股票行情数据,涵盖请求发送、HTML解析、动态加载处理、代理IP切换及数据可视化,助你快速掌握金融数据爬取技能。
1163 1
|
1月前
|
Java 数据挖掘 数据处理
(Pandas)Python做数据处理必选框架之一!(一):介绍Pandas中的两个数据结构;刨析Series:如何访问数据;数据去重、取众数、总和、标准差、方差、平均值等;判断缺失值、获取索引...
Pandas 是一个开源的数据分析和数据处理库,它是基于 Python 编程语言的。 Pandas 提供了易于使用的数据结构和数据分析工具,特别适用于处理结构化数据,如表格型数据(类似于Excel表格)。 Pandas 是数据科学和分析领域中常用的工具之一,它使得用户能够轻松地从各种数据源中导入数据,并对数据进行高效的操作和分析。 Pandas 主要引入了两种新的数据结构:Series 和 DataFrame。
380 0
|
1月前
|
JSON 算法 API
Python采集淘宝商品评论API接口及JSON数据返回全程指南
Python采集淘宝商品评论API接口及JSON数据返回全程指南
|
1月前
|
JSON API 数据安全/隐私保护
Python采集淘宝拍立淘按图搜索API接口及JSON数据返回全流程指南
通过以上流程,可实现淘宝拍立淘按图搜索的完整调用链路,并获取结构化的JSON商品数据,支撑电商比价、智能推荐等业务场景。
|
1月前
|
存储 Java 索引
(Python基础)新时代语言!一起学习Python吧!(二):字符编码由来;Python字符串、字符串格式化;list集合和tuple元组区别
字符编码 我们要清楚,计算机最开始的表达都是由二进制而来 我们要想通过二进制来表示我们熟知的字符看看以下的变化 例如: 1 的二进制编码为 0000 0001 我们通过A这个字符,让其在计算机内部存储(现如今,A 字符在地址通常表示为65) 现在拿A举例: 在计算机内部 A字符,它本身表示为 65这个数,在计算机底层会转为二进制码 也意味着A字符在底层表示为 1000001 通过这样的字符表示进行转换,逐步发展为拥有127个字符的编码存储到计算机中,这个编码表也被称为ASCII编码。 但随时代变迁,ASCII编码逐渐暴露短板,全球有上百种语言,光是ASCII编码并不能够满足需求
148 4
|
2月前
|
数据采集 关系型数据库 MySQL
python爬取数据存入数据库
Python爬虫结合Scrapy与SQLAlchemy,实现高效数据采集并存入MySQL/PostgreSQL/SQLite。通过ORM映射、连接池优化与批量提交,支持百万级数据高速写入,具备良好的可扩展性与稳定性。
|
1月前
|
机器学习/深度学习 人工智能 算法
【基于TTNRBO优化DBN回归预测】基于瞬态三角牛顿-拉夫逊优化算法(TTNRBO)优化深度信念网络(DBN)数据回归预测研究(Matlab代码实现)
【基于TTNRBO优化DBN回归预测】基于瞬态三角牛顿-拉夫逊优化算法(TTNRBO)优化深度信念网络(DBN)数据回归预测研究(Matlab代码实现)
119 0

热门文章

最新文章

推荐镜像

更多