Python中字典的近亲——集合

简介:

集合的两个功能
1.集合可以实现去重的功能;
2.集合可以实现关系测试:交集,差集,并集,是否子集,是否没有交集

以一个应用场景来引出集合:
现在IPV4下用一个32位无符号整数来表示,一般用点分方式来显示,点将IP地址分成4个部
分,每个部分为8位,表示成一个无符号整数(因此不需要用正号出现),如10.137.17.1,
是我们非常熟悉的IP地址,一个IP地址串中没有空格出现(因为要表示成一个32数字)。
现在需要你用程序来判断IP是否合法。
(1)输入描述:输入一个ip地址
(2)输出描述:返回判断的结果YES or NO
示例1
1.输入: 10.138.15.1
2.输出: YES

#!/usr/bin/env python
#coding:utf-8

#172.25.254.1
ip = raw_input('ip:')
#["172"."25"."254"."1"]
ip = ip.split('.')
#一次判断每一部分是否合法;
for i in ip:
if 0<=int(i)<=255:
print 'YES'
break
else:
print 'NO'

场景1: li = ['a', 'b']
场景2: 社联要统计所有加入社团的学生?

li1 = ['a', 'b', 'c'] li2 = ['a', 'c']
all = []
for i in li1: for j in li2:
列表解决太麻烦;
set(li1 + li2) set(li1.extend(li2))

一.集合set的定义
1.集合是不重复的数据结构;
(1)花括号里面为空,是字典类型;
In [1]: s = {}

In [2]: type(s)
Out[2]: dict
Python中字典的近亲——集合
(2)定义集合的第一种方式;
In [3]: s = {1, 2, 3, 1, 2}

In [4]: type(s)
Out[4]: set

In [5]: print s
set([1, 2, 3])
Python中字典的近亲——集合
2.工厂方法定义集合时,括号里面是可迭代的对象, eg: 数值类型不可以;
(1)定义集合的第二种方式:定义一个空集合
In [6]: s = set()

In [7]: type(s)
Out[7]: set
Python中字典的近亲——集合
(2)定义集合

*字符串
In [8]: s = set('hello')

In [9]: print s
set(['h', 'e', 'l', 'o'])
Python中字典的近亲——集合
*字典
In [11]: s = set({'a':1, 'b':2, 'c':3})

In [12]: print s
set(['a', 'c', 'b'])
*元组
In [13]: s = set((1, 2, 3, 4))

In [14]: print s
set([1, 2, 3, 4])
*列表

In [15]: s = set([1, 2, 3])

In [16]: print s
set([1, 2, 3])
Python中字典的近亲——集合
二.应用:实现列表去重

1,转换为集合数据类型:set(列表)
2.字典的fromkeys方法实现;
(1)实现列表去重
In [22]: li = [1, 2, 3, 4, 2, 3]

In [23]: s = set(li)

In [24]: li = list(s)

In [25]: print s
set([1, 2, 3, 4])
Python中字典的近亲——集合
In [26]: print li
[1, 2, 3, 4]
(2)fromkeys方法实现列表去重
In [28]: li = [1, 2, 3, 4, 2, 3]

In [29]: d = {}.fromkeys(li)

In [30]: print d.keys()
[1, 2, 3, 4]
Python中字典的近亲——集合
三.集合的特征

1.集合是无序的, 不重复的数据类型;
2.因此不支持索引,也不支持切片;也不支持重复;也不支持连接;
3.支持成员操作符;
4.支持for循环;

(1)成员操作符:
In [31]: s = {1, 2, 3, 4, 1, 2}

In [32]: 1 in s
Out[32]: True

In [33]: 1 not in s
Out[33]: False
Python中字典的近亲——集合
(2)集合支持for循环,是可迭代的:
In [34]: for i in s:
....: print i
....: 
1
2
3
4
Python中字典的近亲——集合

四.集合的增三改查

1.增

In [35]: s = {1, 2, 3, 4, 1, 2}

In [36]: s.add(8)

In [37]: s.add(1)

In [38]: print s
set([8, 1, 2, 3, 4])
Python中字典的近亲——集合
In [39]: s1 = {'a', 'b', 'c'}

In [40]: s.update(s1)

In [41]: print s
set(['a', 1, 2, 3, 4, 8, 'c', 'b'])
Python中字典的近亲——集合
2.改

3.查
关系测试操作

In [45]: s1 = {1, 2, 3, 4}

In [46]: s2 = {1, 2, 3, 5}
#交集
In [47]: s1 & s2
Out[47]: {1, 2, 3}
#并集
In [48]: s1 | s2
Out[48]: {1, 2, 3, 4, 5}
#差集
In [49]: s1 - s2
Out[49]: {4}

In [50]: s2 - s1
Out[50]: {5}

#对等差分
In [51]: s1 ^ s2
Out[51]: {4, 5}
Python中字典的近亲——集合
#交集
In [52]: s1.intersection(s2)
Out[52]: {1, 2, 3}
#并集
In [53]: s1.union(s2)
Out[53]: {1, 2, 3, 4, 5}
Python中字典的近亲——集合
#差集
In [54]: s1.difference(s2)
Out[54]: {4}

In [55]: s2.difference(s1)
Out[55]: {5}
Python中字典的近亲——集合
#对等差分
In [56]: s1.symmetric_difference(s2)
Out[56]: {4, 5}
Python中字典的近亲——集合
In [67]: s1 = {1, 2, 3, 4}

In [68]: s2 = {1, 2, 3}
#s2是否s1子集
In [69]: s2.issubset(s1)
Out[69]: True
#s1是否是s2的父集
In [71]: s1.issuperset(s2)
Out[71]: True

#是否没有交集
In [72]: s1.isdisjoint(s2)
Out[72]: False

4.删

In [73]: s = {1, 'a', 'hello', 45,}
(1)s.pop() #随机删除一个,返回一个对象
In [74]: s.pop()
Out[74]: 'a'
Python中字典的近亲——集合
(2)s.remove #删除指定元素,是set成员则删除,不是成员报错
In [75]: s.remove(1)

In [76]: print s
set([45, 'hello'])

In [77]: s.remove(‘b’)
File "<ipython-input-77-fe0f6997b18b>", line 1
s.remove(‘b’)
^
SyntaxError: invalid syntax
Python中字典的近亲——集合
In [78]: print s
set([45, 'hello'])
(3)s.discard() #删除指定元素,是成员删除,不是成员什么都不做
In [79]: s.discard(45)

In [80]: s.discard('b')

In [81]: print s
set(['hello'])
Python中字典的近亲——集合
(4)s.clear() #清空集合元素
In [82]: s.clear()

In [83]: s
Out[83]: set()
Python中字典的近亲——集合

应用:
(华为机试题)题目描述
明明想在学校中请一些同学一起做一项问卷调查,为了实验的客观性, 他先用计算机生成了N个1到1000
之间的随机整数(N≤1000), N是用户输入的,对于 其中重复的数字,只保留一个,把其余相同的数去
掉,不同的数对应 着不同的学生的学号。然后再把这些数从小到大排序,按照排好的顺 序去找同学做调
查。请你协助明明完成“去重”与“排序”的工作;
提示:
生成随机数,
import random
random.randint(1,1000)
列表的去重

#!/usr/bin/env python
#coding:utf-8

import random
s = set()
N = input('输入一个数:')
for i in range (N) :
s.add(random.randint(1,1000))
#sorted是内置方法用来排序;
print sorted(s)
#li = list(s)
#li.sort()
#print li

总结
可变数据类型: 列表, 字典, 集合
不可变数据类型: 数值类型, 字符串, 元组
可变数据类型实现某个功能, 直接改变可变的数据类型;
不可变数据类型实现某个功能,需要将结果赋值给另外一个变量;
是否实现for循环
可迭代数据类型: str, list, tuple, dict, set
不可迭代数据类型:数值类型
是否支持索引,切片, 重复和连接特性
有序的数据类型: str, list, tuple
无序的数据类型: dict, set









本文转自Uniqueh51CTO博客,原文链接:http://blog.51cto.com/13363488/2059266 ,如需转载请自行联系原作者





相关文章
|
1月前
|
存储 JavaScript Java
(Python基础)新时代语言!一起学习Python吧!(四):dict字典和set类型;切片类型、列表生成式;map和reduce迭代器;filter过滤函数、sorted排序函数;lambda函数
dict字典 Python内置了字典:dict的支持,dict全称dictionary,在其他语言中也称为map,使用键-值(key-value)存储,具有极快的查找速度。 我们可以通过声明JS对象一样的方式声明dict
163 1
|
2月前
|
存储 JSON 算法
Python集合:高效处理无序唯一数据的利器
Python集合是一种高效的数据结构,具备自动去重、快速成员检测和无序性等特点,适用于数据去重、集合运算和性能优化等场景。本文通过实例详解其用法与技巧。
130 0
|
3月前
|
存储 索引 Python
python 集合的所有基础知识
python 集合的所有基础知识
174 0
|
1月前
|
存储 Java 索引
(Python基础)新时代语言!一起学习Python吧!(二):字符编码由来;Python字符串、字符串格式化;list集合和tuple元组区别
字符编码 我们要清楚,计算机最开始的表达都是由二进制而来 我们要想通过二进制来表示我们熟知的字符看看以下的变化 例如: 1 的二进制编码为 0000 0001 我们通过A这个字符,让其在计算机内部存储(现如今,A 字符在地址通常表示为65) 现在拿A举例: 在计算机内部 A字符,它本身表示为 65这个数,在计算机底层会转为二进制码 也意味着A字符在底层表示为 1000001 通过这样的字符表示进行转换,逐步发展为拥有127个字符的编码存储到计算机中,这个编码表也被称为ASCII编码。 但随时代变迁,ASCII编码逐渐暴露短板,全球有上百种语言,光是ASCII编码并不能够满足需求
140 4
|
2月前
|
机器学习/深度学习 数据采集 并行计算
多步预测系列 | LSTM、CNN、Transformer、TCN、串行、并行模型集合研究(Python代码实现)
多步预测系列 | LSTM、CNN、Transformer、TCN、串行、并行模型集合研究(Python代码实现)
332 2
|
2月前
|
存储 JSON 数据管理
Python字典:高效数据管理的瑞士军刀
Python字典基于哈希表实现,提供接近O(1)的高效查找,支持增删改查、遍历、合并等丰富操作,广泛应用于计数、缓存、配置管理及JSON处理。其灵活性与性能使其成为数据处理的核心工具。
453 0
|
2月前
|
存储 缓存 安全
Python字典:从入门到精通的实用指南
Python字典如瑞士军刀般强大,以键值对实现高效数据存储与查找,广泛应用于配置管理、缓存、统计等场景。本文详解字典基础、进阶技巧、实战应用与常见陷阱,助你掌握这一核心数据结构,写出更高效、优雅的Python代码。
85 0
|
安全 网络安全 文件存储
思科设备巡检命令Python脚本大集合
【10月更文挑战第18天】
518 1
思科设备巡检命令Python脚本大集合
|
7月前
|
存储 缓存 安全
Python frozenset 集合详解:不可变集合的终极指南
frozenset是Python中一个常被忽视但极具价值的不可变集合类型。本文深入解析其本质、操作方法与应用场景,揭示其通过不可变性带来的安全性与性能优势。从底层实现到实战案例,涵盖字典键使用、缓存优化及类型注解等高级场景。同时对比性能数据,提供最佳实践指南,并展望Python 3.11+中的优化。掌握frozenset,可为代码带来更强健性与效率,适合多种特定需求场景。
296 5
|
8月前
|
存储 人工智能 索引
Python数据结构:列表、元组、字典、集合
Python 中的列表、元组、字典和集合是常用数据结构。列表(List)是有序可变集合,支持增删改查操作;元组(Tuple)与列表类似但不可变,适合存储固定数据;字典(Dictionary)以键值对形式存储,无序可变,便于快速查找和修改;集合(Set)为无序不重复集合,支持高效集合运算如并集、交集等。根据需求选择合适的数据结构,可提升代码效率与可读性。

推荐镜像

更多