" 本文字数:640 字 ||
阅读时间:2 分钟 "
set (集合)数据结构
set(集合)是⼀个⾮常有⽤的数据结构。
它与列表(list)的⾏为类似,区别在于set 不能 包含重复的值。
例如你可能想检查列表中是否包含重复的元素,你有两个选 择,第⼀个需要
使⽤for循环,就像这样:
some_list = ['a', 'b', 'c', 'b', 'd', 'm', 'n', 'n'] duplicates = [] for value in some_list: if some_list.count(value) > 1: if value not in duplicates: duplicates.append(value) print(duplicates) ### 输出: ['b', 'n']
但还有⼀种更简单更优雅的解决⽅案,那就是使⽤集合 (sets)。
你直接这样做:
some_list = ['a', 'b', 'c', 'b', 'd', 'm', 'n', 'n'] duplicates = set([x for x in some_list if some_list.count(x) > 1]) print(duplicates) ### 输出: set(['b', 'n'])
集合还有⼀些其它⽅法,下⾯我们介绍其中⼀部分。
交集
你可以对⽐两个集合的交集(两个集合中都有的数据),如下:
valid = set(['yellow', 'red', 'blue', 'green', 'black']) input_set = set(['red', 'brown']) print(input_set.intersection(valid)) ### 输出: set(['red'])
差集
你可以⽤差集(difference)找出⽆效的数据,相当于⽤⼀个集合减去另⼀个集合的数据
例 如:
valid = set(['yellow', 'red', 'blue', 'green', 'black']) input_set = set(['red', 'brown']) print(input_set.difference(valid)) ### 输出: set(['brown'])
你也可以⽤符号来创建集合
例如:
a_set = {'red', 'blue', 'green'} print(type(a_set)) ### 输出: <type 'set'>
集合还有⼀些其它⽅法,我建议访问官⽅⽂档