collections模块自Python 2.4版本开始被引入,包含了dict、set、list、tuple以外的一些特殊的容器类型,分别是:
OrderedDict类:排序字典,是字典的子类。引入自2.7。
namedtuple()函数:命名元组,是一个工厂函数。引入自2.6。
Counter类:为hashable对象计数,是字典的子类。引入自2.7。
deque:双向队列。引入自2.4。
defaultdict:使用工厂函数创建字典,使不用考虑缺失的字典键。引入自2.5。
Counter类的目的是用来跟踪值出现的次数。它是一个无序的容器类型,以字典的键值对形式存储,其中元素作为key,其计数作为value。计数值可以是任意的Interger(包括0和负数)。
from collections import Counter
c1=Counter('abcdefgacdiabc')
print(c1['a']) # 3
print(c1['p']) # 0
c2=Counter('with')
c2.update('within')
print(c2['w']) #2
print(c2['i']) #
# 减少则使用subtract()
c2.subtract('ww')
print(c2['w']) # 0
# 键的删除 当计数值为0时,并不意味着元素被删除,删除元素应当使用del
c1['a'] = 0
print(c1) # Counter({'c': 3, 'd': 2, 'b': 2, 'g': 1, 'e': 1, 'i': 1, 'f': 1, 'a': 0})
del c1['a']
print(c1) # Counter({'c': 3, 'd': 2, 'b': 2, 'e': 1, 'i': 1, 'f': 1, 'g': 1})
# elements()
c3=Counter(a=4,b=2,c=1,d=0)
print(type(c3.elements())) # <class 'itertools.chain'>
print(list(c3.elements())) # ['c', 'a', 'a', 'a', 'a', 'b', 'b']
c4=Counter(a=4,b=2,c=1,d=-2)
print(list(c4.elements())) # ['c', 'a', 'a', 'a', 'a', 'b', 'b']
#most_common([n]) 返回一个TopN列表。如果n没有被指定,则返回所有元素。当多个元素计数值相同时,排列是无确定顺序的。
print(c1.most_common()) # [('c', 3), ('b', 2), ('d', 2), ('f', 1), ('e', 1), ('i', 1), ('g', 1)]
print(c1.most_common(3)) # [('c', 3), ('d', 2), ('b', 2)]
Counter 常用操作
sum(c.values()) # 所有计数的总数
c.clear() # 重置Counter对象,注意不是删除
list(c) # 将c中的键转为列表
set(c) # 将c中的键转为set
dict(c) # 将c中的键值对转为字典
c.items() # 转为(elem, cnt)格式的列表
Counter(dict(list_of_pairs)) # 从(elem, cnt)格式的列表转换为Counter类对象
c.most_common()[:-n:-1] # 取出计数最少的n个元素
c += Counter() # 移除0和负值