collections模块的Counter类

简介: collections模块自Python 2.4版本开始被引入,包含了dict、set、list、tuple以外的一些特殊的容器类型,分别是:OrderedDict类:排序字典,是字典的子类。

collections模块自Python 2.4版本开始被引入,包含了dict、set、list、tuple以外的一些特殊的容器类型,分别是:

OrderedDict类:排序字典,是字典的子类。引入自2.7。
namedtuple()函数:命名元组,是一个工厂函数。引入自2.6。
Counter类:为hashable对象计数,是字典的子类。引入自2.7。
deque:双向队列。引入自2.4。
defaultdict:使用工厂函数创建字典,使不用考虑缺失的字典键。引入自2.5。

Counter类的目的是用来跟踪值出现的次数。它是一个无序的容器类型,以字典的键值对形式存储,其中元素作为key,其计数作为value。计数值可以是任意的Interger(包括0和负数)。

from collections import Counter
c1=Counter('abcdefgacdiabc')
print(c1['a'])  # 3
print(c1['p'])  # 0
c2=Counter('with')
c2.update('within')
print(c2['w'])  #2
print(c2['i'])  #

# 减少则使用subtract()
c2.subtract('ww')
print(c2['w'])  # 0
# 键的删除 当计数值为0时,并不意味着元素被删除,删除元素应当使用del
c1['a'] = 0
print(c1)   # Counter({'c': 3, 'd': 2, 'b': 2, 'g': 1, 'e': 1, 'i': 1, 'f': 1, 'a': 0})
del c1['a']
print(c1)   # Counter({'c': 3, 'd': 2, 'b': 2, 'e': 1, 'i': 1, 'f': 1, 'g': 1})
# elements()
c3=Counter(a=4,b=2,c=1,d=0)
print(type(c3.elements()))  # <class 'itertools.chain'>
print(list(c3.elements()))  # ['c', 'a', 'a', 'a', 'a', 'b', 'b']
c4=Counter(a=4,b=2,c=1,d=-2)
print(list(c4.elements()))  # ['c', 'a', 'a', 'a', 'a', 'b', 'b']
#most_common([n]) 返回一个TopN列表。如果n没有被指定,则返回所有元素。当多个元素计数值相同时,排列是无确定顺序的。
print(c1.most_common()) # [('c', 3), ('b', 2), ('d', 2), ('f', 1), ('e', 1), ('i', 1), ('g', 1)]
print(c1.most_common(3))    # [('c', 3), ('d', 2), ('b', 2)]

Counter 常用操作

sum(c.values())  # 所有计数的总数
c.clear()  # 重置Counter对象,注意不是删除
list(c)  # 将c中的键转为列表
set(c)  # 将c中的键转为set
dict(c)  # 将c中的键值对转为字典
c.items()  # 转为(elem, cnt)格式的列表
Counter(dict(list_of_pairs))  # 从(elem, cnt)格式的列表转换为Counter类对象
c.most_common()[:-n:-1]  # 取出计数最少的n个元素
c += Counter()  # 移除0和负值
目录
相关文章
|
1月前
|
Python 容器
Python collections模块之Counter()详解
Python collections模块之Counter()详解
24 3
|
22天前
|
数据采集 数据挖掘 Python
Python中collections模块的Counter计数器:深入解析与应用
在Python的`collections`模块中,`Counter`是一个强大且实用的工具,它主要用于计数可哈希对象。无论是统计单词出现的频率,还是分析数据集中元素的分布情况,`Counter`都能提供快速且直观的结果。本文将深入解析`Counter`计数器的原理、用法以及它在实际应用中的价值。
|
7月前
Thread 类的基本用法
比较推荐:使用 lambda 表达式创建线程的时候不用重写 run 方法。 不需要显式重写run方法的原因是因为线程的目标方法已经在Lambda表达式中定义了。Lambda表达式是一种用于创建匿名函数的语法糖,它可以将一个方法(或一段代码块)包装为一个函数对象。当您使用Lambda表达式创建线程时,Lambda表达式的内容会被视为线程执行的任务,这个任务会自动成为run方法的实现。
39 0
|
7月前
|
定位技术
Collections.singletonMap()用法
Collections.singletonMap()用法
57 0
|
8月前
|
安全 Java 索引
collections类
collections类
28 0
|
8月前
|
前端开发 JavaScript
玩转ES6(四)Set、Map、Class类和decorator 装饰器
玩转ES6(四)Set、Map、Class类和decorator 装饰器
145 0
|
9月前
Thread类的基本用法
Thread类的基本用法
|
10月前
|
Java 索引
【Java】collections类操作用法
【Java】collections类操作用法
77 0
|
11月前
|
C++
C++ -- list类模拟实现
C++ – list类模拟实现 0. list类成员变量和节点
61 0
Collections.singletonList使用方法
Collections.singletonList使用方法