python 中的 collections 模块:常用数据结构和工具详解

简介: python 中的 collections 模块:常用数据结构和工具详解

Python 的 collections 模块提供了许多有用的数据结构,超越了标准的内置数据类型。这些数据结构解决了各种常见的编程问题,包括但不限于高效的容器类型、特定目的的容器、默认值字典等。让我们深入了解其中的几个重要数据结构和工具。


1. defaultdict:带有默认值的字典


defaultdict 是 dict 的一个子类,它在创建时指定一个默认工厂函数来为字典提供默认值。

示例 1:统计字符出现次数

from collections import defaultdict

text = "apple"
char_count = defaultdict(int)

for char in text:
    char_count[char] += 1
    
print(char_count)
# 输出:defaultdict(<class 'int'>, {'a': 1, 'p': 2, 'l': 1, 'e': 1})


2. Counter:计数器


Counter 是用于计数可哈希对象的子类字典。它可用于快速计数,检查元素出现的次数等。


示例 2:统计列表中元素出现次数

from collections import Counter

numbers = [1, 2, 3, 4, 1, 2, 1, 3, 2]
number_count = Counter(numbers)

print(number_count)
# 输出:Counter({1: 3, 2: 3, 3: 2, 4: 1})


3. deque:双向队列


deque 是一个双向队列,可以在两端高效地进行添加和删除操作。


示例 3:实现队列和栈

from collections import deque

# 队列
queue = deque()
queue.append(1)
queue.append(2)
queue.popleft()  # 输出:1

# 栈
stack = deque()
stack.append(1)
stack.append(2)
stack.pop()  # 输出:2


4. namedtuple:命名元组


namedtuple 创建带有命名字段的元组,可以方便地为元组的字段命名。


示例 4:定义命名元组类型

from collections import namedtuple

Point = namedtuple('Point', ['x', 'y'])
p = Point(1, 2)

print(p.x, p.y)  # 输出:1 2


5. ChainMap:链式映射


ChainMap 可以将多个字典或映射连接成一个单独的映射,无需创建新的字典。


示例 5:合并字典并查找值

from collections import ChainMap

dict1 = {'a': 1, 'b': 2}
dict2 = {'c': 3, 'd': 4}

chain = ChainMap(dict1, dict2)
print(chain['a'])  # 输出:1
print(chain['c'])  # 输出:3


这些示例展示了 collections 模块中几个重要的数据结构和工具的用法。它们为 Python 程序员提供了更多灵活和高效地处理数据的方式。


目录
相关文章
|
数据采集 Python
Python爬虫:实现爬取、下载网站数据的几种方法
Python爬虫:实现爬取、下载网站数据的几种方法
1251 1
|
IDE 程序员 编译器
适用于 Python 的 10 大最佳 IDE,你 Pick 哪一款?
适用于 Python 的 10 大最佳 IDE,你 Pick 哪一款?
1253 0
|
消息中间件 Java 大数据
RocketMQ
【8月更文挑战第29天】RocketMQ
313 15
|
10月前
|
机器学习/深度学习 监控 数据可视化
提升数据科学工作流效率的10个Jupyter Notebook高级特性
Jupyter Notebooks 是数据科学家和Python开发人员的核心工具,提供代码执行、文本编辑和数据可视化的无缝整合。本文介绍其高级功能,如Magic命令优化代码执行、IpyWidgets增强交互性、自动重载模块更新、内联文档系统、可折叠标题、nbconvert多格式转换、变量监控、JupyterLab集成开发环境、终端集成和调试系统等,助您提升工作效率并充分发挥Jupyter的潜力。
415 22
|
机器学习/深度学习 Python
在Python中监听变量值的变化
在Python中监听变量值的变化
1227 2
|
11月前
|
存储 数据挖掘 数据库
虚拟化数据恢复—VMFS简介&误删除虚拟机的数据恢复案例
物理区:物理上连续的磁盘空间,即通常意义上的分区。 本地区:VMFS管理的物理区分为保留区和本地区,前面一部分是保留区,后面部分是本地区。本地区又分为元文件区和数据区。 元文件:与NTFS的元文件类似,属于FS的管理用数据。VMFS有6个元文件:.VH.SF/.FBB.SF/.FDC.SF/.SBC.SF/.PBC.SF/.PB2.SF。 元文件区:6个元文件占用的所有空间,在本地区的前面部分。 数据区:用于存放文件数据。 datastore:在ESX服务器上看到的VMFS存储空间。 LV:logical volume,所指的范围其实和本地区一样,即虚拟化卷。 LVM逻辑卷组:用来管理跨dis
|
网络协议 Shell 网络安全
docker容器网络问题
【10月更文挑战第4天】
1438 2
|
负载均衡 算法 应用服务中间件
【nginx】配置Nginx实现负载均衡
【nginx】配置Nginx实现负载均衡
|
Java 测试技术 Spring
|
存储 安全 Devops
爆测一周!22年必看最细致代码托管工具测评
网上代码托管选型的文章不少,不过大多内容有点久远,很多最新的平台没有包括进来,个人花了大概一个星期的时间,把目前市面上比较火的代码托管平台(开源托管平台:Github、Gitee;企业级托管平台:Gitlab、阿里云效Codeup、 腾讯Coding)做了一些比较,比较的维度包括速度、成本、产研工具链完整性、安全、统计报表等,希望可以帮助正在进行代码托管选型的技术同行做决策选型。
1982 0
爆测一周!22年必看最细致代码托管工具测评