第30天:Python collections 模块

简介: 第30天:Python collections 模块

1.简介


collections 是 python 的内置模块,提供了很多方便且高性能的关于集合的操作,掌握这些知识有助于提高代码的性能和可读性。


2.常用功能


2.1 namedtuple 功能详解


namedtuple() 返回一个新的元组子类,且规定了元组的元素的个数,同时除了使用下标获取元素之外,还可以通过属性直接获取。



from collections import namedtupleUser = namedtuple("User",["name", "age", "weight"])user = User("admin", "20", "60")name, age, weight = userprint(user[0])print(name, age, weight)print(user.name, user.age, user.weight)
# 输出结果如下adminadmin 20 60admin 20 60

由以上代码可以看出,namedtuple() 相当于直接定义了一个新的类,但是这个类跟传统的定义 class 的方式又有着巨大的区别。该方式会比直接定义 class 的方式省很多空间,其次其返回值是一个 tuple,支持 tuple 的各种操场。

同时,namedtuple() 还自带两个非常好用的方法。


# 将序列直接转换为新的 tuple 对象user = ["root", 32, 65]user = User._make(user) print(user) # 输出 User(name='root', age=32, weight=65)
# 返回一个 dictuser = User("admin", 20, 60)print(user._asdict()) # 输出 OrderedDict([('name', 'admin'), ('age', 20), ('weight', 60)])


2.2 ChainMap 功能讲解


ChainMap() 可以将多个字典集合到一个字典中去,对外提供一个统一的视图。注意:该操作并是不将所有字典做了一次拷贝,实际上是在多个字典的上层又进行了一次封装而已。


from collections import ChainMap
user1 = {"name":"admin", "age":"20"}user2 = {"name":"root", "weight": 65}users = ChainMap(user1, user2)print(users.maps)
users.maps[0]["name"] = "tiger"print(users.maps)
for key, value in users.items():    print(key, value)
# 输出如下[{'name': 'admin', 'age': '20'}, {'name': 'root', 'weight': 65}][{'name': 'tiger', 'age': '20'}, {'name': 'root', 'weight': 65}]name tigerweight 65age 20


由此可见,如果 ChainMap() 中的多个字典有重复 key,查看的时候可以看到所有的 key,但遍历的时候却只会遍历 key 第一次出现的位置,其余的忽略。同时,我们可以通过返回的新的视图来更新原来的的字典数据。进一步验证了该操作不是做的拷贝,而是直接指向原字典。


2.3 deque 功能详解


dqueue 是 ”double-ended queue” 的简称,是一种类似列表(list)的容器,实现了在两端快速添加(append)和弹出(pop)操作。大大加快了遍历速度


from collections import dequeq = deque([1, 2, 3])q.append('4')q.appendleft('0')print(q)print(q.popleft())
# 输出如下deque(['0', 1, 2, 3, '4'])0


2.4 Counter 功能详解


Counter 可以简单理解为一个计数器,可以统计每个元素出现的次数,同样 Counter() 是需要接受一个可迭代的对象的。


from collections import Counter
animals = ["cat", "dog", "cat", "bird", "horse", "tiger", "horse", "cat"]animals_counter = Counter(animals)print(animals_counter)print(animals_counter.most_common(2))
Counter({'cat': 3, 'horse': 2, 'dog': 1, 'bird': 1, 'tiger': 1})[('cat', 3), ('horse', 2)]
# 输出如下Counter({'cat': 3, 'horse': 2, 'dog': 1, 'bird': 1, 'tiger': 1})[('cat', 3), ('horse', 2)]


其实一个 Counter 就是一个字典,其额外提供的 most_common() 函数通常用于求 Top k 问题。


2.5 OrderedDict 功能详解


OrderedDict 是字典的子类,保证了元素的插入顺序。在 3.7 版本下,字典同样也保证了元素的插入顺序。那相比内置字典 OrderedDict 有哪些升级呢。


  • 算法上, OrderedDict 可以比 dict 更好地处理频繁的重新排序操作。在跟踪最近的访问这种场景(例如在 LRU cache)下非常适用。
  • OrderedDict 类有一个 move_to_end() 方法,可以有效地将元素移动到任一端。



from collections import OrderedDict
user = OrderedDict()user["name"] = "admin"user["age"] = 23user["weight"] = 65print(user)user.move_to_end("name") # 将元素移动至末尾print(user)user.move_to_end("name", last = False) # 将元素移动至开头print(user)
# 输出如下OrderedDict([('name', 'admin'), ('age', 23), ('weight', 65)])OrderedDict([('age', 23), ('weight', 65), ('name', 'admin')])OrderedDict([('name', 'admin'), ('age', 23), ('weight', 65)])


2.6 defaultdict 功能详解


defaultdict 是内置 dict 类的子类。它实现了当 key 不存在是返回默认值的功能,除此之外,与内置 dict 功能完全一样。


from collections import defaultdict
default_dict = defaultdict(int)default_dict["x"] = 10print(default_dict["x"])print(default_dict["y"])
# 输出如下100

注意,defaultdict 的参数必须是可操作的。比如 python 内置类型,或者无参的可调用的函数。


def getUserInfo():    return {        "name" : "",        "age" : 0    }
default_dict = defaultdict(getUserInfo)admin = default_dict["admin"]print(admin)
admin["age"] = 34print(admin)
# 输出如下{'name': '', 'age': 0}{'name': '', 'age': 34}


上述示例我们给 defaultdict 传了一个自定义函数,当字典中不存在所取 key 时返回默认的用户信息。


collections 总结


本文总结了 collections 提供的便利的操作,掌握这些知识将大大提高你的编程效率。

参考资料


[1] https://docs.python.org/zh-cn/3/library/collections.html

示例代码:Python-100-days-day030

系列文章    第29天:Python queue 模块详解

   第28天:Python sys 模块详解

   第27天:Python shutil 模块

   第26天:Python os 模块详解

   第25天:Python datetime 和 time

   第24天:Python Standard Library 02

   第23天:Python Standard Library 01

   第22天:Python NameSpace & Scope

   第21天:Web开发 Jinja2模板引擎

   第0-20天:从 0 学习 Python 0-20 天合集

目录
相关文章
|
26天前
|
SQL 关系型数据库 数据库
Python SQLAlchemy模块:从入门到实战的数据库操作指南
免费提供Python+PyCharm编程环境,结合SQLAlchemy ORM框架详解数据库开发。涵盖连接配置、模型定义、CRUD操作、事务控制及Alembic迁移工具,以电商订单系统为例,深入讲解高并发场景下的性能优化与最佳实践,助你高效构建数据驱动应用。
231 7
|
1月前
|
监控 安全 程序员
Python日志模块配置:从print到logging的优雅升级指南
从 `print` 到 `logging` 是 Python 开发的必经之路。`print` 调试简单却难维护,日志混乱、无法分级、缺乏上下文;而 `logging` 支持级别控制、多输出、结构化记录,助力项目可维护性升级。本文详解痛点、优势、迁移方案与最佳实践,助你构建专业日志系统,让程序“有记忆”。
201 0
|
30天前
|
JSON 算法 API
Python中的json模块:从基础到进阶的实用指南
本文深入解析Python内置json模块的使用,涵盖序列化与反序列化核心函数、参数配置、中文处理、自定义对象转换及异常处理,并介绍性能优化与第三方库扩展,助你高效实现JSON数据交互。(238字)
260 4
|
27天前
|
Java 调度 数据库
Python threading模块:多线程编程的实战指南
本文深入讲解Python多线程编程,涵盖threading模块的核心用法:线程创建、生命周期、同步机制(锁、信号量、条件变量)、线程通信(队列)、守护线程与线程池应用。结合实战案例,如多线程下载器,帮助开发者提升程序并发性能,适用于I/O密集型任务处理。
201 0
|
28天前
|
XML JSON 数据处理
超越JSON:Python结构化数据处理模块全解析
本文深入解析Python中12个核心数据处理模块,涵盖csv、pandas、pickle、shelve、struct、configparser、xml、numpy、array、sqlite3和msgpack,覆盖表格处理、序列化、配置管理、科学计算等六大场景,结合真实案例与决策树,助你高效应对各类数据挑战。(238字)
144 0
|
2月前
|
安全 大数据 程序员
Python operator模块的methodcaller:一行代码搞定对象方法调用的黑科技
`operator.methodcaller`是Python中处理对象方法调用的高效工具,替代冗长Lambda,提升代码可读性与性能。适用于数据过滤、排序、转换等场景,支持参数传递与链式调用,是函数式编程的隐藏利器。
113 4
|
2月前
|
存储 数据库 开发者
Python SQLite模块:轻量级数据库的实战指南
本文深入讲解Python内置sqlite3模块的实战应用,涵盖数据库连接、CRUD操作、事务管理、性能优化及高级特性,结合完整案例,助你快速掌握SQLite在小型项目中的高效使用,是Python开发者必备的轻量级数据库指南。
247 0
|
12月前
|
开发者 Python
如何在Python中管理模块和包的依赖关系?
在实际开发中,通常会结合多种方法来管理模块和包的依赖关系,以确保项目的顺利进行和可维护性。同时,要及时更新和解决依赖冲突等问题,以保证代码的稳定性和可靠性
357 62
|
3月前
|
存储 安全 数据处理
Python 内置模块 collections 详解
`collections` 是 Python 内置模块,提供多种高效数据类型,如 `namedtuple`、`deque`、`Counter` 等,帮助开发者优化数据处理流程,提升代码可读性与性能,适用于复杂数据结构管理与高效操作场景。
294 0
|
4月前
|
数据安全/隐私保护 Python
抖音私信脚本app,协议私信群发工具,抖音python私信模块
这个实现包含三个主要模块:抖音私信核心功能类、辅助工具类和主程序入口。核心功能包括登录