Python技术文章:深入理解collections模块

简介: collections模块是Python的内建模块之一,它实现了特殊的容器数据类型,提供了Python内建的数据类型dict、list、set、和tuple的高效替代选择。## 一、namedtuple`namedtuple()` 函数是一个工厂函数,它返回一个子类,这个子类继承自 tuple 类,并且拥有名字,这个名字就是你传给 `namedtuple()` 的第一个参数。这个子类的实例就像一个普通的元组,但是还提供了方便的属性访问。`namedtuple`是一种定义小型和不可变的数据类的简单方法。

collections模块是Python的内建模块之一,它实现了特殊的容器数据类型,提供了Python内建的数据类型dict、list、set、和tuple的高效替代选择。

一、namedtuple

namedtuple() 函数是一个工厂函数,它返回一个子类,这个子类继承自 tuple 类,并且拥有名字,这个名字就是你传给 namedtuple() 的第一个参数。这个子类的实例就像一个普通的元组,但是还提供了方便的属性访问。namedtuple是一种定义小型和不可变的数据类的简单方法。

from collections import namedtuple

# 创建一个namedtuple类型User,并包含name和age两个属性。
User = namedtuple('User', ['name', 'age'])

# 创建一个User对象
user = User(name='user1', age=23)

print(user.name)  # 输出:user1
print(user.age)   # 输出:23

二、deque

deque(双向队列)是一种来自 collections 模块的容器,它提供了从左端和右端高效、快速地添加和删除元素的功能。

from collections import deque

# 创建一个deque
d = deque(['a', 'b', 'c'])

# 从右端添加元素
d.append('d')     # d现在是deque(['a', 'b', 'c', 'd'])

# 从左端添加元素
d.appendleft('e')  # d现在是deque(['e', 'a', 'b', 'c', 'd'])

# 从右端删除元素
d.pop()           # 返回 'd', d现在是deque(['e', 'a', 'b', 'c'])

# 从左端删除元素
d.popleft()        # 返回 'e', d现在是deque(['a', 'b', 'c'])

三、Counter

collections模块的Counter类是一个简单的计数器,例如,它可以用来统计字符的个数:

from collections import Counter

c = Counter('hello world')  # 从一个可迭代对象创建
print(c)  # 输出 Counter({'l': 3, 'o': 2, 'h': 1, 'e': 1, ' ': 1, 'w': 1, 'r': 1, 'd': 1})

Counter对象有一个有用的方法most_common(n),该方法返回计数最多的n个元素的列表,每个元素是一个元组,元组的第一个元素是元素本身,第二个元素是元素的计数。

四、defaultdict

defaultdict是dict的一个子类,它接受一个工厂函数作为默认值,当查找的键不存在时,可以实例化一个值作为默认值。

from collections import defaultdict

# 使用列表(list)作为default_factory,当键不存在时,返回一个空列表。
dd = defaultdict(list)

# 添加一个键值对
dd['dogs'].append('Rufus')
dd['dogs'].append('Kathrin')
dd['dogs'].append('Mr Sniffles')

print(dd['dogs'])  # 输出: ['Rufus', 'Kathrin', 'Mr Sniffles']

五、OrderedDict

OrderedDict是dict的一个子类,它记住了元素插入的顺序。在Python 3.7之前,普通的dict并不保证键值对的顺序,而OrderedDict则按照插入的顺序排列元素。从Python 3.7开始,dict也会保持插入顺序,但是OrderedDict仍然有它的特性,如重新排列字典的顺序等。

from collections import OrderedDict

d = OrderedDict()

d['first'] = 1
d['second'] = 2
d['third'] = 3
d['last'] = 4

# 输出 "first 1", "second 2", "third 3", "last 4"
for key in d:
    print(key, d[key])

六、结论

collections模块中还包含有其他有用的工具,如ChainMapUserDictUserList等等,这些都是非常实用的集合类。使用和理解这些数据结构可以让我们在编程中更加得心应手,代码更加高效和清晰。

上述这些是 collections 模块中最常用的一些数据结构,理解和熟练使用这些工具,可以极大提高我们编程的效率。希望这篇文章能帮助你深入理解Python中的collections模块,能够更好的使用Python进行编程。

相关文章
|
2月前
|
存储 数据采集 自然语言处理
Python爬取公众号文章并实现关键词分析
Python爬取公众号文章并实现关键词分析
|
2月前
|
JSON API 开发者
天猫商品详情API接口技术解析与Python实现
天猫商品详情API(tmall.item_get)通过商品ID获取商品标题、价格、库存、图片、SKU及评价等详细信息,支持HTTP请求与JSON格式返回,适用于电商数据分析与运营。本文提供Python调用示例,实现快速接入与数据解析。
|
2月前
|
机器学习/深度学习 数据安全/隐私保护 计算机视觉
过三色刷脸技术,过三色刷脸技术教程,插件过人脸python分享学习
三色刷脸技术是基于RGB三通道分离的人脸特征提取方法,通过分析人脸在不同颜色通道的特征差异
|
3月前
|
监控 大数据 API
Python 技术员实践指南:从项目落地到技术优化
本内容涵盖Python开发的实战项目、技术攻关与工程化实践,包括自动化脚本(日志分析系统)和Web后端(轻量化API服务)两大项目类型。通过使用正则表达式、Flask框架等技术,解决日志分析效率低与API服务性能优化等问题。同时深入探讨内存泄漏排查、CPU瓶颈优化,并提供团队协作规范与代码审查流程。延伸至AI、大数据及DevOps领域,如商品推荐系统、PySpark数据处理和Airflow任务编排,助力开发者全面提升从编码到架构的能力,积累高并发与大数据场景下的实战经验。
Python 技术员实践指南:从项目落地到技术优化
|
2月前
|
机器学习/深度学习 算法 API
淘宝图片搜索接口技术解析与Python实现
淘宝图片搜索接口(拍立淘)基于图像识别技术,允许用户上传商品图片查找相似或相同商品。自2014年上线以来,已服务数千万日活用户,显著提升购物体验。接口通过CNN、ANN等技术实现图像预处理、特征提取与相似度匹配,支持多种调用方式与参数设置。本文提供Python调用示例,便于开发者快速集成。
|
2月前
|
数据采集 自然语言处理 分布式计算
大数据岗位技能需求挖掘:Python爬虫与NLP技术结合
大数据岗位技能需求挖掘:Python爬虫与NLP技术结合
|
2月前
|
JavaScript Java Go
Go、Node.js、Python、PHP、Java五种语言的直播推流RTMP协议技术实施方案和思路-优雅草卓伊凡
Go、Node.js、Python、PHP、Java五种语言的直播推流RTMP协议技术实施方案和思路-优雅草卓伊凡
159 0
|
4月前
|
Python
Python技术解析:了解数字类型及数据类型转换的方法。
在Python的世界里,数字并不只是简单的数学符号,他们更多的是一种生动有趣的语言,用来表达我们的思维和创意。希望你从这个小小的讲解中学到了有趣的内容,用Python的魔法揭示数字的奥秘。
116 26
|
4月前
|
调度 Python
探索Python高级并发与网络编程技术。
可以看出,Python的高级并发和网络编程极具挑战,却也饱含乐趣。探索这些技术,你将会发现:它们好比是Python世界的海洋,有穿越风暴的波涛,也有寂静深海的奇妙。开始旅途,探索无尽可能吧!
106 15
|
3月前
|
数据采集 Web App开发 JavaScript
无头浏览器技术:Python爬虫如何精准模拟搜索点击
无头浏览器技术:Python爬虫如何精准模拟搜索点击

热门文章

最新文章

推荐镜像

更多