第39天: Python itertools 模块

简介: 第39天: Python itertools 模块

简介

在 Python 中,迭代器是一种非常好用的数据结构,其最大的优势就是延迟生成,按需使用,从而大大提高程序的运行效率。而 itertools 作为 Python 的内置模块,就为我们提供了一套非常有用的用于操作可迭代对象的函数。

常用功能

count 功能详解


count(start=0,step=1) 函数有两个参数,其中 step 是默认参数,可选的,默认值为 1。该函数返回一个新的迭代器,从 start 开始,返回以 step 为步长的均匀间隔的值。


import itertoolsx = itertools.count(1,2)for k in x: print(k, end=", ")
# 输出结果如下 无穷无尽1, 3, 5, 7, 9, 11, 13, 15, ...


cycle 功能详解


cycle(iterable) 该函数会把接收到的序列无限重复下去。


import itertoolsx = itertools.cycle("XYZ")for k in x: print(k, end = ", ")  # 输出结果如下 无穷无尽X, Y, Z, X, Y, Z, X, Y, Z, ...


注意,该函数可能需要相当大的辅助空间(取决于 iterable 的长度)。


repeat 功能详解


repeat(object, times) 该函数创建一个迭代器,不断的重复 object,当然如果指定 times 的话,则只会重复 times 次。



import itertoolsx = itertools.repeat("XYZ")for k in x:  print(k, end = ", ")  # 输出结果如下 无穷无尽XYZ, XYZ, XYZ, XYZ, XYZ, XYZ, ...


import itertoolsx = itertools.repeat("XYZ", 3)print(list(x))
# 输出结果如下 只会输出三次['XYZ', 'XYZ', 'XYZ']


注意:无限循环迭代器只有在 for 循环中才会不断的生成元素,如果只是创建一个迭代器对象,则不会事先生成无限个元素。


chain 功能详解


chain(*iterables) 该函数创建一个新的迭代器,会将参数中的所有迭代器全包含进去。


import itertoolsx = itertools.chain("abc", "xyz")print(list(x))
# 输出结果如下['a', 'b', 'c', 'x', 'y', 'z']


groupby 功能详解


groupby(iterable, key=None) 分组函数,将 key 函数作用于序列的各个元素。根据 key 函数的返回值将拥有相同返回值的元素分到一个新的迭代器。类似于 SQL 中的 GROUP BY 操作,唯一不同的是该函数对序列的顺序有要求,因为当 key 函数的返回值改变时,迭代器就会生成一个新的分组。因此在使用该函数之前需要先使用同一个排序函数对该序列进行排序操作。


import itertoolsdef sortBy(score):  if score > 80:    return "A"  elif score >= 60:   return "B"  else:   return "C"
scores = [81, 82, 84, 76, 64, 78, 59, 44, 55, 89]for m, n in itertools.groupby(scores, key=sortBy): print(m, list(n))
# 输出结果如下A [81, 82, 84]B [76, 64, 78]C [59, 44, 55]A [89]


我们可以看到,该函数根据我们自定义的排序函数 sortBy 将列表中的元素进行了分组操作,只是我们发现最后一个怎么多了一个 A 的分组呢,这就是我们上面说所得「当 key 函数的返回值改变时,迭代器就会生成一个新的分组」。所以,我们需要事先对列表用 sortBy 函数排一下序。


scores = [81, 82, 84, 76, 64, 78, 59, 44, 55, 89]scores = sorted(scores, key=sortBy)for m, n in itertools.groupby(scores, key=sortBy):  print(m, list(n))
# 输出结果如下A [81, 82, 84]B [76, 64, 78]C [59, 44, 55]A [89]


compress 功能详解


compress(data, selectors) 该函数功能很简单,就是根据 selectors 中的值判断是否保留 data 中对应位置的值。


import itertoolsdata = [81, 82, 84, 76, 64, 78]tf = [1,1,0,1,1,0]print(list(itertools.compress(data, tf)))
# 输出结果如下[81, 82, 76, 64]


dropwhile 功能详解


dropwhile(predicate, iterable) 创建一个迭代器,从 predicate 首次为 false 时开始迭代元素。


import itertoolsx = itertools.dropwhile(lambda x: x < 5, [1,3,5,7,4,2,1])print(list(x))
# 输出结果如下[5, 7, 4, 2, 1]


由以上得知,即使 predicate 首次为 false 后面的元素不满足 predicate 也同样会被迭代。


filterfalse 功能详解


filterfalse(predicate, iterable) 创建一个迭代器,返回 iterable 中 predicate 为 false 的元素。



import itertoolsx = itertools.filterfalse(lambda x: x < 5, [1,3,5,7,4,2,1])print(list(x))
# 输出结果如下[5, 7]


islice 功能详解


islice(iterable, start, stop[, step]) 对 iterable 进行切片操作。从 start 开始到 stop 截止,同时支持以步长为 step 的跳跃。



import itertoolsprint(list(itertools.islice('123456789', 2)))print(list(itertools.islice('123456789', 2, 4)))print(list(itertools.islice('123456789', 2, None)))print(list(itertools.islice('123456789', 0, None, 2)))
# 输出结果如下['1', '2']['3', '4']['3', '4', '5', '6', '7', '8', '9']['1', '3', '5', '7', '9']


starmap 功能详解


starmap(function, iterable) 从可迭代对象中获取参数来执行该函数。


import itertoolsprint(list(itertools.starmap(pow,[(2,10), (3,3)])))
# 输出结果如下[1024, 27]


takewhile 功能详解


takewhile(predicate, iterable) 创建一个迭代器,遇到 predicate 为 false 则停止迭代元素。与 dropwhile 完全相反。


import itertoolsx = itertools.takewhile(lambda x: x < 5, [1,3,5,7,4,2,1])print(list(x))
# 输出结果如下[1, 3]


product 功能详解


product(*iterables, repeat=1) 输出可迭代对象的笛卡尔积,有点类似于嵌套循环。其中 repeat 可以设置循环次数。


import itertoolsprint(list(itertools.product("ab", "12")))print(list(itertools.product("ab", "ab")))print(list(itertools.product("ab", repeat=2)))
# 输出结果如下[('a', '1'), ('a', '2'), ('b', '1'), ('b', '2')][('a', 'a'), ('a', 'b'), ('b', 'a'), ('b', 'b')][('a', 'a'), ('a', 'b'), ('b', 'a'), ('b', 'b')]


permutations 功能详解


permutations(iterable, r=None) 返回 iterable 中长度为 r 的所有排列。默认值 r 为 iterable 的长度。即使元素的值相同,不同位置的元素也被认为是不同的。


import itertoolsprint(list(itertools.permutations("aba", r=2)))
# 输出结果如下[('a', 'b'), ('a', 'a'), ('b', 'a'), ('b', 'a'), ('a', 'a'), ('a', 'b')]


combinations 功能详解


combinations(iterable, r=None) 返回 iterable 中长度为 r 的有序排列。默认值 r 为 iterable 的长度。与 permutations 操作不同的是该函数严格按照 iterable 中元素的顺序进行排列。


import itertoolsprint(list(itertools.combinations("abc", r=2)))
# 输出结果如下[('a', 'b'), ('a', 'c'), ('b', 'c')]


combinations_with_replacement 功能详解


combinations_with_replacement(iterable, r=None) 返回 iterable 中长度为 r 的有序排列。默认值 r 为 iterable 的长度。与 combinations 操作不同的是该函数允许每个元素重复出现。


import itertoolsprint(list(itertools.combinations_with_replacement("abc", r=2)))
# 输出结果如下[('a', 'a'), ('a', 'b'), ('a', 'c'), ('b', 'b'), ('b', 'c'), ('c', 'c')]

itertools 总结

本文总结了 itertools 模块的常规操作,学习并掌握这些极为便利的操作非常有助于提高自己的编码效率。

示例代码:Python-100-days-day039

参考资料

https://docs.python.org/zh-cn/3/library/itertools.html


系列文章

  第38天:Python decimal 模块

  第37天:Python math 模块   第36天:Python calendar 模块   第35天:pathlib 模块   第34天:Python json&pickle

  第33天:Python 枚举

   第32天:Python logging 模块详解        

   第31天:Python random 模块详解    

   第30天:Python collections 模块详解

   第29天:Python queue 模块详解

   第28天:Python sys 模块详解

   第27天:Python shutil 模块

   第26天:Python os 模块详解

   第25天:Python datetime 和 time

   第24天:Python Standard Library 02

   第23天:Python Standard Library 01

   第22天:Python NameSpace & Scope

   第21天:Web开发 Jinja2模板引擎

   第0-20天:从 0 学习 Python 0-20 天合集

目录
相关文章
|
2月前
|
SQL 关系型数据库 数据库
Python SQLAlchemy模块:从入门到实战的数据库操作指南
免费提供Python+PyCharm编程环境,结合SQLAlchemy ORM框架详解数据库开发。涵盖连接配置、模型定义、CRUD操作、事务控制及Alembic迁移工具,以电商订单系统为例,深入讲解高并发场景下的性能优化与最佳实践,助你高效构建数据驱动应用。
372 7
|
2月前
|
监控 安全 程序员
Python日志模块配置:从print到logging的优雅升级指南
从 `print` 到 `logging` 是 Python 开发的必经之路。`print` 调试简单却难维护,日志混乱、无法分级、缺乏上下文;而 `logging` 支持级别控制、多输出、结构化记录,助力项目可维护性升级。本文详解痛点、优势、迁移方案与最佳实践,助你构建专业日志系统,让程序“有记忆”。
268 0
|
2月前
|
JSON 算法 API
Python中的json模块:从基础到进阶的实用指南
本文深入解析Python内置json模块的使用,涵盖序列化与反序列化核心函数、参数配置、中文处理、自定义对象转换及异常处理,并介绍性能优化与第三方库扩展,助你高效实现JSON数据交互。(238字)
394 4
|
2月前
|
Java 调度 数据库
Python threading模块:多线程编程的实战指南
本文深入讲解Python多线程编程,涵盖threading模块的核心用法:线程创建、生命周期、同步机制(锁、信号量、条件变量)、线程通信(队列)、守护线程与线程池应用。结合实战案例,如多线程下载器,帮助开发者提升程序并发性能,适用于I/O密集型任务处理。
295 0
|
2月前
|
XML JSON 数据处理
超越JSON:Python结构化数据处理模块全解析
本文深入解析Python中12个核心数据处理模块,涵盖csv、pandas、pickle、shelve、struct、configparser、xml、numpy、array、sqlite3和msgpack,覆盖表格处理、序列化、配置管理、科学计算等六大场景,结合真实案例与决策树,助你高效应对各类数据挑战。(238字)
209 0
|
3月前
|
安全 大数据 程序员
Python operator模块的methodcaller:一行代码搞定对象方法调用的黑科技
`operator.methodcaller`是Python中处理对象方法调用的高效工具,替代冗长Lambda,提升代码可读性与性能。适用于数据过滤、排序、转换等场景,支持参数传递与链式调用,是函数式编程的隐藏利器。
143 4
|
开发者 Python
如何在Python中管理模块和包的依赖关系?
在实际开发中,通常会结合多种方法来管理模块和包的依赖关系,以确保项目的顺利进行和可维护性。同时,要及时更新和解决依赖冲突等问题,以保证代码的稳定性和可靠性
559 159
|
3月前
|
存储 数据库 开发者
Python SQLite模块:轻量级数据库的实战指南
本文深入讲解Python内置sqlite3模块的实战应用,涵盖数据库连接、CRUD操作、事务管理、性能优化及高级特性,结合完整案例,助你快速掌握SQLite在小型项目中的高效使用,是Python开发者必备的轻量级数据库指南。
330 0
|
4月前
|
存储 安全 数据处理
Python 内置模块 collections 详解
`collections` 是 Python 内置模块,提供多种高效数据类型,如 `namedtuple`、`deque`、`Counter` 等,帮助开发者优化数据处理流程,提升代码可读性与性能,适用于复杂数据结构管理与高效操作场景。
363 0
|
5月前
|
数据安全/隐私保护 Python
抖音私信脚本app,协议私信群发工具,抖音python私信模块
这个实现包含三个主要模块:抖音私信核心功能类、辅助工具类和主程序入口。核心功能包括登录

推荐镜像

更多