Python 中的列表推导式与生成器:特性、用途与区别

简介: Python 中的列表推导式与生成器:特性、用途与区别

Python编程中有许多强大的工具和特性,其中列表推导式和生成器是在处理数据时非常有用的两种工具。它们都能创建可迭代对象,但在使用方式和特性上有着明显的区别。本文将对列表推导式和生成器进行比较,探讨它们的异同点以及在不同情境下的适用性。


1. 列表推导式(List Comprehensions)

列表推导式是Python中用于快速创建列表的一种简洁方式。它允许您通过在单行中描述列表的构建方式,从现有的可迭代对象(如列表、字典、集合等)中生成新的列表。其语法形式为:

new_list = [expression for item in iterable if condition]


其中:

expression 是对 item 的操作或表达式。

item 是在可迭代对象(如列表、元组、字符串等)中的每个元素。

iterable 是可迭代对象,用于提供 item。

condition 是一个可选的条件,用于筛选生成列表时的元素。


示例 1: 创建简单的列表

numbers = [i for i in range(10)]
print(numbers)
# Output: [0, 1, 2, 3, 4, 5, 6, 7, 8, 9]


示例 2: 应用表达式操作

squared_numbers = [i * i for i in range(10)]
print(squared_numbers)
# Output: [0, 1, 4, 9, 16, 25, 36, 49, 64, 81]


示例 3: 带条件的列表推导式

even_numbers = [i for i in range(20) if i % 2 == 0]
print(even_numbers)
# Output: [0, 2, 4, 6, 8, 10, 12, 14, 16, 18]


示例 4: 嵌套循环的列表推导式

pairs = [(i, j) for i in range(2) for j in range(2)]
print(pairs)
# Output: [(0, 0), (0, 1), (1, 0), (1, 1)]


示例 5: 处理字符串列表

words = ["Hello", "World", "Python", "List", "Comprehension"]
capitalized_words = [word.upper() for word in words if len(word) > 5]
print(capitalized_words)
# Output: ['PYTHON', 'COMPREHENSION']


示例 6: 生成平方数列表

假设我们想生成一个包含 1 到 10 的数字的平方的列表:

squared = [x ** 2 for x in range(1, 11)]
print(squared)
输出:[1, 4, 9, 16, 25, 36, 49, 64, 81, 100]


示例 7: 筛选偶数

even_numbers = [x for x in range(1, 11) if x % 2 == 0]
print(even_numbers)
# 输出:[2, 4, 6, 8, 10]


2. 生成器(Generators)


生成器(Generator)是一种特殊的迭代器,可以按需生成值。它们以一种惰性方式生成值,而不是一次性生成所有值并存储在内存中。生成器在Python中是用于高效处理大量数据或需要逐步生成值的情况下非常有用。


2.1. 创建生成器的方式


1. 生成器表达式

类似于列表推导式,生成器表达式使用圆括号而不是方括号,创建一个生成器对象。

generator = (x * x for x in range(10))


2. 使用函数和yield语句


通过函数中的yield语句可以创建生成器。每次调用生成器的__next__()方法或使用for循环时,函数将执行到yield语句处并产生一个值。

def my_generator():
    for i in range(10):
        yield i * i
        
generator = my_generator()


示例 8: 生成斐波那契数列的生成器

def fibonacci_generator(n):
    a, b = 0, 1
    count = 0
    while count < n:
        yield a
        a, b = b, a + b
        count += 1
        
fib = fibonacci_generator(10)
print(list(fib))

输出:[0, 1, 1, 2, 3, 5, 8, 13, 21, 34]


示例 9: 无限序列的生成器

def infinite_sequence():
    num = 0
    while True:
        yield num
        num += 1
        
inf_seq = infinite_sequence()
for i in range(5):
    print(next(inf_seq))
# 输出:0, 1, 2, 3, 4


示例 10: 大数据集的处理

data = [2, 4, 6, 8, 10, 12, 14, 16, 18, 20]
# 对数据集中的每个数进行平方运算,但不立即生成新的列表,而是按需生成
squared_gen = (x ** 2 for x in data)
print(next(squared_gen))  # 输出:4
print(next(squared_gen))  # 输出:16


2.2. 生成器的特点


1.惰性计算: 生成器按需生成值,仅在需要时计算,而不是一次性生成所有值。

2.内存效率: 生成器在生成值后会立即释放内存,不像列表等数据结构需要一次性存储所有值。

3.迭代支持: 生成器是可迭代的对象,可以用于for循环等迭代场景。

4.状态保持: 生成器函数在每次调用yield语句时暂停,并保留其状态,以便下次调用时从上次暂停的位置继续执行。


2.3. 生成器的应用


1.处理大数据集: 生成器可以逐步处理大量数据,减少内存占用。

2.惰性计算: 用于处理无限序列或在需要时才计算值的情况。

3.优化迭代器: 生成器可作为自定义迭代器,用于定制迭代器的行为。

4.协程和异步编程: 生成器也可用于实现协程和异步编程模型,支持高效的并发操作。


3. 列表推导式 vs. 生成器


3.1. 列表推导式


1.立即计算: 列表推导式会立即计算并生成一个列表对象,其中包含所有的元素。这意味着它们一次性创建所有的值,并存储在内存中。

2.占用内存: 由于一次性生成所有值并存储在内存中,处理大量数据时可能占用大量内存。

3.语法简洁: 列表推导式语法简洁直观,易于使用和理解。

4.列表对象: 返回一个列表对象,支持切片、索引等操作。


3.2. 生成器:


1.惰性计算: 生成器是按需生成值的,只在需要时生成一个值并返回。它们以惰性方式计算值,不会一次性生成所有值并存储在内存中。

2.内存效率: 由于按需生成值,生成器在生成值后会立即释放内存,因此在处理大量数据或需要逐步处理值的情况下更为内存高效。

3.迭代支持: 生成器是可迭代对象,支持for循环等迭代操作。但是生成器通常只能被迭代一次。

4.状态保持: 生成器函数会在每次调用yield语句时暂停并保留其状态,以便下次调用时从上次暂停的位置继续执行。


3.3. 如何选择:


列表推导式适用于: 需要一次性生成所有值并在之后多次访问的情况,对内存使用没有特别限制的场景。

生成器适用于: 处理大数据集、需要逐步处理值或需要节省内存的情况。在惰性计算和内存效率方面有优势。

内存消耗:列表推导式会立即生成所有元素并存储在内存中,而生成器则按需生成值,节省内存空间。

惰性计算:生成器实现了惰性计算,逐个产生值,适用于处理大型数据集或无限序列。


4. 应用场景


列表推导式:适用于需要立即获得完整列表的场景。

生成器:适用于需要按需生成值、处理大量数据或无限序列的场景。


5. 总结


列表推导式和生成器是Python编程中非常有用的两种创建可迭代对象的方式。它们各自有着独特的优势,根据实际需求可以选择合适的工具。列表推导式适用于一次性生成并操作所有值的情况,而生成器则适用于按需生成值、节省内存并需要惰性计算的场景。通过本文的比较,希望读者能更好地理解并选择合适的工具来处理不同的数据处理任务。


目录
相关文章
|
22天前
|
弹性计算 人工智能 架构师
阿里云携手Altair共拓云上工业仿真新机遇
2024年9月12日,「2024 Altair 技术大会杭州站」成功召开,阿里云弹性计算产品运营与生态负责人何川,与Altair中国技术总监赵阳在会上联合发布了最新的“云上CAE一体机”。
阿里云携手Altair共拓云上工业仿真新机遇
|
18天前
|
机器学习/深度学习 算法 大数据
【BetterBench博士】2024 “华为杯”第二十一届中国研究生数学建模竞赛 选题分析
2024“华为杯”数学建模竞赛,对ABCDEF每个题进行详细的分析,涵盖风电场功率优化、WLAN网络吞吐量、磁性元件损耗建模、地理环境问题、高速公路应急车道启用和X射线脉冲星建模等多领域问题,解析了问题类型、专业和技能的需要。
2566 22
【BetterBench博士】2024 “华为杯”第二十一届中国研究生数学建模竞赛 选题分析
|
14天前
|
存储 关系型数据库 分布式数据库
GraphRAG:基于PolarDB+通义千问+LangChain的知识图谱+大模型最佳实践
本文介绍了如何使用PolarDB、通义千问和LangChain搭建GraphRAG系统,结合知识图谱和向量检索提升问答质量。通过实例展示了单独使用向量检索和图检索的局限性,并通过图+向量联合搜索增强了问答准确性。PolarDB支持AGE图引擎和pgvector插件,实现图数据和向量数据的统一存储与检索,提升了RAG系统的性能和效果。
|
16天前
|
人工智能 IDE 程序员
期盼已久!通义灵码 AI 程序员开启邀测,全流程开发仅用几分钟
在云栖大会上,阿里云云原生应用平台负责人丁宇宣布,「通义灵码」完成全面升级,并正式发布 AI 程序员。
|
18天前
|
机器学习/深度学习 算法 数据可视化
【BetterBench博士】2024年中国研究生数学建模竞赛 C题:数据驱动下磁性元件的磁芯损耗建模 问题分析、数学模型、python 代码
2024年中国研究生数学建模竞赛C题聚焦磁性元件磁芯损耗建模。题目背景介绍了电能变换技术的发展与应用,强调磁性元件在功率变换器中的重要性。磁芯损耗受多种因素影响,现有模型难以精确预测。题目要求通过数据分析建立高精度磁芯损耗模型。具体任务包括励磁波形分类、修正斯坦麦茨方程、分析影响因素、构建预测模型及优化设计条件。涉及数据预处理、特征提取、机器学习及优化算法等技术。适合电气、材料、计算机等多个专业学生参与。
1559 16
【BetterBench博士】2024年中国研究生数学建模竞赛 C题:数据驱动下磁性元件的磁芯损耗建模 问题分析、数学模型、python 代码
|
1天前
|
JSON 自然语言处理 数据管理
阿里云百炼产品月刊【2024年9月】
阿里云百炼产品月刊【2024年9月】,涵盖本月产品和功能发布、活动,应用实践等内容,帮助您快速了解阿里云百炼产品的最新动态。
阿里云百炼产品月刊【2024年9月】
|
20天前
|
编解码 JSON 自然语言处理
通义千问重磅开源Qwen2.5,性能超越Llama
击败Meta,阿里Qwen2.5再登全球开源大模型王座
882 14
|
15天前
|
人工智能 开发框架 Java
重磅发布!AI 驱动的 Java 开发框架:Spring AI Alibaba
随着生成式 AI 的快速发展,基于 AI 开发框架构建 AI 应用的诉求迅速增长,涌现出了包括 LangChain、LlamaIndex 等开发框架,但大部分框架只提供了 Python 语言的实现。但这些开发框架对于国内习惯了 Spring 开发范式的 Java 开发者而言,并非十分友好和丝滑。因此,我们基于 Spring AI 发布并快速演进 Spring AI Alibaba,通过提供一种方便的 API 抽象,帮助 Java 开发者简化 AI 应用的开发。同时,提供了完整的开源配套,包括可观测、网关、消息队列、配置中心等。
655 7
|
8天前
|
Docker 容器
|
1天前
|
存储 人工智能 弹性计算
产品技术能力飞跃,阿里云E-HPC荣获“CCF 产品创新奖”!
9月24日,在中国计算机学会举办的“2024 CCF 全国高性能计算学术年会”中,阿里云弹性高性能计算(E-HPC)荣获「 CCF HPC China 2024 产品创新奖」。这也是继 2022 年之后,阿里云E-HPC 再次荣获此奖项,代表着阿里云在云超算领域的持续创新结果,其产品能力和技术成果得到了业界的一致认可。