生成器generator
1.引出生成器
通过列表⽣成式
,我们可以直接创建⼀个列表
。但是,受到内存限制,列表容量肯定是有限的。⽽且,创建⼀个包含非常多个元素的列表,不仅占⽤很⼤的存储空间,如果我们仅仅需要访问前⾯⼏个元素,那后⾯绝⼤多数元素占⽤的空间都⽩⽩浪费了。
# -*- coding: utf-8 -*-
# @File : 引出生成器.py
# @author: Flyme awei
# @email : Flymeawei@163.com
# @Time : 2022/8/20 21:00
# 列表生成式
lst = [i for i in range(10)]
print(lst)
print(type(lst))
# [0, 1, 2, 3, 4, 5, 6, 7, 8, 9]
# <class 'list'>
所以,如果列表元素可以按照某种算法推算出来,那我们是否可以在循环的过程中不断推算出后续的元素呢?接下来,引出我们的
生成器
。
2.创建生成器
- 通过列表生成式创建
# -*- coding: utf-8 -*-
# @File : 创建生成器.py
# @author: Flyme awei
# @email : Flymeawei@163.com
# @Time : 2022/8/20 20:59
g = (i for i in range(10))
print(g)
print(type(g))
# <generator object <genexpr> at 0x0000021B19A11D60>
# <class 'generator'>
这样就不必创建完整的list
,从⽽节省⼤量的空间。在Pytho
n中,这种⼀边循环⼀边计算的机制,称为⽣成器:generator
。创建
列表
和生成器
的区别仅在于最外层的[ ]
和( )
,lst
是⼀个列表,⽽g
是⼀个⽣成器。我们可以直接打印出lst
的每⼀个元素,但我们怎么打印出g
的每⼀个元素呢?如果要⼀个⼀个打印出来,可以通过next()
函数获得⽣成器的下⼀个返回值:
- 通过
next()
函数获得⽣成器的下⼀个返回值
# -*- coding: utf-8 -*-
# @File : 创建生成器.py
# @author: Flyme awei
# @email : Flymeawei@163.com
# @Time : 2022/8/20 20:59
lst = [i for i in range(10)]
g = (i for i in range(10))
print(g)
print(type(g))
print(next(g)) # 0
print(next(g)) # 1
print(next(g)) # 2
print(next(g)) # 3
print(next(g)) # 4
print(next(g)) # 5
print(next(g)) # 6
print(next(g)) # 7
print(next(g)) # 8
print(next(g)) # 9
print(next(g))
⽣成器保存的是算法,每次调⽤next(g)
,就计算出g
的下⼀个元素的值,直到计算到最后⼀个元素,没有更多的 元素时,抛出StopIteration
的异常。当然,这种不断调⽤
next()
实在是太繁琐了,虽然是点一次出现一次,但正 确的⽅法是使⽤for
循环,因为⽣成器也是可迭代对象。
- 也可以通过
for-in
循环打印出来
# -*- coding: utf-8 -*-
# @File : 创建生成器.py
# @author: Flyme awei
# @email : Flymeawei@163.com
# @Time : 2022/8/20 20:59
g = (i for i in range(10))
print(g)
print(type(g))
# print(next(g)) # 0
# print(next(g)) # 1
# print(next(g)) # 2
# print(next(g)) # 3
# print(next(g)) # 4
# print(next(g)) # 5
# print(next(g)) # 6
# print(next(g)) # 7
# print(next(g)) # 8
# print(next(g)) # 9
# print(next(g))
for i in g:
print(i)
所以,我们创建了⼀个⽣成器后,基本上永远不会调⽤next()
,⽽是通过for
循环来迭代它,并且不需要关心StopIteration
异常。
generator
非常强大。如果推算的算法比较复杂,用类似列表生成式的for
循环无法实 现的时候,还可以用函数来实现。比如,著名的斐波拉契数列Fibonacci
,除第一个和第二个数外,任意一个 数都可由前两个数相加得到:1, 1, 2, 3, 5, 8, 13, 21, 34, ...
斐波拉契数列用列表生成式写不出来,但是,用函数把它打印出来却很容易:
代码如下
# -*- coding: utf-8 -*-
# @File : 函数写斐波那契数列.py
# @author: Flyme awei
# @email : Flymeawei@163.com
# @Time : 2022/8/20 21:14
# 定义一个斐波那契函数
def fib(times):
# 初始化
n = 0
a, b = 0, 1
while n < times:
print(b)
a, b = b, a+b
n += 1
fib(6)
仔细观察,可以看出,fib
函数实际上是定义了斐波拉契数列的推算规则,可以从第一个元素开始,推算出后续任意的元素,这种逻辑其实非常类似generator
。也就是说,上面的函数离
generator
仅一步之遥。要把fib
函数变 成generator
,只需要把print(b)
改为yield(b)
就可以了。
- 通过
yield
关键字创建
# -*- coding: utf-8 -*-
# @File : yield创建生成器.py
# @author: Flyme awei
# @email : Flymeawei@163.com
# @Time : 2022/8/20 21:17
def fib(times):
# 初始化
n = 0
a, b = 0, 1
while n < times:
yield b
a, b = b, a+b
n += 1
f = fib(6)
print(f)
# <generator object fib at 0x00000197C5E56350>
# f 是一个生成器对象
print(next(f))
print(next(f))
print(next(f))
print(next(f))
print(next(f))
print(next(f))
在上⾯fib
的例⼦,我们在循环过程中不断调⽤yield
,就会不断中断。当然要给循环设置⼀个条件来退出循环,不然就会产⽣⼀个⽆限数列出来。同样的,把函数改成generator
后,我们基本上从来不会⽤next()
来获取下⼀个返 回值,⽽是直接使⽤for
循环来迭代:
# -*- coding: utf-8 -*-
# @File : yield创建生成器.py
# @author: Flyme awei
# @email : Flymeawei@163.com
# @Time : 2022/8/20 21:17
def fib(times):
# 初始化
n = 0
a, b = 0, 1
while n < times:
yield b
a, b = b, a+b
n += 1
f = fib(6)
print(f)
# <generator object fib at 0x00000197C5E56350>
# f 是一个生成器对象
for i in f:
print(i)
3.遍历生成器的方式
- 通过
next()
函数 - 通过
for- in
循环打印 objict
内置的__next__()
方法send()
方法,生成器的第一个值必须是send(None)
,后面没有限制
# -*- coding: utf-8 -*-
# @File : 遍历生成器.py
# @author: Flyme awei
# @email : Flymeawei@163.com
# @Time : 2022/8/20 21:24
# 创建一个生成器g
g = (i for i in range(10))
print(next(g)) # 0
print(next(g)) # 1
print(g.__next__()) # 2
print(g.__next__()) # 3
print(g.send(None)) # 4
print(g.send('')) # 5
print(g.send(1)) # 6
for i in g:
print(i)
# 7
# 8
# 9
4.生成器总结
⽣成器
是这样⼀个函数,它记住上⼀次返回时在函数体中的位置。对⽣成器函数的第⼆次(或第 n 次)调⽤跳转⾄该函数中间,⽽上次调⽤的所有局部变量都保持不变。⽣成器不仅
记住
了它数据状态;⽣成器还记住
了它在流控制构造(在命令式编程中,这种构造不只是数据值)中的位置。
生成器的特点:
- 节约内存
- 迭代到下⼀次的调⽤时,所使⽤的参数都是第⼀次所保留下的,在整个所有函数调⽤的参数都是第⼀次所调⽤时保留的,⽽不是新创建的。