一、Python生成器介绍
1.什么是生成器
在Python中,使用了 yield 的函数被称为生成器(generator)。
跟普通函数不同的是,生成器是一个返回迭代器的函数(一次一个值),只能用于迭代操作,更简单点理解生成器就是一个迭代器。
2.生成器的作用
内存占用少,节约资源(后面会有具体案例说明)。
二、创建生成器
创建生成器有两种方法,一种是把列表生成式的中括号[]改成小括号(),一种是函数中包含yield关键字。
1.列表生成式与生成器
# 列表生成式list_1= [x*xforxinrange(10)] # 生成器# 把列表生成式的中括号[]改成小括号(),就成了生成器list_generator= (x*xforxinrange(10))
前面说了生成器的最大好处就是节约内存资源,下面打印一下列表list_1和生成器list_generator,对比一下他们的内存占用:
print(list_1.__sizeof__()) # 84字节print(list_generator.__sizeof__()) # 48字节
一个是84字节,一个是48字节,看起来并不明显,我们把range范围扩大到1000000,也就是包含一百万个元素,此时再来对比:
list_1= [x*xforxinrange(1000000)] list_generator= (x*xforxinrange(1000000)) print(list_1.__sizeof__()) # 4348720字节print(list_generator.__sizeof__()) # 48字节
当range范围扩大到1000000后,列表list_1占用了4348720字节,而生成器list_generator仍然只占用了48字节(因为一次只取一个值)。因此可以得出结论:使用列表会一次性将元素都加载到内存中,占用大量的内存,如果内存不够的话,很可能还会出现Out Of Memory,而我们只需要访问部分元素,造成了大量的资源浪费;而使用生成器,因为一次只加载一个元素的缘故,所以会比较节约资源。
2.函数生成器
坦白讲,如果遇到比较复杂的算法,使用列表推导式写起来会比较麻烦,也不易于阅读,此时可以用函数来实现。例如,读取一个大文本文件:
defread_large_file(file): withopen(file=file, encoding="utf8") asf: lines=f.readlines() forlineinlines: yieldlineforiinread_large_file("c:/test_file.txt"): print(i)
三、生成器的执行顺序
- 带有 yield 的函数不再是一个普通函数,而是一个生成器generator。
- yield相当于 return 返回一个值,并且记住这个返回值的位置,下次迭代时,代码从yield的下一条语句开始执行。
# 生成器执行顺序defyield_order(n): foriinrange(n): print("i: ", i) yieldi*2print("i = ", i) print("done") foriinyield_order(5): print(i) '''i: 00i = 0i: 12i = 1i: 24i = 2i: 36i = 3i: 48i = 4done'''
执行过程分析:
***第一次迭代i=0***i: 00
第一次迭代i=0,yield相当于return返回一个值0,并且记住这个返回值的位置i * 2,也就是0 * 2,乘积为0,所以在调用函数打印i的时候就是0
***第二次迭代i=1***i=0i: 12
第二次迭代i=1,yield相当于return返回一个值1,并且记住这个返回值的位置i * 2,也就是1 * 2,乘积为2,所以在调用函数打印i的时候就是2
第二次迭代会从yield的下一条语句开始执行也就是print("i = ", i),打印结果为:i = 0
***第三次迭代i=2***i=1i: 24
第三次迭代i=2,yield相当于return返回一个值2,并且记住这个返回值的位置i * 2,也就是2 * 2,乘积为4,所以在调用函数打印i的时候就是4
第三次迭代会从yield的下一条语句开始执行也就是print("i = ", i),打印结果为:i = 1
***第四次迭代i=3***i=4i: 36
第四次迭代i=3,yield相当于return返回一个值3,并且记住这个返回值的位置i * 2,也就是3 * 2,乘积为6,所以在调用函数打印i的时候就是6
第四次迭代会从yield的下一条语句开始执行也就是print("i = ", i),打印结果为:i = 2
***第五次迭代i=4***i=3i: 48i=4done
第五次迭代i=4,yield相当于return返回一个值4,并且记住这个返回值的位置i * 2,也就是4 * 2,乘积为8,所以在调用函数打印i的时候就是8
第三次迭代会从yield的下一条语句开始执行也就是print("i = ", i),打印结果为:i = 3
四、用生成器实现斐波那契数列
斐波那契数列(Fibonacci sequence),又称黄金分割数列,因数学家莱昂纳多·斐波那契(Leonardo Fibonacci)以兔子繁殖为例子而引入,故又称为“兔子数列”,指的是这样一个数列:1、1、2、3、5、8、13、21、34、……在数学上,斐波那契数列以如下被以递推的方法定义:F(0)=0,F(1)=1, F(n)=F(n - 1)+F(n - 2)(n ≥ 2,n ∈ N*)。
# 生成器实现斐波那契数列deffib(number): """number表示最大数量"""n, a, b=0, 0, 1whilen<number: yieldba, b=b, a+bn=n+1foriinfib(5): print(i)
小结
- 使用yield的函数都是生成器函数,可以使用for循环获取值,也可以使用next获取生成器函数的值
- 生成器仅仅保存了一套生成数值的算法,并且没有让这个算法现在就开始执行,而是什么时候调它,它什么时候开始计算一个新的值,并返回。