yield
关键字做了什么?
如果不太好理解yield
,可以先把yield
当作return
的同胞兄弟来看,他们都在函数中使用,并履行着返回某种结果的职责。
这两者的区别是:
有return
的函数直接返回所有结果,程序终止不再运行,并销毁局部变量;
而有yield
的函数则返回一个可迭代的 generator(生成器)对象,你可以使用for循环或者调用next()方法遍历生成器对象来提取结果。
什么是生成器呢?在 Python 中,使用了yield
的函数被称为生成器。有点套娃的感觉,但事实就是这样,调用一个yield
函数,就会返回一个生成器对象。
在调用生成器函数的过程中,每次遇到 yield
时函数会暂停并保存当前所有的运行信息(保留局部变量),返回yield
的值, 并在下一次执行next()
方法时从当前位置继续运行,直到生成器被全部遍历完。
先看一个简单的例子:
上面函数返回一个生成器,现在对该生成器进行遍历:
或者调用next()方法:
可以看到,simple_generator函数返回一个生成器,调用next()
方法后,函数开始运行,遇到第一个yield
关键字,返回生成的值(1),程序暂停;
第二次调用next()
方法,代码从上次暂停的位置开始执行,并遇到了第二个yield
关键字,再返回生成的值(2),程序暂停;
第三次调用也是如此,返回生成的值(3),生成器耗尽,程序终止;
到这里你可能就明白yield
和return
的关系和区别了,带yield
的函数是一个生成器,这个生成器有一个方法就是next,next就相当于“下一步”生成哪个数,这一次的next开始的地方是接着上一次的next停止的地方执行的。
所以调用next的时候,生成器并不会从函数的开始执行,只是接着上一步停止的地方开始,然后遇到yield
后,return出要生成的数,此步就结束。
有个经典的例子就是使用yield生成斐波那契数列:
def fab(max): n, a, b = 0, 0, 1 while n < max: yield b # 使用 yield a, b = b, a + b n = n + 1 for n in fab(5): print n
生成器有哪些作用?
如果想具体化数据的形式,通常会将数据存储在一个列表中。但这样做,列表的内容将占用有形内存。列表越大,占用的内存资源就越多。
但是,如果数据集有某种逻辑,就不必存储在一个列表中,只需编写一个生成器,它将在需要时生成这些值,基本不占用内存。