上周我们讲了Python的基本数据类型,这周讲了比较高级且非常重要的生成器和迭代器。
迭代器
- 什么是迭代呢?
对list,tuple,str使用for…in…循环,从其中依次取出数据,这就叫遍历,也叫迭代。所以完全可以理解为一条流水线,依次处理序列里
- 什么是迭代器对象呢?
相比于迭代,迭代器对象是容易理解多了,是指可以用 for…in… 循环语句,从其中依次取出数据的对象,就是可迭代对象。例如,列表、元组、字典、字符串都是可迭代对象。整数、浮点数、布尔值都是不可迭代 的。
什么是迭代器呢?
在可迭代对象进行迭代的时候,即用 for…in…循环语法依次取出数据时,过程是怎样的
呢?每迭代一次(即在 for…in…中每循环一次)都会返回对象中的下一条数据,一直向后读取数据直到迭代了所有数据后结束。那么,在这个过程中就应该有一个“人”去记录每次访
问到了第几条数据,以便每次迭代都可以返回下一条数据。我们把这个能帮助我们进行数据
迭代的“人”称为迭代器(Iterator)。所以说迭代器就有点类似于一个指针,记录当前位置,一遍下一步迭代操作。
好了我们已经知道了基本概念,那我们该怎么创建自己的迭代器并使用呢?
- 通过iter()方法取得迭代对象的迭代器,当然该方法是python内置的方法,只有可迭代对象才能使用,如:列表对象,元组对象,集合对象,字符串对象,等等。更深的理解需要类的知识。
lis = [1,2,3,4,5] # lis 是可迭代对象 lterator = iter(lis) # 通过 iter()方法取得 list 的迭代器 print(lterator)
- 在我们取得迭代器后可以使用next()来一个一个取得序列的元素。
lis = [1,2,3,4] # lis 可迭代对象 lterator = iter(lis) # 通过 iter()方法取得 list 的迭代器 print(next(lterator)) # 输出1 print(next(lterator)) # 输入2 print(next(lterator)) # 输出3 print(next(lterator)) # 输出4 print(next(lterator)) # 因为序列元素已经迭代完了,所以再使用该方法会报错
生成器
- 什么是生成器呢?
生成器是一种特殊的迭代器函数,调用生成器运行的过程中,每次遇到 yield 时函数会暂停并保存当前所有的运行信息,返回 yield 的值, 并在下一次执行 next() 方法时从当前位置继续运行。生成器的标志就是 yield 关键字。生成器不需要抛出 StopIteration 异常,函数并没有将序列项一次生成,所以生成器在实现上可以有无穷个元素,而不需要无穷的存储空间,这在内存优化方面很有用处。
既然生成器是特殊的迭代器,那我们直接使用迭代器不就行了,还用什么生成器?
其实并不是这样的,生成器它的元素是一个一个生成的,需要一个就生成一个(通过next()取得),而迭代器的元素他是在生成该迭代器时所有元素已经确定了。这样在我们迭代成千上万的数据时使用生成器就比较香了,占用的内存少啊。
- 生成器的实现例子:
import sys def fibonacci(n): # 生成器函数 a, b, counter = 0, 1, 0 # 元组拆包 while True: if (counter > n): return yield a a, b = b, a + b counter += 1 f = fibonacci(10) # f 是一个迭代器,由生成器返回生成 while True: try: print (next(f), end=" ") except StopIteration: sys.exit() # 程序结束