迭代器:初探
Python 学习的人都知道,Python 中存在两种循环语句:while 和 for。for 循环可以用于 Python 中的任何序列,包括列表、元组、字符串。
>>> for x in [2013, 14, 15926]: print(x, end=' ')...2013 14 15926>>>>>> for x in (2021, 2022, 2023): print(x, end='->')...2021->2022->2023->>>> for x in 'HelloWorld': print(x, end=' ')...H e l l o W o r l d
复制代码
实际上,for 循环还能使用于任何可迭代对象。可迭代对象在 Python 中是新颖特别的概念,但实际上就是序列概念的通用化:如果对象时实际保存的序列,或者可以在迭代工具中(如 for 循环)一次产生一个结果的对象,就看做可迭代的。可以说,Python 中迭代器无处不在。
什么是迭代器?
Python 中的迭代器是一个对象,用于迭代列表、元组、字典和集合等可迭代对象。Python 迭代器对象必须实现两个特殊的方法:__iter__()
和__next__()
方法:
- 使用
__iter__()
方法初始化迭代器对象 - 使用
__next__()
方法进行迭代。
通过迭代器进行迭代
iter()
函数依次调用 __iter__()
方法,返回一个迭代器。我们使用 next()
函数手动遍历迭代器的所有项。
当我们到达终点并且没有更多数据要返回时,它将引发 StopIteration
异常。下面是一个例子:
# define a list my_list = [2013, 14, 15926] # get an iterator using iter() my_iter = iter(my_list) # iterate through it using next() # Output: 2013 print(next(my_iter)) # Output: 14 print(next(my_iter)) # next(obj) is same as obj.__next__() # Output: 15926 print(my_iter.__next__()) # This will raise error, no items left next(my_iter)
依次执行上面的代码,输出如下:
2013 14 15926 Traceback (most recent call last): File "<string>", line 24, in <module> next(my_iter) StopIteration
一种更优雅的自动迭代方式是使用 for 循环。使用它,我们可以迭代任何可以返回迭代器的对象,例如列表、字符串、文件等。
>>> for element in my_list: ... print(element) ... 2013 14 15926
迭代器 for 循环的工作
正如我们在上面的示例中看到的,for 循环能够自动遍历列表。
实际上 for 循环可以迭代任何可迭代对象。让我们仔细看看 for 循环是如何在 Python 中实际实现的。
for element in iterable: # do something with element
实际实现为:
# create an iterator object from that iterable iter_obj = iter(iterable) # infinite loop while True: try: # get the next item element = next(iter_obj) print(element) # do something with element except StopIteration: # if StopIteration is raised, break from loop break
所以在内部,for 循环通过在可迭代对象上调用 iter()
创建一个迭代器对象 iter_obj
。具有讽刺意味的是,这个 for 循环实际上是一个无限的 while 循环。
在循环内部,它调用 next()
来获取下一个元素并使用该值执行 for 循环的主体。在所有项目耗尽后,StopIteration
被引发,内部捕获并结束循环。请注意,任何其他类型的异常都会通过。