python | 你知道for...in是底层原理是什么样的么?探寻python迭代器

简介: python | 你知道for...in是底层原理是什么样的么?探寻python迭代器

image.png

面试官: 听说你熟悉python,那么你能简单阐述一下python的装饰器、生成器以及迭代器么?


我: emm, 我不清楚,我只是了解过python最基本的代码。

上述是弟弟前段时间去面试运维开发,遇到的问题,emmm,运维是一个很杂的职业,在小公司,总结一句话就是宽而浅,痛定思痛,决定来了解一下python特性,于是乎,就有了这篇文章。


这篇文章,我们将介绍python迭代器,使用环境为: Python 3.6.8


image.png



什么是迭代器


什么是python迭代器呢? 举一个最简单的例子:


image.png


这就是python迭代器,好了,讲完了,手工。

image.png


是的,使用for...in的方式,底层都是使用的是迭代器,你是不是之前写的时候,从来没有好奇过,为什么遍历不同的数据类型,都可以使用for...in通用呢?


弟弟我也是一样的,没有想过,为什么可以这样写。迭代器语法我们已经讲了,接下来,我们来剥开迭代器的面纱吧。



为什么需要迭代器


只要符合python迭代器条件的,都可以使用for...in来遍历元素,即: 使用相同的代码,遍历不同的数据容器。 我认为这是根本原因。


如果上述描述还不清晰的话,我们可以使用cpython来遍历一下数组 和 字符串,就能清晰的了解了。

image.png


如上代码,是c语言遍历数组"pdudo","hello","juejin"和字符串pdudohellojuejin,我们需要自己写遍历条件的临界值。

而如何使用python来写呢? 来看下呢。

image.png

只需要定义数组和字符串,而后使用for...in便结束了。

我想,如上例子,就足以证明为什么要使用迭代器的原因了,因为真的很爽。



迭代器是如何工作的


在经历了前2个段落的铺垫,我猜你肯定很想知道迭代器是如何工作的吧?现在它来了。


在使用for...in语句时,它会调用inter()对象,该函数会返回一个迭代器对象。该对象又定义了__next__()方法,该方法一次返回一个容器元素,当没有更多元素可以返回的时候,会抛一个StopIteration异常来表明for终止循环。


是不是还是不懂?没关系,我们再写一个案例来说明一下。

image.png


如上代码,定义了一个列表,其值为: "pdudo","hello","juejin",而后调用iter方法,它将返回一个迭代器,而后调用next方法来返回下一个元素,但是我们定义的列表长度为3,而调用了4次next方法,可见,最后一次会抛异常。


我们执行后,效果如下:

image.png

可见,和我们上述猜想的一致,在for...in语句中,也是调用inter()容器对象,使用__next__返回后续可迭代的对象,如此类推,直至遇到异常StopIteration,循环结束。


好了,知道迭代器是如何工作了吧? 那么,我们再抛出一个问题,看你能否接住呢? 如何判断一个数据类型是能够被迭代的呢?



如何创建一个迭代器


我们已经学会了如何使用迭代器,以及知晓了迭代器是如何工作的,本段落将介绍如何创建一个迭代器,在看这个之前,我们思考一个问题,如下代码是否会报错呢?

image.png

我们使用for...in来遍历一个int类型的数据。

如上代码,当然会报错,借此引出我们的知识点:什么样的数据类型才能被迭代呢?


是这样的,能否被迭代,取决于该方法是否有__iter__方法。

可以看下如下例子,我们自定义了一个迭代器,用于倒叙输出数据。

image.png


执行后,结果为:

image.png


可见,创建一个迭代器,至少需要 __iter__方法 和 有__next__方法。

好了,有了这个基础案例,我们来写一个链表?

image.png


如上代码,我们先创建节点Node,它有2个值,val是记录的值,而nextNode是记录下一个Node的指针,而后定义了类Lists,调用时候,需要传入一个Node,它会将currentNodes来记录当前的Node 重点看__next__,当当前节点为空的时候,则返回StopIteration告知for迭代器结束了,否则的话,取出当前节点的val并且返回,且将其下滑到下一个节点。


如上代码,运行后,结果如下:

image.png


总结


本篇文章,我们首先介绍了什么迭代器,什么是迭代器呢? 最简单的for...in就是迭代器,接着便介绍了为什么需要迭代器,我们通过c输出数组和字符串来和pythonfor...in语法做比较,迭代器写法更为简单,迭代器的核心是使用相同的代码,遍历不同的数据容器。 接着便介绍了迭代器是如何工作的,其对象方法必须要有__iter____next__方法,才能被for...in所调用,最后我们实现了一个类,实现了上述的2个方法,从而实现了迭代器。



相关文章
|
3天前
|
搜索推荐 Python
快速排序的 Python 实践:从原理到优化,打造你的排序利器!
【7月更文挑战第12天】Python的快速排序**以分治策略实现高效排序,平均时间复杂度$O(nlogn)$,优于$O(n^2)$的冒泡排序。基本实现通过选取基准元素分割数组,然后递归排序两部分。优化版使用随机基准避免最坏情况。对比显示优化后排序更稳定,适应不同数据集,提升程序性能。
13 4
|
12天前
|
Python 容器
Python中迭代器的基本概念
【7月更文挑战第3天】
12 1
|
12天前
|
Python
Python中自定义迭代器
【7月更文挑战第3天】
10 1
|
12天前
|
Python
Python中创建迭代器
【7月更文挑战第3天】
13 1
|
14天前
|
Python
python解包迭代器或生成器
【7月更文挑战第1天】
15 3
|
13天前
|
Python 容器
python 的迭代器(Iterator)
【7月更文挑战第2天】
9 1
|
14天前
|
Python
python解包迭代器或生成器
【7月更文挑战第1天】
11 1
|
19天前
|
数据处理 Python
从零开始学迭代器生成器:打造高效、易读的Python代码
从零开始学迭代器生成器:打造高效、易读的Python代码
|
19天前
|
监控 安全 虚拟化
深入浅出Python沙箱越狱:原理、方法与防范
今天我们来聊一个有趣的话题 - Python沙箱越狱。在我们开始之前,先来搞清楚什么是Python沙箱吧。 简单来,Python沙箱就像是一个虚拟的"游乐场"。在这个游乐场里,你可以尽情地玩耍(运行Python代码),但是不能伤害到外面的世界(不能访问系统资源或执行危险操作)。这个"游乐场"有围栏(限制),有规则(安全策略),目的就是让你玩得开心,又不会搞出什么大乱子。
|
21天前
|
Python
python中迭代器的解包
【6月更文挑战第17天】
23 4