【python】带你深入了解“迭代器“

简介: 迭代,正如大家已知,对序列(列表、元组)、字典和文件都可以用 iter() 方法生成迭代对象,然后用 next() 方法访 问。当然,这种访问不是自动的,如果用 for 循环,就可以自动完成上述访问了。.........

🍁作者简介:🏅云计算领域优质创作者🏅新星计划第三季python赛道TOP1🏅 阿里云ACE认证高级工程师🏅

✒️个人主页:小鹏linux

💊个人社区:小鹏linux(个人社区)欢迎您的加入!

迭代器

迭代,正如大家已知,对序列(列表、元组)、字典和文件都可以用 iter() 方法生成迭代对象,然后用 next() 方法访 问。当然,这种访问不是自动的,如果用 for 循环,就可以自动完成上述访问了。

如果用 dir(list) , dir(tuple) , dir(file) , dir(dict) 来查看不同类型对象的属性,会发现它们都有一个名为 __iter__ 的东西。这个应该引起读者的关注,因为它和迭代器(iterator)、内置的函数 iter() 在名字上是一样的,除了前后的双下划线。望文生义,我们也能猜出它肯定是跟迭代有关的东西。当然,这种猜测也不是没有根据的,其重要根据就是英文单词,如果它们之间没有一点关系,肯定不会将命名搞得一样。

猜对了。 __iter__ 就是对象的一个特殊方法,它是迭代规则(iterator potocol)的基础。或者说,对象如果没有 它,就不能返回迭代器,就没有 next() 方法,就不能迭代。


提醒注意:

如果大家用的是 Python3.x,迭代器对象实现的是 __next__() 方法,不是 next() 。并且,在 Py

thon3.x 中有一个内建函数 next(),可以实现 next(it) ,访问迭代器,这相当于于 python2.x 中的 it.next() (it 是迭代对象)。

那些类型是 list、tuple、file、dict 对象有 __iter__() 方法,标着他们能够迭代。这些类型都是 Python 中固有的,我们能不能自己写一个对象,让它能够迭代呢?

当然呢!要不然 python 怎么强悍呢。

#!/usr/bin/env Python
# coding=utf-8
"""
the interator as range()
"""
class MyRange(object):
    def __init__(self, n):
        self.i = 0
        self.n = n
    def __iter__(self):
        return self
    def next(self):
        if self.i < self.n:
            i = self.i
            self.i += 1
            return i
        else:
            raise StopIteration()
if __name__ == "__main__":
    x = MyRange(7)
    print "x.next()==>", x.next()
    print "x.next()==>", x.next()
    print "------for loop--------"
    for i in x:
        print i

image.gif

将代码保存,并运行,结果是:
$ python 21401.py
x.next()==> 0
x.next()==> 1
------for loop--------
2
3
4
5
6

image.gif


以上代码的含义,是自己仿写了拥有 range() 的对象,这个对象是可迭代的。分析如下:

__iter__() 是类中的核心,它返回了迭代器本身。一个实现了 __iter__() 方法的对象,即意味着其实可迭代 的。

含有 next() 的对象,就是迭代器,并且在这个方法中,在没有元素的时候要发起 StopIteration() 异常。

如果对以上类的调用换一种方式:

if __name__ == "__main__":
    x = MyRange(7)
    print list(x)
    print "x.next()==>", x.next()

image.gif

运行后会出现如下结果: 
$ python 21401.py
[0, 1, 2, 3, 4, 5, 6]
x.next()==>
Traceback (most recent call last):
    File "21401.py", line 26, in <module>
        print "x.next()==>", x.next()
    File "21401.py", line 21, in next
        raise StopIteration()
StopIteration

image.gif

 说明什么呢? print list(x) 将对象返回值都装进了列表中并打印出来,这个正常运行了。此时指针已经移动到了 迭代对象的最后一个, next() 方法没有检测也不知道是不是要停止了,它还要继续下去,当继续下一个的时候,才发现没有元素了,于是返回了 StopIteration() 。 为什么要将用这种可迭代的对象呢?就像上面例子一样,列表不是挺好的吗? 列表的确非常好,在很多时候效率很高,并且能够解决相当普遍的问题。但是,不要忘记一点,在某些时候,列表可能会给你带来灾难。因为在你使用列表的时候,需要将列表内容一次性都读入到内存中,这样就增加了内存的负担。如果列表太大太大,就有内存溢出的危险了。这时候需要的是迭代对象。比如斐波那契数列
#!/usr/bin/env Python
# coding=utf-8
"""
compute Fibonacci by iterator
"""
__metaclass__ = type
class Fibs:
    def __init__(self, max):
        self.max = max
        self.a = 0
        self.b = 1
    def __iter__(self):
        return self
    def next(self):
        fib = self.a
        if fib > self.max:
            raise StopIteration
        self.a, self.b = self.b, self.a + self.b
        return fib
if __name__ == "__main__":
    fibs = Fibs(5)
    print list(fibs)

image.gif

运行结果是:
$ python 21402.py
[0, 1, 1, 2, 3, 5]

image.gif

如果说,要在斐波那契数列中找出大于 1000 的最小的数,能不能在上述代码基础上改造得出呢?

关于列表和迭代器之间的区别,还有两个非常典型的内建函数: range() 和 xrange() ,研究一下这两个的差异,会有所收获的。
range(...)
    range(stop) -> list of integers
    range(start, stop[, step]) -> list of integers
>>> dir(range)
['__call__', '__class__', '__cmp__', '__delattr__', '__doc__', '__eq__', '__format__', '__ge__', '__getattribute__', '__gt__', '__hash__', '__init__', '__le__', '__lt__', '__module__', '__name__', '__ne__', '__new__', '__reduce__', '__reduce_ex__', '__repr__', '__self__', '__setattr__', '__sizeof__', '__str__', '__subclasshook__']

image.gif

从 range() 的帮助文档和方法中可以看出,它的结果是一个列表。但是,如果用 help(xrange) 查看:
class xrange(object)
| xrange(stop) -> xrange object
| xrange(start, stop[, step]) -> xrange object
|
| Like range(), but instead of returning a list, returns an object that
| generates the numbers in the range on demand. For looping, this is
| slightly faster than range() and more memory efficient.

image.gif

xrange() 返回的是对象,并且进一步告诉我们,类似 range() ,但不是列表。在循环的时候,它跟 range() 相比“slightly faster than range() and more memory efficient”,稍快并更高的内存效率(就是省内存呀)。查看它的方法:
>>> dir(xrange)
['__class__', '__delattr__', '__doc__', '__format__', '__getattribute__', '__getitem__', '__hash__', '__init__', '__iter__', '__len__', '__new__', '__reduce__', '__reduce_ex__', '__repr__', '__reversed__', '__setattr__', '__sizeof__', '__str__', '__subclasshook__']

image.gif

看到令人兴奋的 __iter__ 了吗?说明它是可迭代的,它返回的是一个可迭代的对象。 也就是说,通过 range() 得到的列表,会一次性被读入内存,而 xrange() 返回的对象,则是需要一个数值才从返回一个数值。比如这样一个应用:
>>> a = ["name", "age"]
>>> b = ["qiwsir", 40]
>>> zip(a,b)
[('name', 'qiwsir'), ('age', 40)]

image.gif

如果两个列表的个数不一样,就会以短的为准了,比如:
>>> zip(range(4), xrange(100000000))
[(0, 0), (1, 1), (2, 2), (3, 3)]

image.gif

第一个 range(4) 产生的列表被读入内存;第二个是不是也太长了?但是不用担心,它根本不会产生那么长的列表,因为只需要前 4 个数值,它就提供前四个数值。如果你要修改为 range(100000000) ,就要花费时间了,可以尝试一下哦。

迭代器的确有迷人之处,但是它也不是万能之物。比如迭代器不能回退,只能如过河的卒子,不断向前。另外,迭代器也不适合在多线程环境中对可变集合使用

👑👑👑结束语👑👑👑

image.gif

目录
相关文章
|
29天前
|
大数据 数据处理 开发者
Python中的迭代器和生成器:不仅仅是语法糖####
本文探讨了Python中迭代器和生成器的深层价值,它们不仅简化代码、提升性能,还促进了函数式编程风格。通过具体示例,揭示了这些工具在处理大数据、惰性求值及资源管理等方面的优势。 ####
|
1月前
|
存储 程序员 数据处理
深入理解Python中的生成器与迭代器###
本文将探讨Python中生成器与迭代器的核心概念,通过对比分析二者的异同,结合具体代码示例,揭示它们在提高程序效率、优化内存使用方面的独特优势。生成器作为迭代器的一种特殊形式,其惰性求值的特性使其在处理大数据流时表现尤为出色。掌握生成器与迭代器的灵活运用,对于提升Python编程技能及解决复杂问题具有重要意义。 ###
|
2月前
|
存储 索引 Python
Python 迭代器是怎么实现的?
Python 迭代器是怎么实现的?
48 6
|
3月前
|
索引 Python
解密 Python 迭代器的实现原理
解密 Python 迭代器的实现原理
53 13
|
3月前
|
机器学习/深度学习 设计模式 大数据
30天拿下Python之迭代器和生成器
30天拿下Python之迭代器和生成器
23 3
|
2月前
|
存储 大数据 Python
Python 中迭代器与生成器:深度解析与实用指南
Python 中迭代器与生成器:深度解析与实用指南
25 0
|
4月前
|
数据采集 存储 大数据
Python关于迭代器的使用
在Python编程中,数据的处理和操作是核心任务之一。 想象一下,你有一个装满各种颜色球的箱子,你想逐个查看并使用这些球,但又不想一次性将它们全部取出。 这就引出了我们今天要讨论的主题——迭代。
|
4月前
|
存储 安全 数据库
Python中的可迭代性与迭代器
在Python中,可迭代性和迭代器是非常重要的概念,它们为我们提供了一种优雅且高效的方式来处理序列和集合数据。本文将深入探讨这些概念,包括可迭代协议以及与异步编程相关的可迭代性和迭代器。
|
4月前
|
存储 安全 数据库
Python中的可迭代性与迭代器
在Python中,可迭代性和迭代器是非常重要的概念,它们为我们提供了一种优雅且高效的方式来处理序列和集合数据。本文将深入探讨这些概念,包括可迭代协议以及与异步编程相关的可迭代性和迭代器。
|
5月前
|
数据采集 存储 大数据
Python中关于迭代器的使用
总之,迭代器是Python编程的基石,它们在处理数据、优化性能和构建复杂系统方面都有着不可替代的地位。随着技术的不断进步,迭代器将继续在各种编程场景中发挥重要作用。