Python的迭代器协议

发布时间:2019-08-29 07:40:28编辑:auto阅读(1499)

        迭代器是Python中的一个高级概念,迭代器是一个实现了迭代器协议的对象,那何为迭代器协议呢?

    满足下面两个条件就行。(1)该对象实现了__iter__()方法;(2)该对象实现了next()方法,返回当前元素,并指向下一个元素的位置,如果当前位置已无元素,则抛出StopIteration异常。

    看下面例子

    wKioL1f0uGiATtRcAACLQZmHWiE997.png-wh_50

    这说明列表这个对象实现了迭代器协议。如果一个对象有__iter__()方法,那么它就是可迭代对象。可以利用迭代器协议来遍历可迭代对象,例如下面例子:

    #coding=utf-8
    a = range(3)
    it = a.__iter__()
    while 1:
        try:
            print it.next()
        except StopIteration:
            break

    输出结果:

    1

    2


    其实吧,for语句就是获取了容器的迭代器、调用迭代器的next()方法以及对StopIteration进行处理等流程进行封装了的语法糖,类似的还有in/not in语句。

    迭代器的优势有很多:

    (1)定义了统一的访问容器的接口,我们可以随时定义自己的迭代器,只要实现了迭代器协议就行。

    (2)迭代器有惰性求值的特性,它进可以在迭代至当前元素时才计算,所以非常适合遍历元素非常多的容器,而且更省内存。

    看下面例子:

    #coding=utf-8
    class Fab(object):
        def __init__(self, max):
            self.max = max
            self.n, self.a, self.b = 0, 0, 1
    
        def __iter__(self):
            return self
    
        def next(self):
            if self.n < self.max:
                r = self.b
                self.a, self.b = self.b, self.a + self.b
                self.n = self.n + 1
                return r
            raise StopIteration()
    
    for one in Fab(5):
        print one

    输出结果如下:

    1

    2

    3

    4

    5

    迭代器使用的内存会更小。看看下面的例子:

    print sys.getsizeof(Fab(5))
    print sys.getsizeof([1,2,3,4,5])


    输出结果如下:

    wKiom1f0vn2jacRKAAAaMtP6CdQ048.png-wh_50

    同样是获取含有元素1,2,3,4,5的容器,迭代器更省内存。还有一个,看下面例子:

    print sys.getsizeof(Fab(5))
    print sys.getsizeof(Fab(50))
    print sys.getsizeof(Fab(500))
    print sys.getsizeof(Fab(5000))

    输出结果如下:

    wKioL1f0v7iziCTIAAAZsyckEmc810.png-wh_50

    占用的内存并没有因为元素的增多而增加,所以在编写代码时要多多使用迭代器或者迭代协议。


    Python中内置了一个iter()函数,可以返回一个迭代器对象,它接受的参数是一个实现了__iter__()方法的容器(也就是可迭代对象)或者迭代器。对于有__iter__()方法的容器,__iter__()也返回一个迭代器对象。


    python中有itertools模块,里面的函数都是用迭代器实现的,效率很高,有时间你可以去了解下。

关键字