python yield浅析

发布时间:2019-09-15 09:56:49编辑:auto阅读(1727)

    在python(本文python环境为python2.7)中,使用yield关键字的函数被称为generator(生成器)。故为了了解yield,必然先要了解generator,而了解generator之前,我们先要了解一下迭代。

    递归和迭代

    聊迭代之前,我们也顺带简单了解一下递归:
    1,递归:程序调用自身的编程技巧称为递归

    应用案例:求n的阶乘

    def factorial(n) :
      if n == 1 :
        return 1                   #递归结束
      return n * factorial(n - 1)  #问题规模减1,递归调用

    2,迭代:迭代是程序中对一组指令(或一定步骤)的重复

    应用案例:读取列表中的每个元素

    mylist = [1, 2, 3]
    for i in mylist :
        print(i)

    2.1,可迭代对象是什么?

    如上所示code使用了迭代的方法,而列表mylist是一个可迭代对象。当你建立了一个列表,你可以逐项地读取这个列表,而这个创建的列表就是一个可迭代对象。

    2.2,迭代器是什么?

    迭代器(iterator)是访问集合内元素的一种方式,提供了一种遍历类序列对象的方法。对于一般的序列,利用索引从0一直迭代到序列的最后一个元素。对象从集合的第一个元素开始访问,直到所有的元素都被访问一遍后结束。对于字典、文件、自定义对象类型等,可以自定义迭代方式,从而实现对这些对象的遍历。总之,迭起器就是定义了对对象进行遍历的方式。

    而实现了迭代器规范的对象就是迭代器,规范如下:
    1,实现了魔法方法 iter(),返回一个迭代对象,这个对象有一个next()方法,
    2,实现 next() 方法,返回当前的元素,并指向下一个元素的位置,当前位置已经没有元素的时候,抛出StopIteration异常。

    python for循环的时候,首先对循环对象实现迭代器包装,返回一个迭代器对象,然后每循环一步,就调用哪个迭代器对象的next方法,循环结束的时候,自动处理了StopIteration这个异常。for循环是对迭代器进行迭代的语法糖。

    python中使用iter函数来生成一个迭代器:

    >>> t = [1, 2, 3]
    >>> it = iter(t)
    >>> it.next()
    1

    生成器和yield

    1. 生成器是什么?

    生成器也是一种迭代器,但是你只能对其迭代一次。这是因为它们并没有把所有的值存在内存中,而是在运行时生成值,这样能节省大量内存空间并且提高效率。

    通过列表生成式,我们可以直接创建一个列表。但是,受到内存限制,列表容量肯定是有限的。而且,创建一个包含100万个元素的列表,不仅占用很大的存储空间,如果我们仅仅需要访问前面几个元素,那后面绝大多数元素占用的空间都白白浪费了。

    所以,如果列表元素可以按照某种算法推算出来,那我们是否可以在循环的过程中不断推算出后续的元素呢?这样就不必创建完整的list,从而节省大量的空间。

    2,yield是什么?

    yield是python内部的一个关键字,内部实现支持了迭代器协议,同时yield内部是一个状态机,维护着挂起和继续的状态,yield关键字返回的就是一个生成器。

    3,生成器的执行流程
    代码样例:

    >>> def fab(max):
    ...     n, a, b = 0, 0, 1
    ...     while n < max:
    ...         yield b
    ...         a, b = b, a + b
    ...         n = n + 1
    ...
    ...
    >>> f = fab(5)
    >>> f.next()
    1
    >>> f.next()
    1
    >>> f.next()
    2
    >>> f.next()
    3
    >>> f.next()
    5
    >>> f.next()
    Traceback (most recent call last):
      File "<stdin>", line 1, in <module>
    StopIteration
    >>>

    通过结果可以看到:

    • 当调用生成器函数的时候,函数只是返回了一个生成器对象,并不执行。
    • 当next()方法第一次被调用的时候,生成器函数才开始执行,执行到yield语句处停止,next()方法的返回值就是yield语句处的参数
    • 当继续调用next()方法的时候,函数将接着上一次停止的yield语句处继续执行,并到下一个yield处停止,如果后面没有yield就抛出StopIteration异常

    4,如何判断一个函数是否是一个特殊的 generator 函数?可以利用 isgeneratorfunction 判断:

    >>> from inspect import isgeneratorfunction 
    >>> isgeneratorfunction(fab) 
    True

    结论

    一个带有 yield 的函数就是一个 generator,它和普通函数不同,生成一个 generator 看起来像函数调用,但不会执行任何函数代码,直到对其调用 next()(在 for 循环中会自动调用 next())才开始执行。虽然执行流程仍按函数的流程执行,但每执行到一个 yield 语句就会中断,并返回一个迭代值,下次执行时从 yield 的下一个语句继续执行。看起来就好像一个函数在正常执行的过程中被 yield 中断了数次,每次中断都会通过 yield 返回当前的迭代值。

    yield 的好处是显而易见的,把一个函数改写为一个 generator 就获得了迭代能力,比起用类的实例保存状态来计算下一个 next() 的值,不仅代码简洁,而且执行流程异常清晰。

关键字