Python生成器(Generator)详解


Posted in Python onApril 13, 2015

通过列表生成式,我们可以直接创建一个列表。但是,受到内存限制,列表容量肯定是有限的。而且,创建一个包含100万个元素的列表,不仅占用很大的存储空间,如果我们仅仅需要访问前面几个元素,那后面绝大多数元素占用的空间都白白浪费了。

所以,如果列表元素可以按照某种算法推算出来,那我们是否可以在循环的过程中不断推算出后续的元素呢?这样就不必创建完整的list,从而节省大量的空间。在Python中,这种一边循环一边计算的机制,称为生成器(Generator)。

简单生成器

要创建一个generator,有很多种方法。第一种方法很简单,只要把一个列表生成式的[]改成(),就创建了一个generator:

>>> L = [x * x for x in range(10)]

>>> L

[0, 1, 4, 9, 16, 25, 36, 49, 64, 81]

>>> g = (x * x for x in range(10))

>>> g

<generator object <genexpr> at 0x104feab40>

创建L和g的区别仅在于最外层的[]和(),L是一个list,而g是一个generator。
我们可以直接打印出list的每一个元素,但我们怎么打印出generator的每一个元素呢?

如果要一个一个打印出来,可以通过generator的next()方法:

>>> g.next()

0

>>> g.next()

1

>>> g.next()

4

>>> g.next()

9

>>> g.next()

16

>>> g.next()

25

>>> g.next()

36

>>> g.next()

49

>>> g.next()

64

>>> g.next()

81

>>> g.next()

Traceback (most recent call last):

  File "<stdin>", line 1, in <module>

StopIteration

我们讲过,generator保存的是算法,每次调用next(),就计算出下一个元素的值,直到计算到最后一个元素,没有更多的元素时,抛出StopIteration的错误。

当然,上面这种不断调用next()方法实在是太变态了,正确的方法是使用for循环,因为generator也是可迭代对象:

>>> g = (x * x for x in range(10))

>>> for n in g:

...     print n

...

0

1

4

9

16

25

36

49

64

81

所以,我们创建了一个generator后,基本上永远不会调用next()方法,而是通过for循环来迭代它。

带yield 语句的生成器

仔细观察,可以看出,fib函数实际上是定义了斐波拉契数列的推算规则,可以从第一个元素开始,推算出后续任意的元素,这种逻辑其实非常类似generator。

也就是说,上面的函数和generator仅一步之遥。要把fib函数变成generator,只需要把print b改为yield b就可以了:

def fib(max):

    n, a, b = 0, 0, 1

    while n < max:

        yield b

        a, b = b, a + b

        n = n + 1

这就是定义generator的另一种方法。如果一个函数定义中包含yield关键字,那么这个函数就不再是一个普通函数,而是一个generator:
>>> fib(6)

<generator object fib at 0x104feaaa0>

这里,最难理解的就是generator和函数的执行流程不一样。函数是顺序执行,遇到return语句或者最后一行函数语句就返回。而变成generator的函数,在每次调用next()的时候执行,遇到yield语句返回,再次执行时从上次返回的yield语句处继续执行。

举个简单的例子,定义一个generator,依次返回数字1,3,5:

>>> def odd():

...     print 'step 1'

...     yield 1

...     print 'step 2'

...     yield 3

...     print 'step 3'

...     yield 5

...

>>> o = odd()

>>> o.next()

step 1

1

>>> o.next()

step 2

3

>>> o.next()

step 3

5

>>> o.next()

Traceback (most recent call last):

  File "<stdin>", line 1, in <module>

StopIteration

可以看到,odd不是普通函数,而是generator,在执行过程中,遇到yield就中断,下次又继续执行。执行3次yield后,已经没有yield可以执行了,所以,第4次调用next()就报错。

回到fib的例子,我们在循环过程中不断调用yield,就会不断中断。当然要给循环设置一个条件来退出循环,不然就会产生一个无限数列出来。

同样的,把函数改成generator后,我们基本上从来不会用next()来调用它,而是直接使用for循环来迭代:

>>> for n in fib(6):

...     print n

...

1

1

2

3

5

8

加强的生成器

在 python2.5 中,一些加强特性加入到生成器中,所以除了 next()来获得下个生成的值,用户可以将值回送给生成器[send()],在生成器中抛出异常,以及要求生成器退出[close()]

def gen(x):

    count = x

    while True:

        val = (yield count) 

        if val is not None:

            count = val

        else:

            count += 1
f = gen(5)

print f.next()

print f.next()

print f.next()

print '===================='

print f.send(9)#发送数字9给生成器

print f.next()

print f.next()

输出
5

6

7

====================

9

10

11
Python 相关文章推荐
python中解析json格式文件的方法示例
May 03 Python
Python3.7中安装openCV库的方法
Jul 11 Python
在Python中字典根据多项规则排序的方法
Jan 21 Python
Python 监测文件是否更新的方法
Jun 10 Python
Python编程学习之如何判断3个数的大小
Aug 07 Python
Python 点击指定位置验证码破解的实现代码
Sep 11 Python
解决Pytorch训练过程中loss不下降的问题
Jan 02 Python
Tensorflow 使用pb文件保存(恢复)模型计算图和参数实例详解
Feb 11 Python
Python解释器以及PyCharm的安装教程图文详解
Feb 26 Python
Keras:Unet网络实现多类语义分割方式
Jun 11 Python
详解matplotlib绘图样式(style)初探
Feb 03 Python
python中对列表的删除和添加方法详解
Feb 24 Python
Python中函数的多种格式和使用实例及小技巧
Apr 13 #Python
在Python中使用SimpleParse模块进行解析的教程
Apr 11 #Python
Python的动态重新封装的教程
Apr 11 #Python
简单的Python的curses库使用教程
Apr 11 #Python
详解Python中的文本处理
Apr 11 #Python
状态机的概念和在Python下使用状态机的教程
Apr 11 #Python
在Python下使用Txt2Html实现网页过滤代理的教程
Apr 11 #Python
You might like
php discuz 主题表和回帖表的设计
2009/03/13 PHP
微信公众号实现会员卡领取功能
2017/06/08 PHP
非阻塞动态加载javascript广告实现代码
2010/11/17 Javascript
javascript实现焦点滚动图效果 具体方法
2013/06/24 Javascript
子窗体与父窗体传值示例js代码
2013/08/01 Javascript
原生js做的手风琴效果的导航菜单
2013/11/08 Javascript
js获取客户端外网ip的简单实例
2013/11/21 Javascript
介绍JavaScript中Math.abs()方法的使用
2015/06/14 Javascript
快速学习jQuery插件 Form表单插件使用方法
2015/12/01 Javascript
深入理解Javascript中的自执行匿名函数
2016/06/03 Javascript
Bootstrap导航条可点击和鼠标悬停显示下拉菜单的实现代码
2016/06/23 Javascript
快速解决js动态改变dom元素属性后页面及时渲染的问题
2016/07/06 Javascript
JavaScript常用代码书写规范的超全面总结
2016/09/11 Javascript
js控制li的隐藏和显示实例代码
2016/10/15 Javascript
JS中用try catch对代码运行的性能影响分析
2016/12/26 Javascript
利用JS实现scroll自定义滚动效果详解
2017/10/17 Javascript
react实现一个优雅的图片占位模块组件详解
2017/10/30 Javascript
JQuery选中select组件被选中的值方法
2018/03/08 jQuery
解决webpack dev-server不能匹配post请求的问题
2018/08/24 Javascript
vue动态添加路由addRoutes之不能将动态路由存入缓存的解决
2019/02/19 Javascript
一文看懂如何简单实现节流函数和防抖函数
2019/09/05 Javascript
js获取本日、本周、本月的时间代码
2020/02/01 Javascript
JavaScript自定义超时API代码实例
2020/04/30 Javascript
[02:47]2018年度DOTA2最佳辅助位选手4号位-完美盛典
2018/12/17 DOTA
Python实现代码统计工具(终极篇)
2016/07/04 Python
Python爬虫实例扒取2345天气预报
2018/03/04 Python
详解Numpy中的广播原则/机制
2018/09/20 Python
Django实现发送邮件功能
2019/07/18 Python
Python for i in range ()用法详解
2020/09/18 Python
Python基于execjs运行js过程解析
2020/11/27 Python
Python爬虫自动化爬取b站实时弹幕实例方法
2021/01/26 Python
绩效工资实施方案
2014/03/15 职场文书
作风年建设汇报材料
2014/08/14 职场文书
2014乡镇党委副书记对照检查材料思想汇报
2014/10/09 职场文书
北京导游词
2015/02/12 职场文书
解决xampp安装后Apache无法启动
2022/03/21 Servers