Python生成器(Generator)详解


Posted in Python onApril 13, 2015

通过列表生成式,我们可以直接创建一个列表。但是,受到内存限制,列表容量肯定是有限的。而且,创建一个包含100万个元素的列表,不仅占用很大的存储空间,如果我们仅仅需要访问前面几个元素,那后面绝大多数元素占用的空间都白白浪费了。

所以,如果列表元素可以按照某种算法推算出来,那我们是否可以在循环的过程中不断推算出后续的元素呢?这样就不必创建完整的list,从而节省大量的空间。在Python中,这种一边循环一边计算的机制,称为生成器(Generator)。

简单生成器

要创建一个generator,有很多种方法。第一种方法很简单,只要把一个列表生成式的[]改成(),就创建了一个generator:

>>> L = [x * x for x in range(10)]

>>> L

[0, 1, 4, 9, 16, 25, 36, 49, 64, 81]

>>> g = (x * x for x in range(10))

>>> g

<generator object <genexpr> at 0x104feab40>

创建L和g的区别仅在于最外层的[]和(),L是一个list,而g是一个generator。
我们可以直接打印出list的每一个元素,但我们怎么打印出generator的每一个元素呢?

如果要一个一个打印出来,可以通过generator的next()方法:

>>> g.next()

0

>>> g.next()

1

>>> g.next()

4

>>> g.next()

9

>>> g.next()

16

>>> g.next()

25

>>> g.next()

36

>>> g.next()

49

>>> g.next()

64

>>> g.next()

81

>>> g.next()

Traceback (most recent call last):

  File "<stdin>", line 1, in <module>

StopIteration

我们讲过,generator保存的是算法,每次调用next(),就计算出下一个元素的值,直到计算到最后一个元素,没有更多的元素时,抛出StopIteration的错误。

当然,上面这种不断调用next()方法实在是太变态了,正确的方法是使用for循环,因为generator也是可迭代对象:

>>> g = (x * x for x in range(10))

>>> for n in g:

...     print n

...

0

1

4

9

16

25

36

49

64

81

所以,我们创建了一个generator后,基本上永远不会调用next()方法,而是通过for循环来迭代它。

带yield 语句的生成器

仔细观察,可以看出,fib函数实际上是定义了斐波拉契数列的推算规则,可以从第一个元素开始,推算出后续任意的元素,这种逻辑其实非常类似generator。

也就是说,上面的函数和generator仅一步之遥。要把fib函数变成generator,只需要把print b改为yield b就可以了:

def fib(max):

    n, a, b = 0, 0, 1

    while n < max:

        yield b

        a, b = b, a + b

        n = n + 1

这就是定义generator的另一种方法。如果一个函数定义中包含yield关键字,那么这个函数就不再是一个普通函数,而是一个generator:
>>> fib(6)

<generator object fib at 0x104feaaa0>

这里,最难理解的就是generator和函数的执行流程不一样。函数是顺序执行,遇到return语句或者最后一行函数语句就返回。而变成generator的函数,在每次调用next()的时候执行,遇到yield语句返回,再次执行时从上次返回的yield语句处继续执行。

举个简单的例子,定义一个generator,依次返回数字1,3,5:

>>> def odd():

...     print 'step 1'

...     yield 1

...     print 'step 2'

...     yield 3

...     print 'step 3'

...     yield 5

...

>>> o = odd()

>>> o.next()

step 1

1

>>> o.next()

step 2

3

>>> o.next()

step 3

5

>>> o.next()

Traceback (most recent call last):

  File "<stdin>", line 1, in <module>

StopIteration

可以看到,odd不是普通函数,而是generator,在执行过程中,遇到yield就中断,下次又继续执行。执行3次yield后,已经没有yield可以执行了,所以,第4次调用next()就报错。

回到fib的例子,我们在循环过程中不断调用yield,就会不断中断。当然要给循环设置一个条件来退出循环,不然就会产生一个无限数列出来。

同样的,把函数改成generator后,我们基本上从来不会用next()来调用它,而是直接使用for循环来迭代:

>>> for n in fib(6):

...     print n

...

1

1

2

3

5

8

加强的生成器

在 python2.5 中,一些加强特性加入到生成器中,所以除了 next()来获得下个生成的值,用户可以将值回送给生成器[send()],在生成器中抛出异常,以及要求生成器退出[close()]

def gen(x):

    count = x

    while True:

        val = (yield count) 

        if val is not None:

            count = val

        else:

            count += 1
f = gen(5)

print f.next()

print f.next()

print f.next()

print '===================='

print f.send(9)#发送数字9给生成器

print f.next()

print f.next()

输出
5

6

7

====================

9

10

11
Python 相关文章推荐
Python对list列表结构中的值进行去重的方法总结
May 07 Python
python django 访问静态文件出现404或500错误
Jan 20 Python
浅谈python函数之作用域(python3.5)
Oct 27 Python
对python 匹配字符串开头和结尾的方法详解
Oct 27 Python
python flask几分钟实现web服务的例子
Jul 26 Python
python 数据提取及拆分的实现代码
Aug 26 Python
django models里数据表插入数据id自增操作
Jul 15 Python
Python 捕获代码中所有异常的方法
Aug 03 Python
详解基于python的图像Gabor变换及特征提取
Oct 26 Python
写好Python代码的几条重要技巧
May 21 Python
Pytorch中的学习率衰减及其用法详解
Jun 05 Python
python中__slots__节约内存的具体做法
Jul 04 Python
Python中函数的多种格式和使用实例及小技巧
Apr 13 #Python
在Python中使用SimpleParse模块进行解析的教程
Apr 11 #Python
Python的动态重新封装的教程
Apr 11 #Python
简单的Python的curses库使用教程
Apr 11 #Python
详解Python中的文本处理
Apr 11 #Python
状态机的概念和在Python下使用状态机的教程
Apr 11 #Python
在Python下使用Txt2Html实现网页过滤代理的教程
Apr 11 #Python
You might like
php获取百度收录、百度热词及百度快照的方法
2015/04/02 PHP
PHP使用PHPExcel实现批量上传到数据库的方法
2017/06/08 PHP
showModelessDialog()使用详解
2006/09/21 Javascript
JavaScript 继承详解(三)
2009/07/13 Javascript
js简单实现删除记录时的提示效果
2013/12/05 Javascript
JavaScript中对循环语句的优化技巧深入探讨
2014/06/06 Javascript
Nodejs学习笔记之NET模块
2015/01/13 NodeJs
jquery实现删除一个元素后面的所有元素功能
2015/12/21 Javascript
js中flexible.js实现淘宝弹性布局方案
2020/06/23 Javascript
JavaScript实现图片滑动切换的代码示例分享
2016/03/06 Javascript
浅谈jquery的map()和each()方法
2016/06/12 Javascript
javascript验证香港身份证的格式或真实性
2017/02/07 Javascript
详解基于Bootstrap+angular的一个豆瓣电影app
2017/06/26 Javascript
js轮播图的插件化封装详解
2017/07/17 Javascript
JS传播事件、取消事件默认行为、阻止事件传播详解
2017/08/14 Javascript
vue中如何去掉空格的方法实现
2018/11/09 Javascript
javascript获取select值的方法完整实例
2019/06/20 Javascript
VUE实现移动端列表筛选功能
2019/08/23 Javascript
a标签调用js的方法总结
2019/09/05 Javascript
javascript 内存模型实例详解
2020/04/18 Javascript
[01:00:54]TI4正赛第二日开场
2014/07/20 DOTA
[47:12]TFT vs Secret Supermajor小组赛C组 BO3 第三场 6.3
2018/06/04 DOTA
[40:03]Liquid vs Optic 2018国际邀请赛淘汰赛BO3 第一场 8.21
2018/08/22 DOTA
python使用百度翻译进行中翻英示例
2014/04/14 Python
简化Python的Django框架代码的一些示例
2015/04/20 Python
Python3 加密(hashlib和hmac)模块的实现
2017/11/23 Python
python自动化生成IOS的图标
2018/11/13 Python
python中几种自动微分库解析
2019/08/29 Python
基于python及pytorch中乘法的使用详解
2019/12/27 Python
Python urlopen()和urlretrieve()用法解析
2020/01/07 Python
总结html5自定义属性有哪些
2020/04/01 HTML / CSS
大学社团活动总结
2014/04/26 职场文书
党员专题组织生活会发言材料
2014/10/17 职场文书
2014年计划生育协会工作总结
2014/11/14 职场文书
配置nginx 重定向到系统维护页面
2021/06/08 Servers
USB TYPE-C 或将成为所有智能手机充电标准
2022/04/21 数码科技