Python函数式编程指南:对生成器全面讲解


Posted in Python onNovember 19, 2019

生成器是迭代器,同时也并不仅仅是迭代器,不过迭代器之外的用途实在是不多,所以我们可以大声地说:生成器提供了非常方便的自定义迭代器的途径。

这是函数式编程指南的最后一篇,似乎拖了一个星期才写好,嗯……

1. 生成器(generator)

1.1. 生成器简介

首先请确信,生成器就是一种迭代器。生成器拥有next方法并且行为与迭代器完全相同,这意味着生成器也可以用于Python的for循环中。另外,对于生成器的特殊语法支持使得编写一个生成器比自定义一个常规的迭代器要简单不少,所以生成器也是最常用到的特性之一。

从Python 2.5开始,[PEP 342:通过增强生成器实现协同程序]的实现为生成器加入了更多的特性,这意味着生成器还可以完成更多的工作。这部分我们会在稍后的部分介绍。

1.2. 生成器函数

1.2.1. 使用生成器函数定义生成器

如何获取一个生成器?首先来看一小段代码:

>>> def get_0_1_2():
... yield 0
... yield 1
... yield 2
...
>>> get_0_1_2
<function get_0_1_2 at 0x00B2CB70>

我们定义了一个函数get_0_1_2,并且可以查看到这确实是函数类型。但与一般的函数不同的是,get_0_1_2的函数体内使用了关键字yield,这使得get_0_1_2成为了一个生成器函数。生成器函数的特性如下:

调用生成器函数将返回一个生成器;

>>> generator = get_0_1_2()
>>> generator
<generator object get_0_1_2 at 0x00B1C7D8>

第一次调用生成器的next方法时,生成器才开始执行生成器函数(而不是构建生成器时),直到遇到yield时暂停执行(挂起),并且yield的参数将作为此次next方法的返回值;

>>> generator.next()
0

之后每次调用生成器的next方法,生成器将从上次暂停执行的位置恢复执行生成器函数,直到再次遇到yield时暂停,并且同样的,yield的参数将作为next方法的返回值;

>>> generator.next()
1
>>> generator.next()
2

如果当调用next方法时生成器函数结束(遇到空的return语句或是到达函数体末尾),则这次next方法的调用将抛出StopIteration异常(即for循环的终止条件);

>>> generator.next()
Traceback (most recent call last):
 File "<stdin>", line 1, in <module>
StopIteration

生成器函数在每次暂停执行时,函数体内的所有变量都将被封存(freeze)在生成器中,并将在恢复执行时还原,并且类似于闭包,即使是同一个生成器函数返回的生成器,封存的变量也是互相独立的。

我们的小例子中并没有用到变量,所以这里另外定义一个生成器来展示这个特点:

>>> def fibonacci():
... a = b = 1
... yield a
... yield b
... while True:
... a, b = b, a+b
... yield b
...
>>> for num in fibonacci():
... if num > 100: break
... print num,
...
1 1 2 3 5 8 13 21 34 55 89

看到while True可别太吃惊,因为生成器可以挂起,所以是延迟计算的,无限循环并没有关系。这个例子中我们定义了一个生成器用于获取斐波那契数列。

1.2.2. 生成器函数的FAQ

接下来我们来讨论一些关于生成器的有意思的话题。

你的例子里生成器函数都没有参数,那么生成器函数可以带参数吗?

当然可以啊亲,而且它支持函数的所有参数形式。要知道生成器函数也是函数的一种:)

>>> def counter(start=0):
... while True:
... yield start
... start += 1
...

这是一个从指定数开始的计数器。

既然生成器函数也是函数,那么它可以使用return输出返回值吗?

不行的亲,是这样的,生成器函数已经有默认的返回值——生成器了,你不能再另外给一个返回值;对,即使是return None也不行。但是它可以使用空的return语句结束。如果你坚持要为它指定返回值,那么Python将在定义的位置赠送一个语法错误异常,就像这样:

>>> def i_wanna_return():
... yield None
... return None
...
 File "<stdin>", line 3
SyntaxError: 'return' with argument inside generator

好吧,那人家需要确保释放资源,需要在try...finally中yield,这会是神马情况?(我就是想玩你)我在finally中还yield了一次!

Python会在真正离开try...finally时再执行finally中的代码,而这里遗憾地告诉你,暂停不算哦!所以结局你也能猜到吧!

>>> def play_u():
... try:
... yield 1
... yield 2
... yield 3
... finally:
... yield 0
...
>>> for val in play_u(): print val,
...
1 2 3 0

*这与return的情况不同。return是真正的离开代码块,所以会在return时立刻执行finally子句。

*另外,“在带有finally子句的try块中yield”定义在PEP 342中,这意味着只有Python 2.5以上版本才支持这个语法,在Python 2.4以下版本中会得到语法错误异常。

如果我需要在生成器的迭代过程中接入另一个生成器的迭代怎么办?写成下面这样好傻好天真。。

>>> def sub_generator():
... yield 1
... yield 2
... for val in counter(10): yield val
...

这种情况的语法改进已经被定义在[PEP 380:委托至子生成器的语法]中,据说会在Python 3.3中实现,届时也可能回馈到2.x中。实现后,就可以这么写了:

>>> def sub_generator():
... yield 1
... yield 2
... yield from counter(10)
 File "<stdin>", line 4
 yield from counter(10)
  ^
SyntaxError: invalid syntax

看到语法错误木有?现在我们还是天真一点吧~

有更多问题?请回复此文:)

1.3. 协同程序(coroutine)

协同程序(协程)一般来说是指这样的函数:

彼此间有不同的局部变量、指令指针,但仍共享全局变量;

可以方便地挂起、恢复,并且有多个入口点和出口点;

多个协同程序间表现为协作运行,如A的运行过程中需要B的结果才能继续执行。

协程的特点决定了同一时刻只能有一个协同程序正在运行(忽略多线程的情况)。得益于此,协程间可以直接传递对象而不需要考虑资源锁、或是直接唤醒其他协程而不需要主动休眠,就像是内置了锁的线程。在符合协程特点的应用场景,使用协程无疑比使用线程要更方便。

从另一方面说,协程无法并发其实也将它的应用场景限制在了一个很狭窄的范围,这个特点使得协程更多的被拿来与常规函数进行比较,而不是与线程。当然,线程比协程复杂许多,功能也更强大,所以我建议大家牢牢地掌握线程即可:Python线程指南分享

这一节里我也就不列举关于协程的例子了,以下介绍的方法了解即可。

Python 2.5对生成器的增强实现了协程的其他特点,在这个版本中,生成器加入了如下方法:

send(value):

send是除next外另一个恢复生成器的方法。Python 2.5中,yield语句变成了yield表达式,这意味着yield现在可以有一个值,而这个值就是在生成器的send方法被调用从而恢复执行时,调用send方法的参数。

>>> def repeater():
... n = 0
... while True:
... n = (yield n)
...
>>> r = repeater()
>>> r.next()
0
>>> r.send(10)
10

*调用send传入非None值前,生成器必须处于挂起状态,否则将抛出异常。不过,未启动的生成器仍可以使用None作为参数调用send。

*如果使用next恢复生成器,yield表达式的值将是None。

close():

这个方法用于关闭生成器。对关闭的生成器后再次调用next或send将抛出StopIteration异常。

throw(type, value=None, traceback=None):

这个方法用于在生成器内部(生成器的当前挂起处,或未启动时在定义处)抛出一个异常。

*别为没见到协程的例子遗憾,协程最常见的用处其实就是生成器。

1.4. 一个有趣的库:pipe

这一节里我要向诸位简要介绍pipe。pipe并不是Python内置的库,如果你安装了easy_install,直接可以安装它,否则你需要自己下载它:http://pypi.python.org/pypi/pipe

之所以要介绍这个库,是因为它向我们展示了一种很有新意的使用迭代器和生成器的方式:流。pipe将可迭代的数据看成是流,类似于linux,pipe使用'|'传递数据流,并且定义了一系列的“流处理”函数用于接受并处理数据流,并最终再次输出数据流或者是将数据流归纳得到一个结果。我们来看一些例子。

第一个,非常简单的,使用add求和:

>>> from pipe import *
>>> range(5) | add
10

求偶数和需要使用到where,作用类似于内建函数filter,过滤出符合条件的元素:

>>> range(5) | where(lambda x: x % 2 == 0) | add
6

还记得我们定义的斐波那契数列生成器吗?求出数列中所有小于10000的偶数和需要用到take_while,与itertools的同名函数有类似的功能,截取元素直到条件不成立:

>>> fib = fibonacci
>>> fib() | where(lambda x: x % 2 == 0)\
... | take_while(lambda x: x < 10000)\
... | add
3382

需要对元素应用某个函数可以使用select,作用类似于内建函数map;需要得到一个列表,可以使用as_list:

>>> fib() | select(lambda x: x ** 2) | take_while(lambda x: x < 100) | as_list
[1, 1, 4, 9, 25, 64]

pipe中还包括了更多的流处理函数。你甚至可以自己定义流处理函数,只需要定义一个生成器函数并加上修饰器Pipe。如下定义了一个获取元素直到索引不符合条件的流处理函数:

>>> @Pipe
... def take_while_idx(iterable, predicate):
... for idx, x in enumerate(iterable):
... if predicate(idx): yield x
... else: return
...

使用这个流处理函数获取fib的前10个数字:

>>> fib() | take_while_idx(lambda x: x < 10) | as_list
[1, 1, 2, 3, 5, 8, 13, 21, 34, 55]

更多的函数就不在这里介绍了,你可以查看pipe的源文件,总共600行不到的文件其中有300行是文档,文档中包含了大量的示例。

pipe实现起来非常简单,使用Pipe装饰器,将普通的生成器函数(或者返回迭代器的函数)代理在一个实现了__ror__方法的普通类实例上即可,但是这种思路真的很有趣。

函数式编程指南全文到这里就全部结束了,希望这一系列文章能给你带来帮助。希望大家都能看到一些结构式编程之外的编程方式,并且能够熟练地在恰当的地方使用 :)

明天我会整理一个目录放上来方便查看,并且列出一些供参考的文章。遗憾的是这些文章几乎都是英文的,请努力学习英语吧 - -#

这篇Python函数式编程指南:对生成器全面讲解就是小编分享给大家的全部内容了,给大家一个参考,希望大家多多支持三水点靠木。

Python 相关文章推荐
python基础教程之元组操作使用详解
Mar 25 Python
Django中模版的子目录与include标签的使用方法
Jul 16 Python
Python3使用requests登录人人影视网站的方法
May 11 Python
windows及linux环境下永久修改pip镜像源的方法
Nov 28 Python
Python中的__slots__示例详解
Jul 06 Python
Python编程实现二分法和牛顿迭代法求平方根代码
Dec 04 Python
python自动化测试之如何解析excel文件
Jun 27 Python
Django使用模板后无法找到静态资源文件问题解决
Jul 19 Python
python接口调用已训练好的caffe模型测试分类方法
Aug 26 Python
python Manager 之dict KeyError问题的解决
Dec 21 Python
解决pytorch报错:AssertionError: Invalid device id的问题
Jan 10 Python
python 实现在shell窗口中编写print不向屏幕输出
Feb 19 Python
wxPython电子表格功能wx.grid实例教程
Nov 19 #Python
python 实现return返回多个值
Nov 19 #Python
wxPython实现带颜色的进度条
Nov 19 #Python
Python使用Pandas读写Excel实例解析
Nov 19 #Python
pycharm修改file type方式
Nov 19 #Python
wxPython实现列表增删改查功能
Nov 19 #Python
python ctypes库2_指定参数类型和返回类型详解
Nov 19 #Python
You might like
杏林同学录(一)
2006/10/09 PHP
php中magic_quotes_gpc对unserialize的影响分析
2014/12/16 PHP
php_pdo 预处理语句详解
2016/11/21 PHP
PHP addcslashes()函数讲解
2019/02/03 PHP
YII2框架使用控制台命令的方法分析
2020/03/18 PHP
js分页代码分享
2014/04/28 Javascript
鼠标悬浮显示二级菜单效果的jquery实现
2014/10/29 Javascript
jQuery实现响应浏览器缩放大小并改变背景颜色
2014/10/31 Javascript
javaScript的函数对象的声明详解
2015/02/06 Javascript
JS实现上下左右对称的九九乘法表
2016/02/22 Javascript
深入理解jQuery中的事件冒泡
2016/05/24 Javascript
JavaScript数值千分位格式化的两种简单实现方法
2016/08/01 Javascript
使用jquery实现的循环连续可停顿滚动实例
2016/11/23 Javascript
jQuery+C#实现参数RSA加密传输功能【附jsencrypt.js下载】
2017/06/26 jQuery
详解Angular2学习笔记之Html属性绑定
2018/01/03 Javascript
JavaScript实现封闭区域布尔运算的示例代码
2018/06/25 Javascript
解决layui前端框架 form表单,table表等内置控件不显示的问题
2018/08/19 Javascript
浅析微信扫码登录原理(小结)
2018/10/29 Javascript
js如何获取图片url的Blob值并预览示例代码
2019/03/07 Javascript
解决layui弹框失效的问题
2019/09/09 Javascript
微信小程序8种数据通信的方式小结
2020/02/03 Javascript
浅谈JSON5解决了JSON的两大痛点
2020/12/14 Javascript
Python切片知识解析
2016/03/06 Python
浅析Python中的for 循环
2016/06/09 Python
win10 64bit下python NLTK安装教程
2018/09/19 Python
pandas筛选某列出现编码错误的解决方法
2018/11/07 Python
对python 操作solr索引数据的实例详解
2018/12/07 Python
Python实现网站表单提交和模板
2019/01/15 Python
Python3 ID3决策树判断申请贷款是否成功的实现代码
2020/05/21 Python
纯CSS3实现扇形动画菜单(简化版)实例源码
2017/01/17 HTML / CSS
BIFFI美国站:意大利BIFFI BOUTIQUES豪华多品牌时装零售公司
2020/02/11 全球购物
JDK安装目录下有哪些内容
2014/08/25 面试题
一些Solaris面试题
2015/12/22 面试题
赔偿协议书
2015/01/27 职场文书
2015年高中生国庆节演讲稿
2015/07/30 职场文书
Win11 Beta 22621.601 和 22622.601今日发布 KB5017384修复内容汇总
2022/09/23 数码科技