举例详解Python中yield生成器的用法


Posted in Python onAugust 05, 2015

yield是生成的意思,但是在python中则是作为生成器理解,生成器的用处主要可以迭代,这样简化了很多运算模型(还不是很了解是如何简化的)。
yield是一个表达式,是有返回值的.
当一个函数中含有yield时,它不再是一个普通的函数,而是一个生成器.当该函数被调用时不会自动执行,而是暂停,见第一个例子:
例1:

>>> def mygenerator():
...  print 'start...'
...  yield 5
... 
>>> mygenerator()   //在此处调用,并没有打印出start...说明存在yield的函数没有被运行,即暂停
<generator object mygenerator at 0xb762502c>
>>> mygenerator().next()  //调用next()即可让函数运行.
start...
5
>>>

如一个函数中出现多个yield则next()会停止在下一个yield前,见例2:
例2:

>>> def mygenerator():
...  print 'start...'
...  yield 5
... 
>>> mygenerator()   //在此处调用,并没有打印出start...说明存在yield的函数没有被运行,即暂停
<generator object mygenerator at 0xb762502c>
>>> mygenerator().next()  //调用next()即可让函数运行.
start...
5
>>>

为什么yield 5会输出5,yield 23会输出23?
我们猜测可能是因为yield是表达式,存在返回值.
那么这是否可以认为yield 5的返回值一定是5吗?实际上并不是这样,这个与send函数存在一定的关系,这个函数实质上与next()是相似的,区别是send是传递yield表达式的值进去,而next不能传递特定的值,只能传递None进去,因此可以认为g.next()和g.send(None)是相同的。见例3:
例3:

>>> def fun():
...  print 'start...'
...  m = yield 5
...  print m
...  print 'middle...'
...  d = yield 12
...  print d
...  print 'end...'
... 
>>> m = fun()    //创建一个对象
>>> m.next()    //会使函数执行到下一个yield前
start...
5
>>> m.send('message')  //利用send()传递值
message     //send()传递进来的 
middle...
12
>>> m.next()
None      //可见next()返回值为空
end...
Traceback (most recent call last):
 File "<stdin>", line 1, in <module>
StopIteration

在multiprocess中的使用

python在处理数据的时候,memory-heavy 的数据往往会导致程序没办反运行或者运行期间服务器其他程序效率受到影响。这种情况往往会把数据集合变为通过genertor来遍历。

但同时如我们所知,generoter看似只能被单进程消费,这样效率很低。
generator 可以被pool.map消费。

看一下pool.py的源码。

for i, task in enumerate(taskseq):
  ...
  try:
   put(task)
  except IOError:
   debug('could not put task on queue')
   break

实际是先将generator全部消费掉放到queue中。然后通过map来并行。这样是解决了使用map来并行。

但是依然没有解决占用内存的问题。这里有两步占用内存。

  1.     第一步是全部消费掉的generator。
  2.     第二步并行运算全部data。

解决第一个问题,通过部分消费generator来达到。
解决第二个问题,可以通过imap来达到.

示例代码如下:

import multiprocessing as mp
import itertools
import time


def g():
 for el in xrange(50):
  print el
  yield el

import os

def f(x):
 time.sleep(1)
 print str(os.getpid()) +" "+ str(x)
 return x * x

if __name__ == '__main__':
 pool = mp.Pool(processes=4)    # start 4 worker processes
 go = g()
 result = []
 N = 11
 while True:
  g2 = pool.imap(f, itertools.islice(go, N))
  if g2:
   for i in g2:
    result.append(i)
    time.sleep(1)
  else:
   break
 print(result)

ps: 使用注意事项。在produce数据的时候,尽量少做操作,应为即使是map也是单线程的来消费数据。所以尽量把操作放到map中作。这样才能更好的利用多进程提高效率。

Python 相关文章推荐
Python判断某个用户对某个文件的权限
Oct 13 Python
python绘制直线的方法
Jun 30 Python
Python快速转换numpy数组中Nan和Inf的方法实例说明
Feb 21 Python
Django用户认证系统 Web请求中的认证解析
Aug 02 Python
Python适配器模式代码实现解析
Aug 02 Python
Django获取model中的字段名和字段的verbose_name方式
May 19 Python
Python函数的迭代器与生成器的示例代码
Jun 18 Python
利用python对mysql表做全局模糊搜索并分页实例
Jul 12 Python
python实现梯度下降算法的实例详解
Aug 17 Python
Python3 + Appium + 安卓模拟器实现APP自动化测试并生成测试报告
Jan 27 Python
python中%格式表达式实例用法
Jun 18 Python
pandas求平均数和中位数的方法实例
Aug 04 Python
Python中return语句用法实例分析
Aug 04 #Python
python函数形参用法实例分析
Aug 04 #Python
Python简明入门教程
Aug 04 #Python
将Python代码打包为jar软件的简单方法
Aug 04 #Python
python函数局部变量用法实例分析
Aug 04 #Python
python删除列表内容
Aug 04 #Python
解决Python传递中文参数的问题
Aug 04 #Python
You might like
php中利用post传递字符串重定向的实现代码
2011/04/21 PHP
php 使用curl模拟登录人人(校内)网的简单实例
2016/06/06 PHP
php 实现301重定向跳转实例代码
2016/07/18 PHP
YUI 读码日记之 YAHOO.util.Dom - Part.1
2008/03/22 Javascript
JS 密码强度验证(兼容IE,火狐,谷歌)
2010/03/15 Javascript
ajax java 实现自动完成功能
2012/12/19 Javascript
javascript通过className来获取元素的简单示例代码
2014/01/10 Javascript
JavaScript保留两位小数的2个自定义函数
2014/05/05 Javascript
JS的数组迭代方法
2015/02/05 Javascript
分享我的jquery实现下拉菜单心的
2015/11/29 Javascript
vue-cli webpack 开发环境跨域详解
2017/05/18 Javascript
Javascript中的getter和setter初识
2017/08/17 Javascript
Vue表单之v-model绑定下拉列表功能
2019/05/14 Javascript
JavaScript本地储存:localStorage、sessionStorage、cookie的使用
2020/10/13 Javascript
[05:29]2014DOTA2国际邀请赛 赛后专访:LGDNewbee顺利过关
2014/07/13 DOTA
[52:41]OG vs IG 2018国际邀请赛小组赛BO2 第二场 8.18
2018/08/20 DOTA
[04:00]黄浦江畔,再会英雄——完美世界DOTA2 TI9应援视频
2019/07/31 DOTA
Python中的异常处理try/except/finally/raise用法分析
2019/02/28 Python
python算法与数据结构之单链表的实现代码
2019/06/27 Python
PyTorch的SoftMax交叉熵损失和梯度用法
2020/01/15 Python
Python使用扩展库pywin32实现批量文档打印实例
2020/04/09 Python
python Yaml、Json、Dict之间的转化
2020/10/19 Python
python 实现波浪滤镜特效
2020/12/02 Python
python中_del_还原数据的方法
2020/12/09 Python
一款纯css3实现的竖形二级导航的实例教程
2014/12/11 HTML / CSS
通过CSS3的object-fit来调整图片适配尺寸的技巧简介
2016/02/27 HTML / CSS
Sahajan美国:阿育吠陀护肤品牌
2021/01/09 全球购物
在校硕士自我鉴定
2014/01/23 职场文书
会计岗位职责范本
2014/03/07 职场文书
银行竞聘演讲稿
2014/05/16 职场文书
第一批党的群众路线教育实践活动总结报告
2014/07/03 职场文书
优秀党员学习焦裕禄精神思想汇报范文
2014/09/10 职场文书
单位实习鉴定评语
2015/01/04 职场文书
劳资员岗位职责
2015/02/13 职场文书
2015年高三班主任工作总结
2015/05/21 职场文书
2019如何书写演讲稿?
2019/07/01 职场文书