举例详解Python中yield生成器的用法


Posted in Python onAugust 05, 2015

yield是生成的意思,但是在python中则是作为生成器理解,生成器的用处主要可以迭代,这样简化了很多运算模型(还不是很了解是如何简化的)。
yield是一个表达式,是有返回值的.
当一个函数中含有yield时,它不再是一个普通的函数,而是一个生成器.当该函数被调用时不会自动执行,而是暂停,见第一个例子:
例1:

>>> def mygenerator():
...  print 'start...'
...  yield 5
... 
>>> mygenerator()   //在此处调用,并没有打印出start...说明存在yield的函数没有被运行,即暂停
<generator object mygenerator at 0xb762502c>
>>> mygenerator().next()  //调用next()即可让函数运行.
start...
5
>>>

如一个函数中出现多个yield则next()会停止在下一个yield前,见例2:
例2:

>>> def mygenerator():
...  print 'start...'
...  yield 5
... 
>>> mygenerator()   //在此处调用,并没有打印出start...说明存在yield的函数没有被运行,即暂停
<generator object mygenerator at 0xb762502c>
>>> mygenerator().next()  //调用next()即可让函数运行.
start...
5
>>>

为什么yield 5会输出5,yield 23会输出23?
我们猜测可能是因为yield是表达式,存在返回值.
那么这是否可以认为yield 5的返回值一定是5吗?实际上并不是这样,这个与send函数存在一定的关系,这个函数实质上与next()是相似的,区别是send是传递yield表达式的值进去,而next不能传递特定的值,只能传递None进去,因此可以认为g.next()和g.send(None)是相同的。见例3:
例3:

>>> def fun():
...  print 'start...'
...  m = yield 5
...  print m
...  print 'middle...'
...  d = yield 12
...  print d
...  print 'end...'
... 
>>> m = fun()    //创建一个对象
>>> m.next()    //会使函数执行到下一个yield前
start...
5
>>> m.send('message')  //利用send()传递值
message     //send()传递进来的 
middle...
12
>>> m.next()
None      //可见next()返回值为空
end...
Traceback (most recent call last):
 File "<stdin>", line 1, in <module>
StopIteration

在multiprocess中的使用

python在处理数据的时候,memory-heavy 的数据往往会导致程序没办反运行或者运行期间服务器其他程序效率受到影响。这种情况往往会把数据集合变为通过genertor来遍历。

但同时如我们所知,generoter看似只能被单进程消费,这样效率很低。
generator 可以被pool.map消费。

看一下pool.py的源码。

for i, task in enumerate(taskseq):
  ...
  try:
   put(task)
  except IOError:
   debug('could not put task on queue')
   break

实际是先将generator全部消费掉放到queue中。然后通过map来并行。这样是解决了使用map来并行。

但是依然没有解决占用内存的问题。这里有两步占用内存。

  1.     第一步是全部消费掉的generator。
  2.     第二步并行运算全部data。

解决第一个问题,通过部分消费generator来达到。
解决第二个问题,可以通过imap来达到.

示例代码如下:

import multiprocessing as mp
import itertools
import time


def g():
 for el in xrange(50):
  print el
  yield el

import os

def f(x):
 time.sleep(1)
 print str(os.getpid()) +" "+ str(x)
 return x * x

if __name__ == '__main__':
 pool = mp.Pool(processes=4)    # start 4 worker processes
 go = g()
 result = []
 N = 11
 while True:
  g2 = pool.imap(f, itertools.islice(go, N))
  if g2:
   for i in g2:
    result.append(i)
    time.sleep(1)
  else:
   break
 print(result)

ps: 使用注意事项。在produce数据的时候,尽量少做操作,应为即使是map也是单线程的来消费数据。所以尽量把操作放到map中作。这样才能更好的利用多进程提高效率。

Python 相关文章推荐
python实现下载整个ftp目录的方法
Jan 17 Python
JSONLINT:python的json数据验证库实例解析
Nov 28 Python
Python中字典的浅拷贝与深拷贝用法实例分析
Jan 02 Python
基于python批量处理dat文件及科学计算方法详解
May 08 Python
Python返回数组/List长度的实例
Jun 23 Python
Linux下多个Python版本安装教程
Aug 15 Python
python 获取微信好友列表的方法(微信web)
Feb 21 Python
Flask框架工厂函数用法实例分析
May 25 Python
十分钟搞定pandas(入门教程)
Jun 21 Python
Kali Linux安装ipython2 和 ipython3的方法
Jul 11 Python
Ranorex通过Python将报告发送到邮箱的方法
Jan 12 Python
python空元组在all中返回结果详解
Dec 15 Python
Python中return语句用法实例分析
Aug 04 #Python
python函数形参用法实例分析
Aug 04 #Python
Python简明入门教程
Aug 04 #Python
将Python代码打包为jar软件的简单方法
Aug 04 #Python
python函数局部变量用法实例分析
Aug 04 #Python
python删除列表内容
Aug 04 #Python
解决Python传递中文参数的问题
Aug 04 #Python
You might like
PHP学习资料汇总与网址
2007/03/16 PHP
php array_map array_multisort 高效处理多维数组排序
2009/06/11 PHP
PHP的简易冒泡法代码分享
2012/08/28 PHP
php实现的发送带附件邮件类实例
2014/09/22 PHP
在Mac上编译安装PHP7的开发环境
2015/07/28 PHP
枚举JavaScript对象的函数
2006/12/22 Javascript
document.getElementById为空或不是对象的解决方法
2010/01/24 Javascript
Javascript 八进制转义字符(8进制)
2011/04/08 Javascript
toggle一个div显示或隐藏且可扩展成自定义下拉框
2013/09/12 Javascript
JS实现匀速运动的代码实例
2013/11/29 Javascript
JavaScript日期时间格式化函数分享
2014/05/05 Javascript
Angularjs基础知识及示例汇总
2015/01/22 Javascript
javascript实现可全选、反选及删除表格的方法
2015/05/15 Javascript
浅谈JavaScript字符串拼接
2015/06/25 Javascript
百度地图给map添加右键菜单(判断是否为marker)
2016/03/04 Javascript
AngularJS入门教程之AngularJS模型
2016/04/18 Javascript
js单页hash路由原理与应用实战详解
2017/08/14 Javascript
PHP 实现一种多文件上传的方法
2017/09/20 Javascript
CentOS环境中MySQL修改root密码方法
2018/01/07 Javascript
vue使用better-scroll实现下拉刷新、上拉加载
2018/11/23 Javascript
[02:20]DOTA2英雄基础教程 黑暗贤者
2013/12/19 DOTA
python实现对任意大小图片均匀切割的示例
2018/12/05 Python
Python Selenium 之关闭窗口close与quit的方法
2019/02/13 Python
详解Python对JSON中的特殊类型进行Encoder
2019/07/15 Python
python3.7 的新特性详解
2019/07/25 Python
python opencv将图片转为灰度图的方法示例
2019/07/31 Python
python matplotlib库绘制条形图练习题
2019/08/10 Python
TensorFlow打印输出tensor的值
2020/04/19 Python
基于CSS3 animation动画属性实现轮播图效果
2017/09/12 HTML / CSS
有个性的自我评价范文
2013/11/15 职场文书
现场施工员岗位职责
2014/03/10 职场文书
办公室班子四风问题对照检查材料
2014/10/04 职场文书
2014年中学生检讨书大全
2014/10/09 职场文书
婚礼答谢词范文
2015/09/29 职场文书
Python 多线程之threading 模块的使用
2021/04/14 Python
mysql查找连续出现n次以上的数字
2022/05/11 MySQL