举例详解Python中yield生成器的用法


Posted in Python onAugust 05, 2015

yield是生成的意思,但是在python中则是作为生成器理解,生成器的用处主要可以迭代,这样简化了很多运算模型(还不是很了解是如何简化的)。
yield是一个表达式,是有返回值的.
当一个函数中含有yield时,它不再是一个普通的函数,而是一个生成器.当该函数被调用时不会自动执行,而是暂停,见第一个例子:
例1:

>>> def mygenerator():
...  print 'start...'
...  yield 5
... 
>>> mygenerator()   //在此处调用,并没有打印出start...说明存在yield的函数没有被运行,即暂停
<generator object mygenerator at 0xb762502c>
>>> mygenerator().next()  //调用next()即可让函数运行.
start...
5
>>>

如一个函数中出现多个yield则next()会停止在下一个yield前,见例2:
例2:

>>> def mygenerator():
...  print 'start...'
...  yield 5
... 
>>> mygenerator()   //在此处调用,并没有打印出start...说明存在yield的函数没有被运行,即暂停
<generator object mygenerator at 0xb762502c>
>>> mygenerator().next()  //调用next()即可让函数运行.
start...
5
>>>

为什么yield 5会输出5,yield 23会输出23?
我们猜测可能是因为yield是表达式,存在返回值.
那么这是否可以认为yield 5的返回值一定是5吗?实际上并不是这样,这个与send函数存在一定的关系,这个函数实质上与next()是相似的,区别是send是传递yield表达式的值进去,而next不能传递特定的值,只能传递None进去,因此可以认为g.next()和g.send(None)是相同的。见例3:
例3:

>>> def fun():
...  print 'start...'
...  m = yield 5
...  print m
...  print 'middle...'
...  d = yield 12
...  print d
...  print 'end...'
... 
>>> m = fun()    //创建一个对象
>>> m.next()    //会使函数执行到下一个yield前
start...
5
>>> m.send('message')  //利用send()传递值
message     //send()传递进来的 
middle...
12
>>> m.next()
None      //可见next()返回值为空
end...
Traceback (most recent call last):
 File "<stdin>", line 1, in <module>
StopIteration

在multiprocess中的使用

python在处理数据的时候,memory-heavy 的数据往往会导致程序没办反运行或者运行期间服务器其他程序效率受到影响。这种情况往往会把数据集合变为通过genertor来遍历。

但同时如我们所知,generoter看似只能被单进程消费,这样效率很低。
generator 可以被pool.map消费。

看一下pool.py的源码。

for i, task in enumerate(taskseq):
  ...
  try:
   put(task)
  except IOError:
   debug('could not put task on queue')
   break

实际是先将generator全部消费掉放到queue中。然后通过map来并行。这样是解决了使用map来并行。

但是依然没有解决占用内存的问题。这里有两步占用内存。

  1.     第一步是全部消费掉的generator。
  2.     第二步并行运算全部data。

解决第一个问题,通过部分消费generator来达到。
解决第二个问题,可以通过imap来达到.

示例代码如下:

import multiprocessing as mp
import itertools
import time


def g():
 for el in xrange(50):
  print el
  yield el

import os

def f(x):
 time.sleep(1)
 print str(os.getpid()) +" "+ str(x)
 return x * x

if __name__ == '__main__':
 pool = mp.Pool(processes=4)    # start 4 worker processes
 go = g()
 result = []
 N = 11
 while True:
  g2 = pool.imap(f, itertools.islice(go, N))
  if g2:
   for i in g2:
    result.append(i)
    time.sleep(1)
  else:
   break
 print(result)

ps: 使用注意事项。在produce数据的时候,尽量少做操作,应为即使是map也是单线程的来消费数据。所以尽量把操作放到map中作。这样才能更好的利用多进程提高效率。

Python 相关文章推荐
python目录操作之python遍历文件夹后将结果存储为xml
Jan 27 Python
解决windows下Sublime Text 2 运行 PyQt 不显示的方法分享
Jun 18 Python
Python爬虫之模拟知乎登录的方法教程
May 25 Python
使用Python的turtle模块画图的方法
Nov 15 Python
Python中join函数简单代码示例
Jan 09 Python
使用CodeMirror实现Python3在线编辑器的示例代码
Jan 14 Python
在Pycharm中自动添加时间日期作者等信息的方法
Jan 16 Python
python爬虫-模拟微博登录功能
Sep 12 Python
使用Python函数进行模块化的实现
Nov 15 Python
Python代码生成视频的缩略图的实例讲解
Dec 22 Python
Python爬取数据并实现可视化代码解析
Aug 12 Python
Python网络编程之ZeroMQ知识总结
Apr 25 Python
Python中return语句用法实例分析
Aug 04 #Python
python函数形参用法实例分析
Aug 04 #Python
Python简明入门教程
Aug 04 #Python
将Python代码打包为jar软件的简单方法
Aug 04 #Python
python函数局部变量用法实例分析
Aug 04 #Python
python删除列表内容
Aug 04 #Python
解决Python传递中文参数的问题
Aug 04 #Python
You might like
php下实现农历日历的代码
2007/03/07 PHP
php5.3 goto函数介绍和示例
2014/03/21 PHP
教你如何解密 “ PHP 神盾解密工具 ”
2014/06/20 PHP
php中字符查找函数strpos、strrchr与strpbrk用法
2014/11/18 PHP
PHP实现通用alert函数的方法
2015/03/11 PHP
PHP数组操作――获取数组最后一个值的方法
2015/04/14 PHP
PHP调试及性能分析工具Xdebug详解
2017/02/09 PHP
php 与 nginx 的处理方式及nginx与php-fpm通信的两种方式
2018/09/28 PHP
PHP中ltrim()函数的用法与实例讲解
2019/03/28 PHP
一个高效的JavaScript压缩工具下载集合
2007/03/06 Javascript
juqery 学习之五 文档处理 插入
2011/02/11 Javascript
关于二级域名下使用一级域名下的COOKIE的问题
2011/11/07 Javascript
js数组的操作详解
2013/03/27 Javascript
javascript中的遍历for in 以及with的用法
2014/12/22 Javascript
基于JavaScript实现轮播图代码
2016/07/14 Javascript
第一次接触神奇的Bootstrap基础排版
2016/07/26 Javascript
js自调用匿名函数的三种写法(推荐)
2016/08/19 Javascript
jquery的checkbox,radio,select等方法小结
2016/08/30 Javascript
node.js学习之base64编码解码
2016/10/21 Javascript
node实现分片下载的示例代码
2018/10/17 Javascript
webpack 开发和生产并行设置的方法
2018/11/08 Javascript
Element UI框架中巧用树选择器的实现
2018/12/12 Javascript
[06:04]DOTA2英雄梦之声Vol19卓尔游侠
2014/06/20 DOTA
[01:39:04]DOTA2-DPC中国联赛 正赛 SAG vs CDEC BO3 第二场 2月1日
2021/03/11 DOTA
python实现查找excel里某一列重复数据并且剔除后打印的方法
2015/05/26 Python
Python 中 Meta Classes详解
2016/02/13 Python
使用python绘制常用的图表
2016/08/27 Python
解决IDEA 的 plugins 搜不到任何的插件问题
2020/05/04 Python
pycharm中如何自定义设置通过“ctrl+滚轮”进行放大和缩小实现方法
2020/09/16 Python
Europcar德国:全球汽车租赁领域的领导者
2018/08/15 全球购物
高二美术教学反思
2014/01/14 职场文书
学校对教师的评语
2014/04/28 职场文书
运动会广播稿100字
2014/09/14 职场文书
2015年八一建军节慰问信
2015/03/23 职场文书
关于分班的感言
2015/08/04 职场文书
年中了,该如何写好个人述职报告?
2019/07/02 职场文书