举例详解Python中yield生成器的用法


Posted in Python onAugust 05, 2015

yield是生成的意思,但是在python中则是作为生成器理解,生成器的用处主要可以迭代,这样简化了很多运算模型(还不是很了解是如何简化的)。
yield是一个表达式,是有返回值的.
当一个函数中含有yield时,它不再是一个普通的函数,而是一个生成器.当该函数被调用时不会自动执行,而是暂停,见第一个例子:
例1:

>>> def mygenerator():
...  print 'start...'
...  yield 5
... 
>>> mygenerator()   //在此处调用,并没有打印出start...说明存在yield的函数没有被运行,即暂停
<generator object mygenerator at 0xb762502c>
>>> mygenerator().next()  //调用next()即可让函数运行.
start...
5
>>>

如一个函数中出现多个yield则next()会停止在下一个yield前,见例2:
例2:

>>> def mygenerator():
...  print 'start...'
...  yield 5
... 
>>> mygenerator()   //在此处调用,并没有打印出start...说明存在yield的函数没有被运行,即暂停
<generator object mygenerator at 0xb762502c>
>>> mygenerator().next()  //调用next()即可让函数运行.
start...
5
>>>

为什么yield 5会输出5,yield 23会输出23?
我们猜测可能是因为yield是表达式,存在返回值.
那么这是否可以认为yield 5的返回值一定是5吗?实际上并不是这样,这个与send函数存在一定的关系,这个函数实质上与next()是相似的,区别是send是传递yield表达式的值进去,而next不能传递特定的值,只能传递None进去,因此可以认为g.next()和g.send(None)是相同的。见例3:
例3:

>>> def fun():
...  print 'start...'
...  m = yield 5
...  print m
...  print 'middle...'
...  d = yield 12
...  print d
...  print 'end...'
... 
>>> m = fun()    //创建一个对象
>>> m.next()    //会使函数执行到下一个yield前
start...
5
>>> m.send('message')  //利用send()传递值
message     //send()传递进来的 
middle...
12
>>> m.next()
None      //可见next()返回值为空
end...
Traceback (most recent call last):
 File "<stdin>", line 1, in <module>
StopIteration

在multiprocess中的使用

python在处理数据的时候,memory-heavy 的数据往往会导致程序没办反运行或者运行期间服务器其他程序效率受到影响。这种情况往往会把数据集合变为通过genertor来遍历。

但同时如我们所知,generoter看似只能被单进程消费,这样效率很低。
generator 可以被pool.map消费。

看一下pool.py的源码。

for i, task in enumerate(taskseq):
  ...
  try:
   put(task)
  except IOError:
   debug('could not put task on queue')
   break

实际是先将generator全部消费掉放到queue中。然后通过map来并行。这样是解决了使用map来并行。

但是依然没有解决占用内存的问题。这里有两步占用内存。

  1.     第一步是全部消费掉的generator。
  2.     第二步并行运算全部data。

解决第一个问题,通过部分消费generator来达到。
解决第二个问题,可以通过imap来达到.

示例代码如下:

import multiprocessing as mp
import itertools
import time


def g():
 for el in xrange(50):
  print el
  yield el

import os

def f(x):
 time.sleep(1)
 print str(os.getpid()) +" "+ str(x)
 return x * x

if __name__ == '__main__':
 pool = mp.Pool(processes=4)    # start 4 worker processes
 go = g()
 result = []
 N = 11
 while True:
  g2 = pool.imap(f, itertools.islice(go, N))
  if g2:
   for i in g2:
    result.append(i)
    time.sleep(1)
  else:
   break
 print(result)

ps: 使用注意事项。在produce数据的时候,尽量少做操作,应为即使是map也是单线程的来消费数据。所以尽量把操作放到map中作。这样才能更好的利用多进程提高效率。

Python 相关文章推荐
python使用ctypes模块调用windowsapi获取系统版本示例
Apr 17 Python
python通过urllib2获取带有中文参数url内容的方法
Mar 13 Python
python使用PyGame播放Midi和Mp3文件的方法
Apr 24 Python
Python计算三维矢量幅度的方法
Jun 15 Python
Python之csv文件从MySQL数据库导入导出的方法
Jun 21 Python
[原创]Python入门教程2. 字符串基本操作【运算、格式化输出、常用函数】
Oct 29 Python
python处理DICOM并计算三维模型体积
Feb 26 Python
python3人脸识别的两种方法
Apr 25 Python
Python3网络爬虫开发实战之极验滑动验证码的识别
Aug 02 Python
Python %r和%s区别代码实例解析
Apr 03 Python
解决使用python print打印函数返回值多一个None的问题
Apr 09 Python
python 中的@运算符使用
May 26 Python
Python中return语句用法实例分析
Aug 04 #Python
python函数形参用法实例分析
Aug 04 #Python
Python简明入门教程
Aug 04 #Python
将Python代码打包为jar软件的简单方法
Aug 04 #Python
python函数局部变量用法实例分析
Aug 04 #Python
python删除列表内容
Aug 04 #Python
解决Python传递中文参数的问题
Aug 04 #Python
You might like
php 显示指定路径下的图片
2009/10/29 PHP
解析PHP中的正则表达式以及模式匹配
2013/06/19 PHP
php缩小png图片不损失透明色的解决方法
2013/12/25 PHP
php实现的双向队列类实例
2014/09/24 PHP
php中常量DIRECTORY_SEPARATOR用法深入分析
2014/11/14 PHP
深入解析PHP中foreach语句控制数组循环的用法
2015/11/30 PHP
thinkPHP基于ajax实现的菜单与分页示例
2016/07/12 PHP
PHP在线打包下载功能示例
2016/10/15 PHP
php处理抢购类功能的高并发请求
2018/02/08 PHP
range 标准化之获取
2011/08/28 Javascript
解决window.opener=null;window.close(),只支持IE6不支持IE7,IE8的问题
2014/01/14 Javascript
浅析Node在构建超媒体API中的作用
2014/07/30 Javascript
jQuery的css()方法用法实例
2014/12/24 Javascript
用NodeJS实现批量查询地理位置的经纬度接口
2016/08/16 NodeJs
利用yarn代替npm管理前端项目模块依赖的方法详解
2017/09/04 Javascript
微信小程序MUI导航栏透明渐变功能示例(通过改变rgba的a值实现)
2019/01/24 Javascript
JS面向对象编程基础篇(二) 封装操作实例详解
2020/03/03 Javascript
python封装对象实现时间效果
2020/04/23 Python
python字符串替换第一个字符串的方法
2019/06/26 Python
pytorch绘制并显示loss曲线和acc曲线,LeNet5识别图像准确率
2020/01/02 Python
在tensorflow以及keras安装目录查询操作(windows下)
2020/06/19 Python
使用Keras建立模型并训练等一系列操作方式
2020/07/02 Python
使用anaconda安装pytorch的实现步骤
2020/09/03 Python
python中not、and和or的优先级与详细用法介绍
2020/11/03 Python
使用BeautifulSoup4解析XML的方法小结
2020/12/07 Python
scrapy实践之翻页爬取的实现
2021/01/05 Python
H&M美国官网:欧洲最大的服饰零售商
2016/09/07 全球购物
Marlies Dekkers内衣荷兰官方网店:荷兰奢侈内衣品牌
2020/03/27 全球购物
致短跑运动员广播稿
2014/01/09 职场文书
计算机数据库专业职业生涯规划书
2014/02/08 职场文书
建筑公司员工自我鉴定
2014/04/08 职场文书
保险公司开门红口号
2014/06/21 职场文书
环境工程专业自荐信范文
2014/06/24 职场文书
2015年复活节活动总结
2015/02/27 职场文书
巴黎圣母院读书笔记
2015/06/26 职场文书
Java版 单机五子棋
2022/05/04 Java/Android