举例详解Python中yield生成器的用法


Posted in Python onAugust 05, 2015

yield是生成的意思,但是在python中则是作为生成器理解,生成器的用处主要可以迭代,这样简化了很多运算模型(还不是很了解是如何简化的)。
yield是一个表达式,是有返回值的.
当一个函数中含有yield时,它不再是一个普通的函数,而是一个生成器.当该函数被调用时不会自动执行,而是暂停,见第一个例子:
例1:

>>> def mygenerator():
...  print 'start...'
...  yield 5
... 
>>> mygenerator()   //在此处调用,并没有打印出start...说明存在yield的函数没有被运行,即暂停
<generator object mygenerator at 0xb762502c>
>>> mygenerator().next()  //调用next()即可让函数运行.
start...
5
>>>

如一个函数中出现多个yield则next()会停止在下一个yield前,见例2:
例2:

>>> def mygenerator():
...  print 'start...'
...  yield 5
... 
>>> mygenerator()   //在此处调用,并没有打印出start...说明存在yield的函数没有被运行,即暂停
<generator object mygenerator at 0xb762502c>
>>> mygenerator().next()  //调用next()即可让函数运行.
start...
5
>>>

为什么yield 5会输出5,yield 23会输出23?
我们猜测可能是因为yield是表达式,存在返回值.
那么这是否可以认为yield 5的返回值一定是5吗?实际上并不是这样,这个与send函数存在一定的关系,这个函数实质上与next()是相似的,区别是send是传递yield表达式的值进去,而next不能传递特定的值,只能传递None进去,因此可以认为g.next()和g.send(None)是相同的。见例3:
例3:

>>> def fun():
...  print 'start...'
...  m = yield 5
...  print m
...  print 'middle...'
...  d = yield 12
...  print d
...  print 'end...'
... 
>>> m = fun()    //创建一个对象
>>> m.next()    //会使函数执行到下一个yield前
start...
5
>>> m.send('message')  //利用send()传递值
message     //send()传递进来的 
middle...
12
>>> m.next()
None      //可见next()返回值为空
end...
Traceback (most recent call last):
 File "<stdin>", line 1, in <module>
StopIteration

在multiprocess中的使用

python在处理数据的时候,memory-heavy 的数据往往会导致程序没办反运行或者运行期间服务器其他程序效率受到影响。这种情况往往会把数据集合变为通过genertor来遍历。

但同时如我们所知,generoter看似只能被单进程消费,这样效率很低。
generator 可以被pool.map消费。

看一下pool.py的源码。

for i, task in enumerate(taskseq):
  ...
  try:
   put(task)
  except IOError:
   debug('could not put task on queue')
   break

实际是先将generator全部消费掉放到queue中。然后通过map来并行。这样是解决了使用map来并行。

但是依然没有解决占用内存的问题。这里有两步占用内存。

  1.     第一步是全部消费掉的generator。
  2.     第二步并行运算全部data。

解决第一个问题,通过部分消费generator来达到。
解决第二个问题,可以通过imap来达到.

示例代码如下:

import multiprocessing as mp
import itertools
import time


def g():
 for el in xrange(50):
  print el
  yield el

import os

def f(x):
 time.sleep(1)
 print str(os.getpid()) +" "+ str(x)
 return x * x

if __name__ == '__main__':
 pool = mp.Pool(processes=4)    # start 4 worker processes
 go = g()
 result = []
 N = 11
 while True:
  g2 = pool.imap(f, itertools.islice(go, N))
  if g2:
   for i in g2:
    result.append(i)
    time.sleep(1)
  else:
   break
 print(result)

ps: 使用注意事项。在produce数据的时候,尽量少做操作,应为即使是map也是单线程的来消费数据。所以尽量把操作放到map中作。这样才能更好的利用多进程提高效率。

Python 相关文章推荐
浅析Python中MySQLdb的事务处理功能
Sep 21 Python
python处理xml文件的方法小结
May 02 Python
对TensorFlow中的variables_to_restore函数详解
Jul 30 Python
python的xpath获取div标签内html内容,实现innerhtml功能的方法
Jan 02 Python
Python离线安装PIL 模块的方法
Jan 08 Python
pyhanlp安装介绍和简单应用
Feb 22 Python
python基于paramiko将文件上传到服务器代码实现
Jul 08 Python
使用浏览器访问python写的服务器程序
Oct 10 Python
解决pycharm中opencv-python导入cv2后无法自动补全的问题(不用作任何文件上的修改)
Mar 05 Python
Python如何对齐字符串
Jul 30 Python
Python lambda表达式原理及用法解析
Aug 18 Python
Python 数据科学 Matplotlib图库详解
Jul 07 Python
Python中return语句用法实例分析
Aug 04 #Python
python函数形参用法实例分析
Aug 04 #Python
Python简明入门教程
Aug 04 #Python
将Python代码打包为jar软件的简单方法
Aug 04 #Python
python函数局部变量用法实例分析
Aug 04 #Python
python删除列表内容
Aug 04 #Python
解决Python传递中文参数的问题
Aug 04 #Python
You might like
php笔记之:php数组相关函数的使用
2013/04/26 PHP
php的一个简单加密解密代码
2014/01/14 PHP
分享下页面关键字抓取www.icbase.com站点代码(带asp.net参数的)
2014/01/30 PHP
php动态生成版权所有信息的方法
2015/03/24 PHP
PHP伪造来源HTTP_REFERER的方法实例详解
2015/07/06 PHP
phpcms实现验证码替换及phpcms实现全站搜索功能教程详解
2017/12/13 PHP
Laravel5.1 框架Request请求操作常见用法实例分析
2020/01/04 PHP
JS 判断代码全收集
2009/04/28 Javascript
禁用Enter键表单自动提交实现代码
2014/05/22 Javascript
JavaScript中对象property的读取和写入方法介绍
2014/12/30 Javascript
JS限制文本框只能输入数字和字母方法
2015/02/28 Javascript
jQuery自定义组件(导入组件)
2016/11/08 Javascript
jQuery Checkbox 全选 反选的简单实例
2016/11/29 Javascript
js 显示日期时间的实例(时间过一秒加1)
2017/10/25 Javascript
vue2.5.2使用http请求获取静态json数据的实例代码
2018/02/27 Javascript
jquery.pagination.js分页使用教程
2018/10/23 jQuery
python基于mysql实现的简单队列以及跨进程锁实例详解
2014/07/07 Python
浅析Python中signal包的使用
2015/11/13 Python
浅谈python对象数据的读写权限
2016/09/12 Python
python实现简单爬虫功能的示例
2016/10/24 Python
Windows 7下Python Web环境搭建图文教程
2018/03/20 Python
Python实现手写一个类似django的web框架示例
2018/07/20 Python
在python中利用opencv简单做图片比对的方法
2019/01/24 Python
CSS3中的注音对齐属性ruby-align用法指南
2016/07/01 HTML / CSS
html5 更新图片颜色示例代码
2014/07/29 HTML / CSS
html5手机端页面可以向右滑动导致样式受影响的问题
2018/06/20 HTML / CSS
《鸿门宴》教学反思
2014/04/22 职场文书
党的群众路线教育实践活动查摆问题自查报告
2014/10/10 职场文书
2015年小学教导处工作总结
2015/05/26 职场文书
文明上网主题班会
2015/08/14 职场文书
2016学习全国教书育人楷模先进事迹心得体会
2016/01/21 职场文书
python xlwt模块的使用解析
2021/04/13 Python
golang import自定义包方式
2021/04/29 Golang
使用Oracle跟踪文件的问题详解
2021/06/28 Oracle
一篇文章弄清楚Ajax请求的五个步骤
2022/03/17 Javascript
Golang gRPC HTTP协议转换示例
2022/06/16 Golang