协程Python 中实现多任务耗资源最小的方式


Posted in Python onOctober 19, 2020

协程,又称微线程,纤程。英文名 Coroutine。

协程是 Python 中另外一种实现多任务的方式,只不过比线程更小,占用更小执行单元(理解为需要的资源)。

为啥说它是一个执行单元,因为它自带 CPU 上下文。这样只要在合适的时机, 我们可以把一个协程 切换到另一个协程。 只要这个过程中保存或恢复 CPU上下文那么程序还是可以运行的。

通俗的理解:在一个线程中的某个函数,可以在任何地方保存当前函数的一些临时变量等信息,然后切换到另外一个函数中执行,注意不是通过调用函数的方式做到的,并且切换的次数以及什么时候再切换到原来的函数都由开发者自己确定。

协程和线程差异

在实现多任务时, 线程切换从系统层面远不止保存和恢复 CPU上下文这么简单。

操作系统为了程序运行的高效性每个线程都有自己缓存 Cache 等等数据,操作系统还会帮你做这些数据的恢复操作,所以线程的切换非常耗性能。

但是协程的切换只是单纯的操作 CPU 的上下文,所以一秒钟切换个上百万次系统都抗得住。

之前我们讲过 yield 关键字,现在就用它来实现多任务。

例子:

import time

def task_1():
  while True:
    print("--1--")
    time.sleep(0.5)
    yield

def task_2():
  while True:
    print("--2--")
    time.sleep(0.5)
    yield

def main():
  t1 = task_1()
  t2 = task_2()
  while True:
    next(t1)
    next(t2)

if __name__ == "__main__":
  main()

运行过程:

先让 t1 运行一会,当 t1 遇到 yield 的时候,再返回到 main() 循环的地方,然后执行 t2 , 当它遇到 yield 的时候,再次切换到 t1 中,这样 t1 和 t2 就交替运行,最终实现了多任务,协程。

运行结果:

协程Python 中实现多任务耗资源最小的方式

greenlet

为了更好使用协程来完成多任务,Python 中的 greenlet 模块对其封装,从而使得切换任务变的更加简单。

首先你要安装一下 greenlet 模块。

pip3 install greenlet
from greenlet import greenlet
import time

def test1():
  while True:
    print("---A--")
    gr2.switch()
    time.sleep(0.5)

def test2():
  while True:
    print("---B--")
    gr1.switch()
    time.sleep(0.5)

gr1 = greenlet(test1)
gr2 = greenlet(test2)

# 切换到gr1中运行
gr1.switch()

运行结果:

协程Python 中实现多任务耗资源最小的方式

和我们之前用 yield 实现的效果基本一样,greenlet 其实是对 yield 进行了简单的封装。

greenlet 实现多任务要比 yield 更简单,但是我们以后还是不用它。

上面例子中的延时是0.5秒,如果延迟是100秒,那么程序就会卡住100秒,就算有其他需要执行的任务,系统也不会切换过去,这100秒的时间是无法利用的。

这个问题下面来解决。

gevent

greenlet 已经实现了协程,但是还是得进行人工切换,是不是觉得太麻烦了。

Python 还有一个比 greenlet 更强大的并且能够自动切换任务的模块 gevent。

gevent 是对 greenlet 的再次封装。

其原理是当一个 greenlet 遇到 IO(指的是input output 输入输出,比如网络、文件操作等)操作时,比如访问网络,就自动切换到其他的 greenlet,等到 IO 操作完成,再在适当的时候切换回来继续执行。

由于 IO 操作非常耗时,经常使程序处于等待状态,有了gevent 为我们自动切换协程,就保证总有 greenlet 在运行,而不是等待 IO。

首先还是得先安装 gevent。

pip3 install gevent

例子:

import gevent

def f(n):
  for i in range(n):
    print(gevent.getcurrent(), i)

g1 = gevent.spawn(f, 3)
g2 = gevent.spawn(f, 3)
g3 = gevent.spawn(f, 3)
g1.join()
g2.join()
g3.join()

运行结果:

<Greenlet at 0x35aae40: f(3)> 0
<Greenlet at 0x35aae40: f(3)> 1
<Greenlet at 0x35aae40: f(3)> 2
<Greenlet at 0x374a780: f(3)> 0
<Greenlet at 0x374a780: f(3)> 1
<Greenlet at 0x374a780: f(3)> 2
<Greenlet at 0x374a810: f(3)> 0
<Greenlet at 0x374a810: f(3)> 1
<Greenlet at 0x374a810: f(3)> 2

可以看到,3个 greenlet 是依次运行而不是交替运行。

这还无法判断 gevent 是否实现了多任务的效果,最好的判断情况是在运行结果中 0 1 2 不按顺序出现。

在 gevent 的概念中,我们提到 gevent 在遇到延时的时候会自动切换任务。

那么,我们先给上面的例子添加延时,再看效果。

import gevent
import time

def f(n):
  for i in range(n):
    print(gevent.getcurrent(), i)
    time.sleep(0.5)

g1 = gevent.spawn(f, 3)
g2 = gevent.spawn(f, 3)
g3 = gevent.spawn(f, 3)
g1.join()
g2.join()
g3.join()

运行结果:

<Greenlet at 0x36aae40: f(3)> 0
<Greenlet at 0x36aae40: f(3)> 1
<Greenlet at 0x36aae40: f(3)> 2
<Greenlet at 0x384a780: f(3)> 0
<Greenlet at 0x384a780: f(3)> 1
<Greenlet at 0x384a780: f(3)> 2
<Greenlet at 0x384a810: f(3)> 0
<Greenlet at 0x384a810: f(3)> 1
<Greenlet at 0x384a810: f(3)> 2

在添加了延时之后,运行结果并没有改变。

其实,gevent 要的不是 time.sleep() 的延时,而是 gevent.sleep() 的延时。

import gevent

def f(n):
  for i in range(n):
    print(gevent.getcurrent(), i)
    gevent.sleep(0.5)

g1 = gevent.spawn(f, 3)
g2 = gevent.spawn(f, 3)
g3 = gevent.spawn(f, 3)
g1.join()
g2.join()
g3.join()

join 还有一种更简单的写法。

import time
import gevent

def f(n):
  for i in range(n):
    print(gevent.getcurrent(), i)
    gevent.sleep(0.5)

gevent.joinall([
  gevent.spawn(f, 3),
  gevent.spawn(f, 3),
  gevent.spawn(f, 3)
])

一般都是后面的这种写法。

运行结果:

<Greenlet at 0x2e5ae40: f(3)> 0
<Greenlet at 0x2ffa780: f(3)> 0
<Greenlet at 0x2ffa810: f(3)> 0
<Greenlet at 0x2e5ae40: f(3)> 1
<Greenlet at 0x2ffa780: f(3)> 1
<Greenlet at 0x2ffa810: f(3)> 1
<Greenlet at 0x2e5ae40: f(3)> 2
<Greenlet at 0x2ffa780: f(3)> 2
<Greenlet at 0x2ffa810: f(3)> 2

这下终于实现多任务的效果了, gevent 在遇到延时的时候,就自动切换到其他任务。

这里是将 time 中的 sleep 换成了 gevent 中的 sleep。

那如果有网络程序,网络程序中也有许多堵塞,比如 connect, recv,accept,需要不需要换成 gevent 中的对应方法。

理论上来说,是要换的。如果想用 gevent,那么就要把所有的延时操作,堵塞这一类的函数,统统换成 gevent 中的对应方法。

那有个问题,万一我的代码已经写了10万行了,这换起来怎么破......

有什么办法不需要手动修改么,有,打个补丁即可。

import time
import gevent
from gevent import monkey

# 有耗时操作时需要
# 将程序中用到的耗时操作的代码,换为gevent中自己实现的模块
monkey.patch_all() 

def f(n):
  for i in range(n):
    print(gevent.getcurrent(), i)
    time.sleep(0.5)

g1 = gevent.spawn(f, 3)
g2 = gevent.spawn(f, 3)
g3 = gevent.spawn(f, 3)
g1.join()
g2.join()
g3.join()

monkey.patch_all() 会自动去检查代码,将所有会产生延时堵塞的方法,都自动换成 gevent 中的方法。

运行结果:

<Greenlet at 0x3dd91e0: f(3)> 0
<Greenlet at 0x3dd9810: f(3)> 0
<Greenlet at 0x3dd99c0: f(3)> 0
<Greenlet at 0x3dd91e0: f(3)> 1
<Greenlet at 0x3dd9810: f(3)> 1
<Greenlet at 0x3dd99c0: f(3)> 1
<Greenlet at 0x3dd91e0: f(3)> 2
<Greenlet at 0x3dd9810: f(3)> 2
<Greenlet at 0x3dd99c0: f(3)> 2

总结:

通过利用延时的时间去做其他任务,把时间都利用起来,这就是协程最大的意义。

到此这篇关于协程Python 中实现多任务耗资源最小的方式的文章就介绍到这了,更多相关Python多任务耗资源最小方式内容请搜索三水点靠木以前的文章或继续浏览下面的相关文章希望大家以后多多支持三水点靠木!

Python 相关文章推荐
python基于urllib实现按照百度音乐分类下载mp3的方法
May 25 Python
Python中Iterator迭代器的使用杂谈
Jun 20 Python
Python中你应该知道的一些内置函数
Mar 31 Python
Python处理Excel文件实例代码
Jun 20 Python
python实现图像识别功能
Jan 29 Python
python 接收处理外带的参数方法
Dec 03 Python
python修改字典键(key)的方法
Aug 05 Python
基于django传递数据到后端的例子
Aug 16 Python
python调用Matplotlib绘制分布点图
Oct 18 Python
sklearn-SVC实现与类参数详解
Dec 10 Python
使用python采集Excel表中某一格数据
May 14 Python
Python调用JavaScript代码的方法
Oct 27 Python
python爬取音频下载的示例代码
Oct 19 #Python
Python爬虫教程知识点总结
Oct 19 #Python
自定义Django_rest_framework_jwt登陆错误返回的解决
Oct 18 #Python
如何利用python读取micaps文件详解
Oct 18 #Python
Python中Yield的基本用法
Oct 18 #Python
Anaconda+spyder+pycharm的pytorch配置详解(GPU)
Oct 18 #Python
Python通过format函数格式化显示值
Oct 17 #Python
You might like
重新封装zend_soap实现http连接安全认证的php代码
2011/01/12 PHP
centos 5.6 升级php到5.3的方法
2011/05/14 PHP
PHP+ajaxfileupload+jcrop插件完美实现头像上传剪裁
2014/06/09 PHP
用PHP去掉文件头的Unicode签名(BOM)方法
2017/06/22 PHP
支持汉转拼和拼音分词的PHP中文工具类ChineseUtil
2018/02/23 PHP
20个非常棒的Jquery实用工具 国外文章
2010/01/01 Javascript
javascript实现面向对象类的功能书写技巧
2010/03/07 Javascript
在一个js文件里远程调用jquery.js会在ie8下的一个奇怪问题
2010/11/28 Javascript
JavaScript字符串对象toLowerCase方法入门实例(用于把字母转换为小写)
2014/10/17 Javascript
Jquery api 速查表分享
2015/01/12 Javascript
jQuery插件实现表格隔行变色及鼠标滑过高亮显示效果代码
2016/02/25 Javascript
使用pcs api往免费的百度网盘上传下载文件的方法
2016/03/17 Javascript
类似于QQ的右滑删除效果的实现方法
2016/10/16 Javascript
JS函数多个参数默认值指定方法分析
2016/11/28 Javascript
es7学习教程之Decorators(修饰器)详解
2017/07/21 Javascript
关于jquery layui弹出层的使用方法
2018/04/21 jQuery
vue-cli2.9.3 详细教程
2018/04/23 Javascript
详解Vue的常用指令v-if, v-for, v-show,v-else, v-bind, v-on
2018/10/12 Javascript
js删除数组中某几项的方法总结
2019/01/16 Javascript
使用vue-router切换页面时,获取上一页url以及当前页面url的方法
2019/05/06 Javascript
解决vue初始化项目一直停在downloading template的问题
2020/11/09 Javascript
[48:48]VGJ.T vs Liquid 2018国际邀请赛小组赛BO2 第二场 8.19
2018/08/21 DOTA
python不换行之end=与逗号的意思及用途
2017/11/21 Python
Python实现将json文件中向量写入Excel的方法
2018/03/26 Python
Python3之简单搭建自带服务器的实例讲解
2018/06/04 Python
python pandas 对series和dataframe的重置索引reindex方法
2018/06/07 Python
python爬虫增加访问量的方法
2019/08/22 Python
python基于socket函数实现端口扫描
2020/05/28 Python
美国瑜伽服装和装备购物网站:Mukha Yoga
2019/02/22 全球购物
职业生涯规划书范文
2014/03/10 职场文书
授权委托书范本(单位)
2014/09/28 职场文书
2014年医德医风工作总结
2014/11/13 职场文书
关于国庆节的广播稿
2015/08/19 职场文书
2019消防宣传标语!
2019/07/10 职场文书
详解JS数组方法
2021/11/20 Javascript
Python matplotlib安装以及实现简单曲线的绘制
2022/04/26 Python