python 并发编程 非阻塞IO模型原理解析


Posted in Python onAugust 20, 2019

非阻塞IO(non-blocking IO)

Linux下,可以通过设置socket使其变为non-blocking。当对一个non-blocking socket执行读操作时,流程是这个样子:

python 并发编程 非阻塞IO模型原理解析

从图中可以看出,当用户进程发出read操作时,如果kernel中的数据还没有准备好,那么它并不会block用户进程,而是立刻返回一个error。从用户进程角度讲 ,它发起一个read操作后,并不需要等待,而是马上就得到了一个结果。用户进程判断结果是一个error时,它就知道数据还没有准备好,于是用户就可以在本次到下次再发起read询问的时间间隔内做其他事情,或者直接再次发送read操作。一旦kernel中的数据准备好了,并且又再次收到了用户进程的system call,那么它马上就将数据拷贝到了用户内存(这一阶段仍然是阻塞的,这段是本地拷贝,copy data ),然后返回。

也就是说非阻塞的recvform系统调用调用之后,进程并没有被阻塞,内核马上返回给进程,如果数据还没准备好,
此时会返回一个error。进程在返回之后,可以干点别的事情,然后再发起recvform系统调用。重复上面的过程,
循环往复的进行recvform系统调用。这个过程通常被称之为轮询。轮询检查内核数据,直到数据准备好,再拷贝数据到进程,
进行数据处理。需要注意,拷贝数据整个过程,进程仍然是属于阻塞的状态。
所以,在非阻塞式IO中,用户进程其实是需要不断的主动询问kernel操作系统内存 数据准备好了没有。

非阻塞IO示例

  • 设置socket接口为 非阻塞IO接口
  • 默认是True 为阻塞
  • server.setblocking(False)
  • 处理一下这个异常

BlockingIOError: [WinError 10035] 无法立即完成一个非阻止性套接字操作。

from socket import *
server = socket(AF_INET,SOCK_STREAM)
server.bind(('127.0.0.1',8000))
server.listen(5)
# 设置socket接口为 非阻塞IO接口
# 默认是True 为阻塞
server.setblocking(False)
print("starting...")
while True:
  try:
    conn,addr = server.accept()
    print(addr)

  except BlockingIOError:
    print("干其他的工作")
server.close()

执行结果,如上面的图,一直返回error消息

starting...
干其他的工作
干其他的工作
干其他的工作
干其他的工作

服务端 可以与 多个客户端建立连接,实现服务端可以不停的建立连接

from socket import *
server = socket(AF_INET,SOCK_STREAM)
server.bind(('127.0.0.1',8000))
server.listen(5)
# 设置socket接口为 非阻塞IO接口
# 默认是True 为阻塞
server.setblocking(False)
r_list = []
print("starting...")
while True:
  try:
    conn,addr = server.accept()
    r_list.append(conn)
    print(r_list)
  except BlockingIOError:
    pass
server.close()

起三个客户端与服务端建立连接

python 并发编程 非阻塞IO模型原理解析

r_list 存着所有建立的连接

有连接来,就建立连接,没有连接来,就抛出异常

实现IO非阻塞 并发 多个连接

from socket import *
server = socket(AF_INET,SOCK_STREAM)
server.bind(('127.0.0.1',8000))
server.listen(5)
# 设置socket接口为 非阻塞IO接口
# 默认是True 为阻塞
server.setblocking(False)
r_list = []
print("starting...")
while True:
  try:
    conn,addr = server.accept()
    r_list.append(conn)
    print(r_list)
  except BlockingIOError:
    # 定义删除连接列表
    del_rlist = []
    for conn in r_list:
      try:
        data = conn.recv(1024)
        # 收空数据时候
        if not data:
          del_rlist.append(conn)
          continue
        conn.send(data.upper())
      # 没有连接,抛出异常,就结束这次循环,继续
      except BlockingIOError:
        continue
      # 套接字出现异常,客户端单方面连接断开
      except Exception:
        conn.close()
        del_rlist.append(conn)
        break
    # 结束上面循环之后,循环del_list 连接元素 删除连接
    for conn in del_rlist:
      del_rlist.remove(conn)
server.close()

BUG:send也是IO阻塞接口

当send在数据量过大时候,也会阻塞。

send操作是,把应用程序把数据发送到操作系统缓存区里,而操作系统缓存区空间也是有限的。缓存区也会满了,后面还有数据需要发送,那只能等缓存区清掉数据,有空间了,才能发送数据。所以在这里缓存区满了,就阻塞。

修改后服务端的代码 可以自己检测IO,遇到IO切换单个线程的其他任务,去运行,实现单线程并发

from socket import *
server = socket(AF_INET,SOCK_STREAM)
server.bind(('127.0.0.1',8000))
server.listen(5)
# 设置socket接口为 非阻塞IO接口
# 默认是True 为阻塞
server.setblocking(False)
r_list = []
w_list = []
print("starting...")
while True:
  try:
    conn,addr = server.accept()
    r_list.append(conn)
    print(r_list)
  except BlockingIOError:
    # 收消息
    # 定义删除连接列表
    del_rlist = []
    for conn in r_list:
      try:
        data = conn.recv(1024)
        # 收空数据时候
        if not data:
          del_rlist.append(conn)
          continue
        '''加入元祖 元祖有两个元素 
        1.存放套接字连接
        2.准备要发送的的数据
        '''
        w_list.append((conn, data.upper()))
      # 没有连接,抛出异常,就结束这次循环,继续
      except BlockingIOError:
        continue
      # 套接字出现异常,客户端单方面连接断开
      except Exception:
        conn.close()
        del_rlist.append(conn)
        break
    # 发消息
    # 用于 发成功数据后,删除套接字连接的列表
    del_wlist = []
        for item in w_list:
     try:
        conn = item[0]
        data = item[1]
        conn.send(data)
        # 发成功后,从列表删除连接
        del_wlist.append(item)
      # send 有可能出现异常 没发完情况
      except BlockingIOError:
        pass
    # 结束上面循环之后,循环del_wlist 连接元素 删除连接
    for item in del_wlist:
      del_wlist.remove(item)
    # 结束上面循环之后,循环del_rlist 连接元素 删除连接
    for conn in del_rlist:
      del_rlist.remove(conn)
server.close()

这就是非阻塞IO

但是非阻塞IO模型绝不被推荐。
我们不能否则其优点:能够在等待任务完成的时间里干其他活了(包括提交其他任务,也就是 “后台” 可以有多个任务在“”同时“”执行)。

干其他活时候,有可能来新的连接,新的连接来了,不能及时响应与该新的连接,建立连接。所以会导致问题:数据不会及时响应

但是也难掩其缺点:

1. 循环调用recv()将大幅度推高CPU占用率;这也是我们在代码中留一句time.sleep(2)的原因,否则在低配主机下极容易出现卡机情况

2. 任务完成的响应延迟增大了,因为每过一段时间才去轮询一次read操作,而任务可能在两次轮询之间的任意时间完成。
这会导致整体数据吞吐量的降低。

3.死循环While True会导致CPU的无用的耗用、占用

此外,在这个方案中recv()更多的是起到检测“操作是否完成”的作用,实际操作系统提供了更为高效的检测“操作是否完成“作用的接口,例如select()多路复用模式,可以一次检测多个连接是否活跃

以上就是本文的全部内容,希望对大家的学习有所帮助,也希望大家多多支持三水点靠木。

Python 相关文章推荐
Python入门篇之条件、循环
Oct 17 Python
Python下的Softmax回归函数的实现方法(推荐)
Jan 26 Python
Python3生成手写体数字方法
Jan 30 Python
解决Pandas to_json()中文乱码,转化为json数组的问题
May 10 Python
python网络爬虫 Scrapy中selenium用法详解
Sep 28 Python
FFT快速傅里叶变换的python实现过程解析
Oct 21 Python
使用Python的datetime库处理时间(RPA流程)
Nov 24 Python
基于python及pytorch中乘法的使用详解
Dec 27 Python
Python2与Python3关于字符串编码处理的差别总结
Sep 07 Python
如何使用 Flask 做一个评论系统
Nov 27 Python
python中sys模块的介绍与实例
Apr 17 Python
Python中Cookies导出某站用户数据的方法
May 17 Python
Python实现某论坛自动签到功能
Aug 20 #Python
python函数的作用域及关键字详解
Aug 20 #Python
pytorch 可视化feature map的示例代码
Aug 20 #Python
python爬虫 基于requests模块的get请求实现详解
Aug 20 #Python
python爬虫 urllib模块url编码处理详解
Aug 20 #Python
pytorch实现用Resnet提取特征并保存为txt文件的方法
Aug 20 #Python
python web框架 django wsgi原理解析
Aug 20 #Python
You might like
PHPnow安装服务[apache_pn]失败的问题的解决方法
2010/09/10 PHP
第五章 php数组操作
2011/12/30 PHP
如何在旧的PHP系统中使用PHP 5.3之后的库
2015/12/02 PHP
Linux系统中设置多版本PHP共存配合Nginx服务器使用
2015/12/21 PHP
srcElement表格样式
2006/09/03 Javascript
js里取容器大小、定位、距离等属性搜集整理
2013/08/19 Javascript
谷歌地图打不开的解决办法
2014/08/07 Javascript
Javascript Object 对象学习笔记
2014/12/17 Javascript
探讨:JavaScript ECAMScript5 新特性之get/set访问器
2016/05/05 Javascript
JavaScript sort数组排序方法和自我实现排序方法小结
2016/06/06 Javascript
JavaScript简单获取页面图片原始尺寸的方法
2016/06/21 Javascript
JS获取及验证开始结束日期的方法
2016/08/20 Javascript
微信小程序之swiper轮播图中的图片自适应高度的方法
2018/04/23 Javascript
详解js中Array的方法及技巧
2018/09/12 Javascript
vue 兄弟组件的信息传递的方法实例详解
2019/08/30 Javascript
浅谈vue限制文本框输入数字的正确姿势
2019/09/02 Javascript
浅谈JavaScript中你可能不知道URL构造函数的属性
2020/07/13 Javascript
[40:29]2018DOTA2亚洲邀请赛 4.7总决赛 LGD vs Mineski 第一场
2018/04/10 DOTA
python的类方法和静态方法
2014/12/13 Python
Centos5.x下升级python到python2.7版本教程
2015/02/14 Python
简单介绍Python中的try和finally和with方法
2015/05/05 Python
Python中处理字符串之endswith()方法的使用简介
2015/05/18 Python
Python 关于反射和类的特殊成员方法
2017/09/14 Python
TensorFlow车牌识别完整版代码(含车牌数据集)
2019/08/05 Python
Python中filter与lambda的结合使用详解
2019/12/24 Python
matplotlib jupyter notebook 图像可视化 plt show操作
2020/04/24 Python
python PyAUtoGUI库实现自动化控制鼠标键盘
2020/09/09 Python
纯CSS3代码实现switch滑动开关按钮效果
2016/08/30 HTML / CSS
Europcar比利时:租车
2019/08/26 全球购物
考试没考好检讨书
2014/01/31 职场文书
小学毕业感言50字
2014/02/16 职场文书
歌颂党的演讲稿
2014/09/10 职场文书
出差报告格式模板
2014/11/06 职场文书
村级干部党员公开承诺事项
2015/05/04 职场文书
python实现腾讯滑块验证码识别
2021/04/27 Python
Matplotlib绘制混淆矩阵的实现
2021/05/27 Python