编程 Python

一文了解Python并发编程的工程实现方法

Posted in Python onMay 31, 2019

上一篇文章介绍了线程的使用。然而 Python 中由于 Global Interpreter Lock （全局解释锁 GIL ）的存在，每个线程在在执行时需要获取到这个 GIL ，在同一时刻中只有一个线程得到解释锁的执行， Python 中的线程并没有真正意义上的并发执行，多线程的执行效率也不一定比单线程的效率更高。如果要充分利用现代多核 CPU 的并发能力，就要使用 multipleprocessing 模块了。

0x01 multipleprocessing

与使用线程的 threading 模块类似， multipleprocessing 模块提供许多高级 API 。最常见的是 Pool 对象了，使用它的接口能很方便地写出并发执行的代码。

from multiprocessing import Pool
def f(x):
 return x * x
if __name__ == '__main__':
 with Pool(5) as p:
  # map方法的作用是将f()方法并发地映射到列表中的每个元素
  print(p.map(f, [1, 2, 3]))
# 执行结果
# [1, 4, 9]

关于 Pool 下文中还会提到，这里我们先来看 Process 。

Process

要创建一个进程可以使用 Process 类，使用 start() 方法启动进程。

from multiprocessing import Process
import os
def echo(text):
 # 父进程ID
 print("Process Parent ID : ", os.getppid())
 # 进程ID
 print("Process PID : ", os.getpid())
 print('echo : ', text)
if __name__ == '__main__':
 p = Process(target=echo, args=('hello process',))
 p.start()
 p.join()
# 执行结果
# Process Parent ID : 27382
# Process PID : 27383
# echo : hello process

进程池

正如开篇提到的 multiprocessing 模块提供了 Pool 类可以很方便地实现一些简单多进程场景。它主要有以下接口

apply(func[, args[, kwds]])
执行 func(args,kwds) 方法，在方法结束返回前会阻塞。
apply_async(func[, args[, kwds[, callback[, error_callback]]]])
异步执行 func(args,kwds) ，会立即返回一个 result 对象，如果指定了 callback 参数，结果会通过回调方法返回，还可以指定执行出错的回调方法 error_callback()
map(func, iterable[, chunksize])
类似内置函数 map() ，可以并发执行 func ，是同步方法
map_async(func, iterable[, chunksize[, callback[, error_callback]]])
异步版本的 map
close()
关闭进程池。当池中的所有工作进程都执行完毕时，进程会退出。
terminate()
终止进程池
join()
等待工作进程执行完，必需先调用 close() 或者 terminate()

from multiprocessing import Pool
def f(x):
 return x * x
if __name__ == '__main__':
 with Pool(5) as p:
  # map方法的作用是将f()方法并发地映射到列表中的每个元素
  a = p.map(f, [1, 2, 3])
  print(a)
  # 异步执行map
  b = p.map_async(f, [3, 5, 7, 11])
  # b 是一个result对象，代表方法的执行结果
  print(b)
  # 为了拿到结果，使用join方法等待池中工作进程退出
  p.close()
  # 调用join方法前，需先执行close或terminate方法
  p.join()
  # 获取执行结果
  print(b.get())
# 执行结果
# [1, 4, 9]
# <multiprocessing.pool.MapResult object at 0x10631b710>
# [9, 25, 49, 121]

map_async() 和 apply_async() 执行后会返回一个 class multiprocessing.pool.AsyncResult 对象，通过它的 get() 可以获取到执行结果， ready() 可以判断 AsyncResult 的结果是否准备好。

进程间数据的传输

multiprocessing 模块提供了两种方式用于进程间的数据共享：队列( Queue )和管道( Pipe )

Queue 是线程安全，也是进程安全的。使用 Queue 可以实现进程间的数据共享，例如下面的 demo 中子进程 put 一个对象，在主进程中就能 get 到这个对象。任何可以序列化的对象都可以通过 Queue 来传输。

from multiprocessing import Process, Queue
def f(q):
 q.put([42, None, 'hello'])
if __name__ == '__main__':
 # 使用Queue进行数据通信
 q = Queue()
 p = Process(target=f, args=(q,))
 p.start()
 # 主进程取得子进程中的数据
 print(q.get()) # prints "[42, None, 'hello']"
 p.join()
# 执行结果
# [42, None, 'hello']

Pipe() 返回一对通过管道连接的 Connection 对象。这两个对象可以理解为管道的两端，它们通过 send() 和 recv() 发送和接收数据。

from multiprocessing import Process, Pipe
def write(conn):
 # 子进程中发送一个对象
 conn.send([42, None, 'hello'])
 conn.close()
def read(conn):
 # 在读的进程中通过recv接收对象
 data = conn.recv()
 print(data)
if __name__ == '__main__':
 # Pipe()方法返回一对连接对象
 w_conn, r_conn = Pipe()
 wp = Process(target=write, args=(w_conn,))
 rp = Process(target=read, args=(r_conn,))
 wp.start()
 rp.start()
# 执行结果
# [42, None, 'hello']

需要注意的是，两个进程不能同时对一个连接对象进行 send 或 recv 操作。

同步

我们知道线程间的同步是通过锁机制来实现的，进程也一样。

from multiprocessing import Process, Lock
import time
def print_with_lock(l, i):
 l.acquire()
 try:
  time.sleep(1)
  print('hello world', i)
 finally:
  l.release()
def print_without_lock(i):
 time.sleep(1)
 print('hello world', i)
if __name__ == '__main__':
 lock = Lock()
 # 先执行有锁的
 for num in range(5):
  Process(target=print_with_lock, args=(lock, num)).start()
 # 再执行无锁的
 # for num in range(5):
 #  Process(target=print_without_lock, args=(num,)).start()

有锁的代码将每秒依次打印

hello world 0
hello world 1
hello world 2
hello world 3
hello world 4

如果执行无锁的代码，则在我的电脑上执行结果是这样的

hello worldhello world 0
1
hello world 2
hello world 3
hello world 4

除了 Lock ，还包括 RLock 、 Condition 、 Semaphore 和 Event 等进程间的同步原语。其用法也与线程间的同步原语很类似。 API 使用可以参考文末中引用的文档链接。

在工程中实现进程间的数据共享应当优先使用队列或管道。

0x02 总结

本文对 multiprocessing 模块中常见的 API 作了简单的介绍。讲述了 Process 和 Pool 的常见用法，同时介绍了进程间的数据方式：队列和管道。最后简单了解了进程间的同步原语。

一文了解Python并发编程的工程实现方法

- Author -

GoT阳仔

声明：登载此文出于传递更多信息之目的，并不意味着赞同其观点或证实其描述。

Python 相关文章推荐

python解析模块(ConfigParser)使用方法

Dec 10 Python

Python利用前序和中序遍历结果重建二叉树的方法

Apr 27 Python

python出现"IndentationError: unexpected indent"错误解决办法

Oct 15 Python

PyCharm在win10的64位系统安装实例

Nov 26 Python

浅谈flask截获所有访问及before/after_request修饰器

Jan 18 Python

Python实现将doc转化pdf格式文档的方法

Jan 19 Python

python中正则表达式的使用方法

Feb 25 Python

tensorflow识别自己手写数字

Mar 14 Python

Python3用tkinter和PIL实现看图工具

Jun 21 Python

python实现蒙特卡罗方法教程

Jan 28 Python

python中tkinter的应用:修改字体的实例讲解

Jul 17 Python

python缩进长度是否统一

Aug 02 Python

Python微信操控itchat的方法

May 31 #Python

python基于SMTP协议发送邮件

May 31 #Python

python 使用turtule绘制递归图形（螺旋、二叉树、谢尔宾斯基三角形）

May 30 #Python

Python自定义函数计算给定日期是该年第几天的方法示例

May 30 #Python

基于Python打造账号共享浏览器功能

May 30 #Python

Python实现带下标索引的遍历操作示例

May 30 #Python

Python动态参数/命名空间/函数嵌套/global和nonlocal

May 29 #Python

You might like

php 目录与文件处理-郑阿奇(续)

2011/07/04 PHP

如何用PHP实现插入排序？

2013/04/10 PHP

探讨多键值cookie(php中cookie存取数组)的详解

2013/06/06 PHP

标准版Eclipse搭建PHP环境的详细步骤

2015/11/18 PHP

Laravel Intervention/image图片处理扩展包的安装、使用与可能遇到的坑详解

2017/11/14 PHP

PHP防止sql注入小技巧之sql预处理原理与实现方法分析

2019/12/13 PHP

写的htc的数据表格

2007/01/20 Javascript

javascript URL锚点取值方法

2009/02/25 Javascript

前端开发部分总结[兼容性、DOM操作、跨域等]（持续更新）

2010/03/04 Javascript

HTML Dom与Css控制方法

2010/10/25 Javascript

文本框(input)获取焦点(onfocus)时样式改变的示例代码

2014/01/10 Javascript

javascript事件冒泡详解和捕获、阻止方法

2014/04/12 Javascript

jquery单击事件和双击事件冲突解决方案

2016/03/02 Javascript

教你如何在Node.js中使用jQuery

2016/08/28 Javascript

JS简单去除数组中重复项的方法

2016/09/13 Javascript

利用ES6语法重构React组件详解

2017/03/02 Javascript

react-navigation 如何判断用户是否登录跳转到登录页的方法

2017/12/01 Javascript

vue.js select下拉框绑定和取值方法

2018/03/03 Javascript

浅谈angular4.0中路由传递参数、获取参数最nice的写法

2018/03/12 Javascript

IE8中jQuery.load()加载页面不显示的原因

2018/11/15 jQuery

深入学习Vue nextTick的用法及原理

2019/10/08 Javascript

JS实现碰撞检测效果

2020/03/12 Javascript

JavaScript中条件语句的优化技巧总结

2020/12/04 Javascript

[03:17]2016完美“圣”典风云人物：冷冷专访

2016/12/08 DOTA

简单介绍Python中的round()方法

2015/05/15 Python

python实现的简单FTP上传下载文件实例

2015/06/30 Python

Python与R语言的简要对比

2017/11/14 Python

浅谈PYTHON 关于文件的操作

2019/03/19 Python

解决echarts中饼图标签重叠的问题

2020/05/16 Python

使用pandas库对csv文件进行筛选保存

2020/05/25 Python

皇家阿尔伯特瓷器美国官网：Royal Albert美国

2020/02/16 全球购物

面向对象概念面试题(.NET)

2016/11/04 面试题

接口可以包含哪些成员

2012/09/30 面试题

酒店辞职书范文

2015/02/26 职场文书

西部计划志愿者工作总结

2015/08/11 职场文书

银行文明优质服务培训心得体会

2016/01/09 职场文书