Python全局锁中如何合理运用多线程(多进程)


Posted in Python onNovember 06, 2019

Python全局锁

(1)全局锁导致的问题

全局锁的英文简称是GIL,全称是Global Interpreter Lock(全局解释器锁),来源是python设计之初的考虑,为了数据安全所做的决定,每个线程在执行时候都需要先获取GIL,保证同一时刻只有一个线程可以执行代码,即同一时刻只有一个线程使用CPU,也就是说多线程并不是真正意义上的同时执行。
每个CPU在同一时间只能执行一个线程(在单核CPU下的多线程其实都只是并发,不是并行,并发和并行从宏观上来讲都是同时处理多路请求的概念。但并发和并行又有区别,并行是指两个或者多个事件在同一时刻发生(多个CPU同时执行某个任务);而并发是指两个或多个事件在同一时间间隔内发生。)

在Python多线程下,每个线程的执行方式:

1、获取GIL

2、执行代码直到sleep或者是python虚拟机将其挂起。

3、释放GIL

可见,某个线程想要执行,必须先拿到GIL,我们可以把GIL看作是“通行证”,并且在一个python进程中,GIL只有一个。拿不到通行证的线程,就不允许进入CPU执行。

在Python2.x里,GIL的释放逻辑是当前线程遇见IO操作或者ticks计数达到100(ticks可以看作是Python自身的一个计数器,专门做用于GIL,每次释放后归零,这个计数可以通过 sys.setcheckinterval 来调整),进行释放。
而每次释放GIL锁,线程进行锁竞争、切换线程,会消耗资源。并且由于GIL锁存在,python里一个进程永远只能同时执行一个线程(拿到GIL的线程才能执行),这就是为什么在多核CPU上,python的多线程效率并不高。

(2)在有全局锁的情况下如何运行多线程、多进程

在这里我们进行分类讨论:

1、CPU密集型代码(各种循环处理、计数等等),在这种情况下,由于计算工作多,ticks计数很快就会达到阈值,然后触发GIL的释放与再竞争(多个线程来回切换当然是需要消耗资源的),所以python下的多线程对CPU密集型代码并不友好,此时可以采用多进程形式实现多任务。

2、IO密集型代码(文件处理、网络爬虫等),多线程能够有效提升效率(单线程下有IO操作会进行IO等待,造成不必要的时间浪费,而开启多线程能在线程A等待时,自动切换到线程B,可以不浪费CPU的资源,从而能提升程序执行效率)。所以python的多线程对IO密集型代码比较友好。

而在python3.x中,GIL不使用ticks计数,改为使用计时器(执行时间达到阈值后,当前线程释放GIL),这样对CPU密集型程序更加友好,但依然没有解决GIL导致的同一时间只能执行一个线程的问题,所以效率依然不尽如人意。

请注意:多核多线程比单核多线程更差,原因是单核下多线程,每次释放GIL,唤醒的那个线程都能获取到GIL锁,所以能够无缝执行,但多核下,CPU0释放GIL后,其他CPU上的线程都会进行竞争,但GIL可能会马上又被CPU0拿到,导致其他几个CPU上被唤醒后的线程会醒着等待到切换时间后又进入待调度状态,这样会造成线程颠簸(thrashing),导致效率更低

回到最开始的问题:经常我们会听到老手说:“python下想要充分利用多核CPU,就用多进程”,原因是什么呢?
原因是:每个进程有各自独立的GIL,互不干扰,这样就可以真正意义上的并行执行,所以在python中,多进程的执行效率优于多线程(仅仅针对多核CPU而言)。

(3)代码实例

使用一个线程去计数

#encoing:utf-8
import threading
import time
def test_counter():
  i = 0
  for _ in range(100000000):
    i += 1
  return True
def main():
  start_time = time.time()
  for tid in range(2):
    t1 = threading.Thread(target=test_counter)
    t1.start()
    t1.join()
  end_time = time.time()
  print("Total time:{}".format(end_time-start_time))
if __name__ == "__main__":
  main()

结果:

Python全局锁中如何合理运用多线程(多进程)

使用2个线程,去执行非IO操作

#encoding:utf-8
import threading
import time
def test_counter():
  i = 0
  for _ in range(100000000):
    i += 1
  return True
def main():
  thread_array = {}
  start_time = time.time()
  for tid in range(2):
    t = threading.Thread(target=test_counter)
    t.start()
    thread_array[tid] = t
  for i in range(2):
    thread_array[i].join()
  end_time = time.time()
  print("Total time:{}".format(end_time-start_time))
if __name__ == "__main__":
  main()

结果:

Python全局锁中如何合理运用多线程(多进程)

通过上面的代码可以得出,对于非IO类型操作,多线程为了获得GIL去相互竞争,导致程序执行效率更低,所以我们要根据实际的业务功能情况,来确定使用多线程、多进程!

总结

以上所述是小编给大家介绍的在Python全局锁中如何合理运用多线程(多进程),希望对大家有所帮助,如果大家有任何疑问请给我留言,小编会及时回复大家的。在此也非常感谢大家对三水点靠木网站的支持!
如果你觉得本文对你有帮助,欢迎转载,烦请注明出处,谢谢!

Python 相关文章推荐
python实现从ftp服务器下载文件的方法
Apr 30 Python
python append、extend与insert的区别
Oct 13 Python
浅谈使用Python变量时要避免的3个错误
Oct 30 Python
python实现学生管理系统
Jan 11 Python
Python实现点阵字体读取与转换的方法
Jan 29 Python
浅谈Python小波分析库Pywavelets的一点使用心得
Jul 09 Python
基于Python检测动态物体颜色过程解析
Dec 04 Python
Python3批量创建Crowd用户并分配组
May 20 Python
keras model.fit 解决validation_spilt=num 的问题
Jun 19 Python
python 带时区的日期格式化操作
Oct 23 Python
Python图像处理之图像拼接
Apr 28 Python
python3操作redis实现List列表实例
Aug 04 Python
Python实现socket非阻塞通讯功能示例
Nov 06 #Python
Python中生成一个指定长度的随机字符串实现示例
Nov 06 #Python
详解Python list和numpy array的存储和读取方法
Nov 06 #Python
python函数装饰器之带参数的函数和带参数的装饰器用法示例
Nov 06 #Python
Python list与NumPy array 区分详解
Nov 06 #Python
Django实现WebSSH操作物理机或虚拟机的方法
Nov 06 #Python
django 简单实现登录验证给你
Nov 06 #Python
You might like
php下图片文字混合水印与缩略图实现代码
2009/12/11 PHP
php 来访国内外IP判断代码并实现页面跳转
2009/12/18 PHP
ubuntu12.04使用c编写php扩展模块教程分享
2013/12/25 PHP
PHP配置把错误日志以邮件方式发送方法(Windows系统)
2015/06/23 PHP
微信开发之网页授权获取用户信息(二)
2016/01/08 PHP
PHP Filter过滤器全面解析
2016/08/09 PHP
THINKPHP截取中文字符串函数实例代码
2017/03/20 PHP
ThinkPHP5.1验证码功能实现的示例代码
2020/06/08 PHP
JavaScript库 开发规则
2009/01/31 Javascript
JavaScript学习笔记(十)
2010/01/17 Javascript
jquery 问答知识整理
2010/02/11 Javascript
jquery加载页面的方法(页面加载完成就执行)
2011/06/21 Javascript
浮动的div自适应居中显示的js代码
2013/12/23 Javascript
javascript获取当前鼠标坐标的方法
2015/01/10 Javascript
SWFUpload多文件上传及文件个数限制的方法
2016/05/31 Javascript
JS遍历页面所有对象属性及实现方法
2016/08/01 Javascript
超实用的javascript时间处理总结
2016/08/16 Javascript
微信 java 实现js-sdk 图片上传下载完整流程
2016/10/21 Javascript
详解webpack es6 to es5支持配置
2017/05/04 Javascript
jQuery实现返回顶部按钮和scroll滚动功能[带动画效果]
2017/07/05 jQuery
AngularJS实现自定义指令及指令配置项的方法
2017/11/20 Javascript
基于jquery的on和click的区别详解
2018/01/15 jQuery
Node 搭建一个静态资源服务器的实现
2019/05/20 Javascript
Python中的if、else、elif语句用法简明讲解
2016/03/11 Python
利用python生成一个导出数据库的bat脚本文件的方法
2016/12/30 Python
tensorflow:指定gpu 限制使用量百分比,设置最小使用量的实现
2020/02/06 Python
pytorch实现CNN卷积神经网络
2020/02/19 Python
HTML5 input placeholder 颜色修改示例
2014/05/30 HTML / CSS
Reebok官方旗舰店:美国知名健身品牌锐步
2019/01/07 全球购物
银行员工职业规划范文
2014/01/21 职场文书
公司离职证明范本(汇总)
2014/09/10 职场文书
勿忘国耻9.18演讲稿(经典篇)
2014/09/14 职场文书
合作协议书模板
2014/10/10 职场文书
村干部任职承诺书
2015/01/21 职场文书
《战锤40K:暗潮》跳票至9月 公布新宣传片
2022/04/03 其他游戏
win11怎么消除图标小盾牌?win11消除图标小盾牌解决方法
2022/08/05 数码科技