Python编程中Python与GIL互斥锁关系作用分析


Posted in Python onSeptember 15, 2021

我们知道,在 CPython 中,有一个全局解释器锁,英文叫 global interpreter lock,简称 GIL,是一个互斥锁,用来保护 Python 世界里的对象,防止同一时刻多个线程执行 Python 的字节码,从而确保线程安全,这导致了 Python 的线程无法利用多核 CPU 的优势,因此有人说 Python 的多线程是伪多线程,性能不高,那么 Python 将来有可能去除 GIL 吗?

要回答这个问题,先从 GIL 的起源进行分析。

GIL 的起源

Python 第一次发布是在 1991 年,当时的 CPU 都是单核,单核中,多线程主要为了一边做IO,一边做 CPU 计算而设计的,Python 编译器是由 C 语言编写的,因此也叫 CPython,那时候很多编程语言没有自动内存管理的功能,为了实现自动垃圾回收,Python 为每一个对象进行了引用计数,当引用计数为 0 的时候说明该对象可以回收,从而释放内存了,比如:

>>> import sys
>>> data = { 'gzh': 'Python七号'}
>>> var1 = data
>>> sys.getrefcount(data)
3
>>>

这里 data 对象就有 3 个引用, 一个是本身,一个是变量 var1,一个是 getrefcount 函数的参数,如果此时又有一个线程引用了 data,那么引用计数再增加 1,如果某个线程使用了 data 后运行结束,那么引用计数就减少 1,多线程对同一个变量「引用计数」进行修改,就会遇到 race conditions(竞争),为了避免 race conditions,最简单有效的办法就是加一个互斥锁。

如果对每一个对象都加锁,有可能引发另一个问题,就是死锁,而且频繁的获取和释放会导致性能下降,最简单有效的方法就是加一个解释器锁,线程在执行任何字节码时都先获取解释器锁,这就避免了死锁,而且不会有太多的性能消耗。当时 CPU 都是单核,而且这种 GIL 设计简单,并不会影响性能,因此一直沿用至今天。GIL 存在最主要的原因,就是因为 Python 的内存管理不是线程安全的,这就是 GIL 产生并存在的主要缘由。

尝试消除 GIL

CPU 进入多核时代后,可以同时做多个计算任务, GIL 才真正变成问题。在 1999 年,有个叫 Greg Stein 的大佬基于 Python 1.5 版本消除了 GIL,取代代之的是在可变数据结构上加上更细粒度的锁,也提交了补丁用于去除对全局可变对象的依赖,然后在标准测试时表明去除 GIL 后单线程比不去除时慢了近 2 倍,测试的机器还是当时性能最好 Windows 机器。也就是说除去了 GIL 后,你使用 2 个 CPU 才能获取比原来 1 个 CPU 稍微好一点的性能,这种提升明显得不偿失,Greg Stein 的尝试也就失败告终。

Python 之父 Guido van Rossum 也欢迎社区的志愿者去尝试去除 GIL,只要不降低单线程的性能,但他也提到,去掉 GIL 不是一件容易的事。

Python 开发者邮件列表中也偶尔会有去除 GIL 的议题,但是以下需求必须满足:

  • 简单。从长远来看该方案必须是可实施、可维护的。
  • 并发。去除 GIL 必须能提升多线程的性能。
  • 速度。去除 GIL 不能降低单线程的性能。
  • 满足 CPython 的特性。该方案必须支持 CPython 的功能,比如 __del__ 和弱引用。
  • API 的兼容性。该方案应与所有现有CPython扩展使用的宏在源方面兼容。
  • 及时销毁不可达对象,回收内存。
  • 有序销毁,比如不可达对象 X 引用了 A,那么应该在销毁 A 之前先销毁 X(有些垃圾回收算法并不能做到这一点)。

有些需求不容易被满足,比如 4,5,7,目前,还没有人满足以上需求的同时去除 GIL 成功的。

积重难返

这些年 Python 实在太火了,很多优秀的库都是基于 CPython 进行编写的,很多都是 90 年代的 C 扩展库,如果要除去 GIL,那么很多基于 GIL 编写的 C 扩展便无法使用,也就是去了 GIL,Python 生态有很多扩展或三方库者无法使用。

还有一个很明显的例子,Python 解释器不止有 CPython,还有用 Java 编写的 Python,.NET 实现的 IronPython,这些解释器完全没有 GIL,可是有多少人为它们编写扩展呢?

Python 之所以如此火爆,与它有着丰富的三方库开箱即用有着很大的关系,积重难返,去除 GIL 很困难。

为什么 Python3 一开始时不去除 GIL

Python3 在最开始时是有机会实现很多新功能,在此过程中,打破了一些现有的 C 扩展,然后需要更新和移植更改以配合 Python 3,这也是 Python3 一开始不被社区所接受的原因。

与 Python2 相比,删除 GIL 将使 Python3 在单线程性能方面更慢,而且很多优秀的扩展将不能再使用,如果真的这样,可以想象 Python3 不可能有未来,最终的结果是 Python3 仍然保持有 GIL。

但 Python3 也为现有的 GIL 带来了重大改进,在 Python 3.2 版本中,确保了计算密集型线程和 I/O 密集型线程并存时, I/O 密集型长期获取不到 GIL 而无法执行的问题,提升了多线程的性能。

最后的话

Python 因为内存管理不是线程安全的,因此自出生起就自带 GIL,然后很多扩展都是在 GIL 的保护下编写的,时间一长积重难反,Python3 一开始也因去除 GIL 导致单线程性能下降的问题而保留 GIL,现在已经是 Python3.9 版本了,将来 Python 去除 GIL 的可能性微乎其微,换句话说,去除 GIL 的 Python 也就不是我们认识的 Python 了。

不过不必沮丧,GIL 影响的也仅仅是多线程执行计算密集型的任务罢了,这种场景大多数程序员都很少遇到,即使有,可以使用多进程来避免 GIL 的影响,或者使用其他编程语言实现,任何编程语言或技术都不是十全十美的,发挥所长是最重要的,即使有 GIL,我也不在乎,也会依然使用 Python。

以上就是Python与GIL互斥锁关系分析的详细内容,更多关于Python与GIL互斥锁的资料请关注三水点靠木其它相关文章!

Python 相关文章推荐
Python群发邮件实例代码
Jan 03 Python
详解Python爬虫的基本写法
Jan 08 Python
python爬虫入门教程--优雅的HTTP库requests(二)
May 25 Python
ubuntu中配置pyqt4环境教程
Dec 27 Python
Python面向对象程序设计OOP深入分析【构造函数,组合类,工具类等】
Jan 05 Python
python运行时强制刷新缓冲区的方法
Jan 14 Python
python numpy存取文件的方式
Apr 01 Python
浅谈pytorch卷积核大小的设置对全连接神经元的影响
Jan 10 Python
简单了解django文件下载方式
Feb 10 Python
python中threading开启关闭线程操作
May 02 Python
在keras中对单一输入图像进行预测并返回预测结果操作
Jul 09 Python
Python 的 f-string 可以连接字符串与数字的原因解析
Feb 20 Python
Python3.10的一些新特性原理分析
Sep 15 #Python
一篇文章带你了解Python和Java的正则表达式对比
Sep 15 #Python
Python编程编写完善的命令行工具
Sep 15 #Python
python可视化之颜色映射详解
python的变量和简单数字类型详解
Sep 15 #Python
深入浅析Django MTV模式
python 进阶学习之python装饰器小结
Sep 04 #Python
You might like
PHP中error_reporting()函数的用法(修改PHP屏蔽错误)
2011/07/01 PHP
php中常见的sql攻击正则表达式汇总
2014/11/06 PHP
JS中字符问题(二进制/十进制/十六进制及ASCII码之间的转换)
2008/11/03 Javascript
jquery动画1.加载指示器
2012/08/24 Javascript
jquery获取元素值的方法(常见的表单元素)
2013/11/15 Javascript
jquery实现的导航固定效果
2014/04/28 Javascript
js函数定时器实现定时读取系统实时连接数
2014/04/30 Javascript
JQuery设置时间段下拉选择实例
2014/12/30 Javascript
使用Meteor配合Node.js编写实时聊天应用的范例
2015/06/23 Javascript
Extjs4.0 ComboBox如何实现三级联动
2016/05/11 Javascript
用JS中split方法实现彩色文字背景效果实例
2016/08/24 Javascript
JavaScript截屏功能的实现代码
2017/07/28 Javascript
JS实现生成由字母与数字组合的随机字符串功能详解
2018/05/25 Javascript
NodeJS使用Range请求实现下载功能的方法示例
2018/10/12 NodeJs
详解vue.js移动端配置flexible.js及注意事项
2019/04/10 Javascript
详解Vue 匿名、具名和作用域插槽的使用方法
2019/04/22 Javascript
JavaScript从原型到原型链深入理解
2019/06/03 Javascript
微信小程序点击生成朋友圈分享图(遇到的坑)
2020/06/17 Javascript
Python实现的数据结构与算法之快速排序详解
2015/04/22 Python
Python字符串格式化的方法(两种)
2017/09/19 Python
我用Python抓取了7000 多本电子书案例详解
2019/03/25 Python
Django保护敏感信息的方法示例
2019/05/09 Python
python3.8动态人脸识别的实现示例
2020/09/21 Python
美国女性运动零售品牌:Lady Foot Locker
2017/05/12 全球购物
Paul’s Boutique官网:英国时尚手袋品牌
2018/03/31 全球购物
Surfdome西班牙:世界上最受欢迎的生活方式品牌
2019/02/13 全球购物
女士和男士时尚鞋在线购物:Shoespie
2019/02/28 全球购物
俄罗斯游戏商店:Buka
2020/03/01 全球购物
复核员上岗演讲稿
2014/01/05 职场文书
《永远的白衣战士》教学反思
2014/04/25 职场文书
大学生标准自荐书
2014/06/15 职场文书
反邪教标语
2014/06/23 职场文书
用人单位终止解除劳动合同证明书
2014/10/06 职场文书
校本研修个人总结
2015/02/28 职场文书
八月一日观后感
2015/06/10 职场文书
熟背这些句子,让您的英语口语突飞猛进(135句)
2019/09/06 职场文书