python 垃圾收集机制的实例详解


Posted in Python onAugust 20, 2017

 python 垃圾收集机制的实例详解

pythonn垃圾收集方面的内容如果要细讲还是挺多的,这里只是做一个大概的概括

Python最主要和绝大多数时候用的都是引用计数,每一个PyObject定义如下:

#define PyObject_HEAD          \ 
  Py_ssize_t ob_refcnt;        \ 
  struct _typeobject *ob_type; 
typedef struct _object { 
  PyObject_HEAD 
} PyObject;

每个pyobject都有一个refcnt来记录他们自己的引用数,一旦引用数为0,就进行回收

引用计数的优点在于实时性,一旦没有其他对象引用了,就能立马进行回收,看起来十分不错,但为什么好多语言都没有采用该方案,因为引用计数有一个致命的缺点,无法解决循环引用问题,比如:

a = [] 
b = [] 
a.append(b) 
b.append(a)

其实并没有其他变量引用a,b那么他们实际上应该被回收掉,但由于相互引用的关系,他们的引用数都为1,无法被回收。

在python中,相互引用的问题仅仅存在与容器里面,例如list,dictionary,class,instance。为了解决该问题,python引入了标记——清除和分代——回收另外两种机制。

事实上,python中的容器并没有之前讲的那么简单,在pyobject_head之前,还有一个PyGC_head,也就是专门用来处理容器的循环引用问题的。

typedef union _gc_head { 
  struct { 
    union _gc_head *gc_next; 
    union _gc_head *gc_prev; 
    Py_ssize_t gc_refs; 
  } gc; 
  long double dummy; /* force worst-case alignment */ 
} PyGC_Head;

所有创建的容器类的对象都会被记录到可收集对象链表中,通过上面的结构我们可以知道其实是构建了一个双向链表,这样我们就可以来跟踪所有可能产生循环引用的情况了。而像int,string等简单的不是容器类型的,只要引用技术为0,就会被回收。但是如果频繁的malloc和free会严重影响效率,所以python采用了大量的对象池来提高效率。

标记——清除包括了垃圾回收的两个方面:(1)寻找可以回收的对象(2)回收对象,python中的标记会从root object开始,遍历所有容器类对象,查找出可以通过引用来到达的一些对象,把他们放到由reachable维护的链表中,对于不能到达的放到unbreachable维护的链表中,此过程结束之后,对unreachable里面的元素进行回收即可。

那么如何对应之前循环引用的情况呢?python里面会产生一个有效的引用数,存在gc.gc_refs里面,像上面的a,b真实引用数为1,但有效的引用数为0(循环中的引用数都减1),由于不能直接改pyobjec里面的refcnt,否则会产生一系列问题,我们可以将有效的引用数记到gc.gc_refs里面,那么a,b 的真实有效引用数都为0,所以他们可以被回收。

下面是另外一种情况:

a = [] 
b = [] 
c = a 
a.append(b) 
b.append(a)

这里ab也是循环引用,但是多了c来引用a,通过计算循环中的有效引用计数可得a的引用数为1,b的引用数为0,看起来b应该被回收,但实际上因为a是不可被回收的,a又引用了b,所以b也会被放入在reachable链表中,不被回收,其gc.gc_refs还是会被置1的。

另外一种分代回收,是说内存中有的对象会频繁的malloc和free,有的则比较长久,如果一个对象经过多次垃圾收集和清除之后还存在的话,那么我们就可以认为,这个对象是长时间有用的,不用去频繁检测回收它。python中分为3代,分别是3个链表维护,0代最多维护700个对象,1代10个,2代10个,如果对象超过这个数了,就会调用标记——清除算法来进行回收。可以想到,0代的对象经过一段时间后会到1代2代中去,然后对它们的检测回收会相比于0代的不那么频繁了

要注意的是,python主要的机制还是引用技术,标记——清除和分代收集只是为了弥补引用计数的缺点而添加的,也就是说,后两者基本只在容器类的循环引用上能发挥作用

以上就是python 垃圾收集机制的实例详解,如有疑问请留言或者到本站社区交流讨论,感谢阅读,希望能帮助到大家,谢谢大家对本站的支持!

Python 相关文章推荐
Python实现根据指定端口探测服务器/模块部署的方法
Aug 25 Python
Python StringIO模块实现在内存缓冲区中读写数据
Apr 08 Python
Python脚本实现Web漏洞扫描工具
Oct 25 Python
Python2.7基于笛卡尔积算法实现N个数组的排列组合运算示例
Nov 23 Python
彻彻底底地理解Python中的编码问题
Oct 15 Python
python定位xpath 节点位置的方法
Aug 27 Python
Python for循环及基础用法详解
Nov 08 Python
解决Tensorflow sess.run导致的内存溢出问题
Feb 05 Python
Python递归实现打印多重列表代码
Feb 27 Python
Python如何通过百度翻译API实现翻译功能
Apr 02 Python
利用Pycharm连接服务器的全过程记录
Jul 01 Python
pandas中关于apply+lambda的应用
Feb 28 Python
python 实现tar文件压缩解压的实例详解
Aug 20 #Python
详解Python 序列化Serialize 和 反序列化Deserialize
Aug 20 #Python
Python中input与raw_input 之间的比较
Aug 20 #Python
Python 基础教程之str和repr的详解
Aug 20 #Python
Python实现爬取需要登录的网站完整示例
Aug 19 #Python
Python获取当前页面内所有链接的四种方法对比分析
Aug 19 #Python
Python基于numpy灵活定义神经网络结构的方法
Aug 19 #Python
You might like
PHP 删除文件与文件夹操作 unlink()与rmdir()这两个函数的使用
2011/07/17 PHP
PHP实现的带超时功能get_headers函数
2015/02/10 PHP
详解php设置session(过期、失效、有效期)
2015/11/12 PHP
PHP大神的十大优良习惯
2016/09/14 PHP
Laravel框架用户登陆身份验证实现方法详解
2017/09/14 PHP
取得父标签
2006/11/14 Javascript
有趣的JavaScript数组长度问题代码说明
2011/01/20 Javascript
JS中实现replaceAll的方法(实例代码)
2013/11/12 Javascript
jQuery插件expander实现图片翻转特效
2015/05/21 Javascript
浅谈JavaScript 的执行顺序
2015/08/07 Javascript
node.js cookie-parser之parser.js
2016/06/06 Javascript
Javascript中浏览器窗口的基本操作总结
2016/08/18 Javascript
微信小程序 wxapp地图 map详解
2016/10/31 Javascript
JSON与JS对象的区别与对比
2017/03/01 Javascript
JavaScript基础进阶之数组方法总结(推荐)
2017/09/04 Javascript
react-router v4如何使用history控制路由跳转详解
2018/01/09 Javascript
通过vue-router懒加载解决首次加载时资源过多导致的速度缓慢问题
2018/04/08 Javascript
在angularJs中进行数据遍历的2种方法
2018/10/08 Javascript
Jquery ajax书写方法代码实例解析
2020/06/12 jQuery
django实现前后台交互实例
2017/08/07 Python
Python使用Windows API创建窗口示例【基于win32gui模块】
2018/05/09 Python
Python爬虫设置代理IP(图文)
2018/12/23 Python
Python 占位符的使用方法详解
2019/07/10 Python
Python 200行代码实现一个滑动验证码过程详解
2019/07/11 Python
Pytorch释放显存占用方式
2020/01/13 Python
tensorflow实现在函数中用tf.Print输出中间值
2020/01/21 Python
Python3.7实现验证码登录方式代码实例
2020/02/14 Python
opencv 图像礼帽和图像黑帽的实现
2020/07/07 Python
数组越界问题
2015/10/21 面试题
艺术爱好者的自我评价分享
2013/10/08 职场文书
学生实习自我鉴定
2013/10/11 职场文书
就业表自我评价分享
2014/02/06 职场文书
导游词之云南丽江-泸沽湖
2019/09/26 职场文书
导游词之平津战役纪念馆
2019/11/04 职场文书
MySQL 如何设计统计数据表
2021/06/15 MySQL
经典《舰娘》游改全新动画预告 预定11月开播
2022/04/01 日漫