一文搞懂php的垃圾回收机制


Posted in PHP onJune 18, 2021

一、引用计数基础知识

  • 每个php变量存在一个叫 zval 的变量容器中。
  • 一个 zval 变量容器,除了包含变量的类型和值,还包括两个字节的额外信息。
  • 第一个是 is_ref,是个bool值,用来标识这个变量是否是属于引用集合。通过这个字节,php引擎才能把普通变量和引用变量区分开来,由于php允许用户通过使用&来使用自定义引用,zval变量容器中还有一个内部引用计数机制,来优化内存使用。
  • 第二个额外字节是 refcount,用以表示指向这个zval变量容器的变量个数。
  • 所有的符号存在一个符号表中,其中每个符号都有作用域(scope),那些主脚本(比如:通过浏览器请求的的脚本)和每个函数或者方法也都有作用域。

二、生成zval容器

  • 当一个变量被赋常量值时,就会生成一个zval变量容器
  • 如果安装了Xdebug,则可以通过 xdebug_debug_zval() 查看这两个值
<?php
$a = "new string";
xdebug_debug_zval('a');

//结果
a: (refcount=1, is_ref=0)='new string'

三、增加zval的引用计数

  • 把一个变量赋值给另一变量将增加引用次数
<?php
$a = "new string";
$b = $a;
xdebug_debug_zval( 'a' );

//结果
a: (refcount=2, is_ref=0)='new string'

四、减少zval引用计数

  • 使用 unset() 可以减少引用次数 
  • 包含类型和值的这个变量容器就会从内存中删除
<?php
$a = "new string";
$c = $b = $a;
xdebug_debug_zval( 'a' );
unset( $b, $c );
xdebug_debug_zval( 'a' );

//结果
a: (refcount=3, is_ref=0)='new string'
a: (refcount=1, is_ref=0)='new string'

五、复合类型的zval容器

  • 与 标量(scalar)类型的值不同
  • array和 object类型的变量把它们的成员或属性存在自己的符号表中
  • 这意味着下面的例子将生成三个zval变量容器
  • 这三个zval变量容器是: a,meaning和 number

一文搞懂php的垃圾回收机制

<?php
$a = array( 'meaning' => 'life', 'number' => 42 );
xdebug_debug_zval( 'a' );

//结果
a: (refcount=1, is_ref=0)=array (
   'meaning' => (refcount=1, is_ref=0)='life',
   'number' => (refcount=1, is_ref=0)=42
)

六、增加复合类型的引用计数

  • 添加一个已经存在的元素到数组中

一文搞懂php的垃圾回收机制

<?php
$a = array( 'meaning' => 'life', 'number' => 42 );
$a['life'] = $a['meaning'];
xdebug_debug_zval( 'a' );

//结果
a: (refcount=1, is_ref=0)=array (
   'meaning' => (refcount=2, is_ref=0)='life',
   'number' => (refcount=1, is_ref=0)=42,
   'life' => (refcount=2, is_ref=0)='life'
)

七、减少复合类型的引用计数

  • 删除数组中的一个元素
  • 就是类似于从作用域中删除一个变量.
  • 删除后,数组中的这个元素所在的容器的“refcount”值减少
<?php
$a = array( 'meaning' => 'life', 'number' => 42 );
$a['life'] = $a['meaning'];
unset( $a['meaning'], $a['number'] );
xdebug_debug_zval( 'a' );

//结果
a: (refcount=1, is_ref=0)=array (
   'life' => (refcount=1, is_ref=0)='life'
)

八、特殊情况

  • 当我们添加一个数组本身作为这个数组的元素时,事情就变得有趣 
  • 同上,对一个变量调用unset,将删除这个符号,且它指向的变量容器中的引用次数也减1

一文搞懂php的垃圾回收机制

<?php
$a = array( 'one' );
$a[] = &$a;
xdebug_debug_zval( 'a' );

//结果
a: (refcount=2, is_ref=1)=array (
   0 => (refcount=1, is_ref=0)='one',
   1 => (refcount=2, is_ref=1)=...
)

九、清理变量容器的问题

  • 尽管不再有某个作用域中的任何符号指向这个结构(就是变量容器),由于数组元素“1”仍然指向数组本身,所以这个容器不能被清除 。
  • 因为没有另外的符号指向它,用户没有办法清除这个结构,结果就会导致内存泄漏。
  • 庆幸的是,php将在脚本执行结束时清除这个数据结构,但是在php清除之前,将耗费不少内存。
  • 如果上面的情况发生仅仅一两次倒没什么,但是如果出现几千次,甚至几十万次的内存泄漏,这显然是个大问题

十、回收周期

  • 像以前的 php 用到的引用计数内存机制,无法处理循环的引用内存泄漏
  • 而在php 5.3.0 中使用同步算法,来处理这个内存泄漏问题
  • 如果一个引用计数增加,它将继续被使用,当然就不再在垃圾中。
  • 如果引用计数减少到零,所在变量容器将被清除(free)
  • 就是说,仅仅在引用计数减少到非零值时,才会产生垃圾周期
  • 在一个垃圾周期中,通过检查引用计数是否减1,并且检查哪些变量容器的引用次数是零,来发现哪部分是垃圾

一文搞懂php的垃圾回收机制

十一、回收算法分析

  • 为避免不得不检查所有引用计数可能减少的垃圾周期
  • 这个算法把所有可能根(possible roots 都是zval变量容器),放在根缓冲区(root buffer)中(用紫色来标记,称为疑似垃圾),这样可以同时确保每个可能的垃圾根(possible garbage root)在缓冲区中只出现一次。仅仅在根缓冲区满了时,才对缓冲区内部所有不同的变量容器执行垃圾回收操作。看上图的步骤 A。
  • 在步骤 B 中,模拟删除每个紫色变量。模拟删除时可能将不是紫色的普通变量引用数减"1",如果某个普通变量引用计数变成0了,就对这个普通变量再做一次模拟删除。每个变量只能被模拟删除一次,模拟删除后标记为灰
  • 在步骤 C 中,模拟恢复每个紫色变量。恢复是有条件的,当变量的引用计数大于0时才对其做模拟恢复。同样每个变量只能恢复一次,恢复后标记为黑,基本就是步骤 B 的逆运算。这样剩下的一堆没能恢复的就是该删除的蓝色节点了,在步骤 D 中遍历出来真的删除掉

十二、性能考虑

  • 主要有两个领域对性能有影响
  • 第一个是内存占用空间的节省
  • 另一个是垃圾回收机制释放已泄漏的内存耗费的时间增加

十三、垃圾回收机制的结论

  • PHP中的垃圾回收机制,仅仅在循环回收算法确实运行时会有时间消耗上的增加。但是在平常的(更小的)脚本中应根本就没有性能影响。
  • 然而,在平常脚本中有循环回收机制运行的情况下,内存的节省将允许更多这种脚本同时运行在你的服务器上。因为总共使用的内存没达到上限。
  • 这种好处在长时间运行脚本中尤其明显,诸如长时间的测试套件或者daemon脚本此类
PHP 相关文章推荐
缓存技术详谈―php
Dec 14 PHP
PHP 抓取网页图片并且另存为的实现代码
Mar 24 PHP
php数组函数序列之sort() 对数组的元素值进行升序排序
Nov 02 PHP
解析PHP中$_FILES的使用以及注意事项
Jul 05 PHP
PHP strip_tags()去除HTML、XML以及PHP的标签介绍
Feb 18 PHP
php中解析带中文字符的url函数分享
Jan 20 PHP
浅谈php自定义错误日志
Feb 13 PHP
Yii2 GridView实现列表页直接修改数据的方法
May 16 PHP
php正则表达式基本知识与应用详解【经典教程】
Apr 17 PHP
解决php-fpm.service not found问题的办法
Jun 06 PHP
php生成二维码不保存服务器还有下载功能的实现代码
Aug 09 PHP
PHP PDOStatement::fetchColumn讲解
Jan 31 PHP
PHP中strval()函数实例用法
Jun 07 #PHP
使用php的mail()函数实现发送邮件功能
PHP实现rar解压读取扩展包小结
Jun 03 #PHP
详解Laravel制作API接口
May 31 #PHP
浅谈PHP7中的一些小技巧
May 29 #PHP
详解Laravel服务容器的优势
May 29 #PHP
如何用RabbitMQ和Swoole实现一个异步任务系统
You might like
解析php中array_merge与array+array的区别
2013/06/21 PHP
javascript 获取网页参数系统
2008/07/19 Javascript
JS与C#编码解码
2013/12/03 Javascript
javascript写的一个模拟阅读小说的程序
2014/04/04 Javascript
一个JavaScript去除字符串末尾的空白实例代码
2014/09/22 Javascript
jQuery在ul中显示某个li索引号的方法
2015/03/17 Javascript
Javascript 高阶函数使用介绍
2015/06/15 Javascript
jQuery插件boxScroll实现图片轮播特效
2015/07/14 Javascript
SWFUpload多文件上传及文件个数限制的方法
2016/05/31 Javascript
javascript基于原型链的继承及call和apply函数用法分析
2016/12/15 Javascript
vue2.0实战之基础入门(1)
2017/03/27 Javascript
帝国cms首页列表页实现点赞功能
2017/10/30 Javascript
Node.js实现发送邮件功能
2017/11/06 Javascript
Element-UI Table组件上添加列拖拽效果实现方法
2018/04/14 Javascript
Vue实现一个图片懒加载插件
2019/03/11 Javascript
vue请求本地自己编写的json文件的方法
2019/04/25 Javascript
egg.js的基本使用和调用数据库的方法示例
2019/05/18 Javascript
了解重排与重绘
2019/05/29 Javascript
vue-calendar-component 封装多日期选择组件的实例代码
2020/12/04 Vue.js
[45:25]完美世界DOTA2联赛循环赛 PXG vs IO 第一场 11.06
2020/11/09 DOTA
python中的__slots__使用示例
2015/02/26 Python
打包python 加icon 去掉cmd黑窗口方法
2019/06/24 Python
vscode 配置 python3开发环境的方法
2019/09/19 Python
Python自省及反射原理实例详解
2020/07/06 Python
CSS3属性使网站设计增强同时不消弱可用性
2009/08/29 HTML / CSS
Web页面中八种创建多列等高(等高列布局)的实现技术
2012/12/24 HTML / CSS
canvas需要在标签里直接定义宽高
2014/12/17 HTML / CSS
canvas进阶之如何画出平滑的曲线
2018/10/15 HTML / CSS
美国第一个网上卖鞋零售商:OnlineShoes.com
2017/09/24 全球购物
反腐倡廉警示教育活动心得体会
2014/09/04 职场文书
成本会计实训报告
2014/11/05 职场文书
清明节扫墓活动总结
2015/02/09 职场文书
小学生运动会广播
2015/08/19 职场文书
高中诗歌鉴赏教学反思
2016/02/16 职场文书
Django项目如何正确配置日志(logging)
2021/04/29 Python
Docker安装MySql8并远程访问的实现
2022/07/07 Servers