PHP数组实际占用内存大小原理解析


Posted in PHP onDecember 11, 2020

一般来说,PHP数组的内存利用率只有 1/10, 也就是说,一个在C语言里面100M 内存的数组,在PHP里面就要1G。下面我们可以粗略的估算PHP数组占用内存的大小,首先我们测试1000个元素的整数占用的内存:

<?php 
  echo memory_get_usage() , '<br>'; 
  $start = memory_get_usage(); 
  $a = Array(); 
  for ($i=0; $i<1000; $i++) { 
  $a[$i] = $i + $i; 
  } 
  $mid = memory_get_usage(); 
  echo memory_get_usage() , '<br>'; 
  for ($i=1000; $i<2000; $i++) { 
  $a[$i] = $i + $i; 
  } 
  $end = memory_get_usage(); 
  echo memory_get_usage() , '<br>'; 
  echo 'argv:', ($mid - $start)/1000 ,'bytes' , '<br>'; 
  echo 'argv:',($end - $mid)/1000 ,'bytes' , '<br>';

输出是:

353352
437848
522024
argv:84.416bytes
argv:84.176bytes

大概了解1000 个元素的整数数组需要占用 82k 内存,平均每个元素占用 84 个字节。而纯 C 中整体只需要 4k(一个整型占用4byte * 1000 )。memory_get_usage() 返回的结果并不是全是被数组占用了,还要包括一些 PHP 运行本身分配的一些结构,可能用内置函数生成的数组更接近真实的空间:

<?php
$start = memory_get_usage();
$a = array_fill(0, 10000, 1);
$mid = memory_get_usage(); //10k elements array;
echo 'argv:', ($mid - $start )/10000,'byte' , '<br>';
$b = array_fill(0, 10000, 1);
$end = memory_get_usage(); //10k elements array;
echo 'argv:', ($end - $mid)/10000 ,'byte' , '<br>';

得到:

argv:54.5792byte
argv:54.5784byte

从这个结果来看似乎一个数组元素大约占用了54个字节左右。

首先看一下32位机C语言各种类型占用的字节:

#include "stdafx.h" 
//#include <stdio.h> 
  
int main() { 
    printf("int:%d\nlong:%d\ndouble:%d\nchar*:%d\nsize_t:%d\n",  
    sizeof(int), sizeof(long),  
    sizeof(double), sizeof(char *),  
    sizeof(size_t)); 
  return  0;  
}

int:4
long:4
double:8
har*:4
size_t:4

在PHP中都使用long类型来代表数字,没有使用int类型

大家都明白PHP是一种弱类型的语言,它不会去区分变量的类型,没有int float char *之类的概念。

我们看看php在zend里面存储的变量,PHP中每个变量都有对应的 zval, Zval结构体定义在Zend/zend.h里面,其结构:

typedef struct _zval_struct zval; 
struct _zval_struct { 
  /* Variable information */ 
  zvalue_value value;   /* The value 1 12字节(32位机是12,64位机需要8+4+4=16) */ 
  zend_uint refcount__gc; /* The number of references to this value (for GC) 4字节 */ 
  zend_uchar type;    /* The active type 1字节*/ 
  zend_uchar is_ref__gc; /* Whether this value is a reference (&) 1字节*/ 
};

PHP使用一种UNION结构来存储变量的值,即zvalue_value 是一个union,UNION变量所占用的内存是由最大

成员数据空间决定。

typedef union _zvalue_value { 
  long lval;         /* long value */ 
  double dval;        /* double value */ 
  struct {          /* string value */ 
    char *val; 
    int len; 
  } str;  
  HashTable *ht;       /* hash table value */ 
  zend_object_value obj;   /*object value */ 
} zvalue_value;

最大成员数据空间是struct str,指针占*val用4字节,INT占用4字节,共8字节。

struct zval占用的空间为8+4+1+1 = 14字节,

其实呢,在zval中数组,字符串和对象还需要另外的存储结构,数组则是一个 HashTable:

HashTable结构体定义在Zend/zend_hash.h.

typedef struct _hashtable { 
  uint nTableSize;//4 
  uint nTableMask;//4 
  uint nNumOfElements;//4 
  ulong nNextFreeElement;//4 
  Bucket *pInternalPointer;  /* Used for element traversal 4*/ 
  Bucket *pListHead;//4 
  Bucket *pListTail;//4 
  Bucket **arBuckets;//4 
  dtor_func_t pDestructor;//4 
  zend_bool persistent;//1 
  unsigned char nApplyCount;//1 
  zend_bool bApplyProtection;//1 
#if ZEND_DEBUG 
  int inconsistent;//4 
#endif 
} HashTable;

HashTable 结构需要 39 个字节,每个数组元素存储在 Bucket 结构中:

typedef struct bucket { 
  ulong h;  /* Used for numeric indexing        4字节 */ 
  uint nKeyLength;  /* The length of the key (for string keys) 4字节 */ 
  void *pData;    /* 4字节*/ 
  void *pDataPtr;     /* 4字节*/ 
  struct bucket *pListNext; /* PHP arrays are ordered. This gives the next element in that order4字节*/ 
  struct bucket *pListLast; /* and this gives the previous element      4字节 */ 
  struct bucket *pNext;   /* The next element in this (doubly) linked list   4字节*/ 
  struct bucket *pLast;   /* The previous element in this (doubly) linked list   4字节*/ 
  char arKey[1];      /* Must be last element  1字节*/ 
} Bucket;

Bucket 结构需要 33 个字节,键长超过四个字节的部分附加在 Bucket 后面,而元素值很可能是一个 zval 结构,另外每个数组会分配一个由 arBuckets 指向的 Bucket 指针数组, 虽然不能说每增加一个元素就需要一个指针,但是实际情况可能更糟。这么算来一个数组元素就会占用 54 个字节,与上面的估算几乎一样。

一个空数组至少会占用 14(zval) + 39(HashTable) + 33(arBuckets) = 86 个字节,作为一个变量应该在符号表中有个位置,也是一个数组元素,因此一个空数组变量需要 118 个字节来描述和存储。从空间的角度来看,小型数组平均代价较大,当然一个脚本中不会充斥数量很大的小型数组,可以以较小的空间代价来获取编程上的快捷。但如果将数组当作容器来使用就是另一番景象了,实际应用经常会遇到多维数组,而且元素居多。比如10k个元素的一维数组大概消耗540k内存,而10kx 10 的二维数组理论上只需要 6M 左右的空间,但是按照 memory_get_usage 的结果则两倍于此,[10k,5,2]的三维数组居然消耗了23M,小型数组果然是划不来的。

以上就是本文的全部内容,希望对大家的学习有所帮助,也希望大家多多支持三水点靠木。

PHP 相关文章推荐
php 将bmp图片转为jpg等其他任意格式的图片
Jun 21 PHP
php jquery 多文件上传简单实例
Dec 23 PHP
PHP中单引号与双引号的区别分析
Aug 19 PHP
PHP截取指定图片大小的方法
Dec 10 PHP
php实现图片局部打马赛克的方法
Feb 11 PHP
PHP多文件上传实例
Jul 09 PHP
PHP程序员不应该忽略的3点
Oct 09 PHP
老生常谈php 正则中的i,m,s,x,e分别表示什么
Mar 02 PHP
PHP简单获取上月、本月、近15天、近30天的方法示例
Jul 03 PHP
PHP实现表单提交数据的验证处理功能【防SQL注入和XSS攻击等】
Jul 21 PHP
php实现通过stomp协议连接ActiveMQ操作示例
Feb 23 PHP
PHP7移除的扩展和SAPI
Mar 09 PHP
PHP基于ip2long实现IP转换整形
Dec 11 #PHP
PHP哈希表实现算法原理解析
Dec 11 #PHP
PHP解决高并发的优化方案实例
Dec 10 #PHP
WordPress伪静态规则设置代码实例
Dec 10 #PHP
php远程请求CURL实例教程(爬虫、保存登录状态)
Dec 10 #PHP
php解析非标准json、非规范json的方式实例
Dec 10 #PHP
PHP连接MySQL数据库三种实现方法
Dec 10 #PHP
You might like
Discuz 6.0+ 批量注册用户名
2009/09/13 PHP
Yii2实现多域名跨域同步登录退出
2017/02/04 PHP
Chrome中模态对话框showModalDialog返回值问题的解决方法
2010/05/25 Javascript
JavaScript 通过模式匹配实现重载
2010/08/12 Javascript
JQuery动态创建DOM、表单元素的实现代码
2011/08/09 Javascript
使用JS或jQuery模拟鼠标点击a标签事件代码
2014/03/10 Javascript
Javascript玩转继承(二)
2014/05/08 Javascript
Node.js安装教程和NPM包管理器使用详解
2014/08/16 Javascript
javascript的push使用指南
2014/12/05 Javascript
浅谈javascript运算符——条件,逗号,赋值,()和void运算符
2016/07/15 Javascript
浅谈bootstrap使用中的一些问题以及解决过程
2016/10/18 Javascript
利用CSS、JavaScript及Ajax实现图片预加载的方法
2016/11/29 Javascript
JS表单验证方法实例小结【电话、身份证号、Email、中文、特殊字符、身份证号等】
2017/02/14 Javascript
easyui combogrid实现本地模糊搜索过滤多列
2017/05/13 Javascript
AngularJS读取JSON及XML文件的方法示例
2017/05/25 Javascript
Nodejs 和 Electron ubuntu下快速安装过程
2018/05/04 NodeJs
vue-cli3 DllPlugin 提取公用库的方法
2019/04/24 Javascript
javascript面向对象三大特征之继承实例详解
2019/07/24 Javascript
javascript的delete运算符知识点总结
2019/11/19 Javascript
webpack 动态批量加载文件的实现方法
2020/03/19 Javascript
JavaScript实现简单的图片切换功能(实例代码)
2020/04/10 Javascript
JS创建自定义对象的六种方法总结
2020/12/15 Javascript
python概率计算器实例分析
2015/03/25 Python
使用优化器来提升Python程序的执行效率的教程
2015/04/02 Python
Python中的取模运算方法
2018/11/10 Python
解决Djang2.0.1中的reverse导入失败的问题
2019/08/16 Python
Python转换字典成为对象,可以用&quot;.&quot;方式访问对象属性实例
2020/05/11 Python
keras之权重初始化方式
2020/05/21 Python
实例讲解使用CSS实现多边框和透明边框的方法
2015/09/08 HTML / CSS
德国BA保镖药房韩文网:kr.ba.de
2017/09/04 全球购物
GoPro摄像机美国官网:美国运动相机厂商
2018/07/03 全球购物
党小组考察意见
2015/06/02 职场文书
地道战观后感2000字
2015/06/04 职场文书
2015年大学组织委员个人工作总结
2015/10/23 职场文书
如何使用pdb进行Python调试
2021/06/30 Python
Vue.js中v-bind指令的用法介绍
2022/03/13 Vue.js