PHP及Zend Engine的线程安全模型分析


Posted in PHP onNovember 10, 2011

不知道怎么回事总是令人不舒服的,因此我通过阅读源码和查阅有限的资料简要了解一下相关机制,本文是我对研究内容的总结。 本文首先解释了线程安全的概念及PHP中线程安全的背景,然后详细研究了PHP的线程安全机制ZTS(Zend Thread Safety)及具体的实现TSRM,研究内容包括相关数据结构、实现细节及运行机制,最后研究了Zend对于单线程和多线程环境的选择性编译问题。

线程安全
线程安全问题,一言以蔽之就是多线程环境下如何安全存取公共资源。我们知道,每个线程只拥有一个私有栈,共享所属进程的堆。在C中,当一个变量被声明在任何函数之外时,就成为一个全局变量,这时这个变量会被分配到进程的共享存储空间,不同线程都引用同一个地址空间,因此一个线程如果修改了这个变量,就会影响到全部线程。这看似为线程共享数据提供了便利,但是PHP往往是每个线程处理一个请求,因此希望每个线程拥有一个全局变量的副本,而不希望请求间相互干扰。 早期的PHP往往用于单线程环境,每个进程只启动一个线程,因此不存在线程安全问题。后来出现了多线程环境下使用PHP的场景,因此Zend引入了Zend线程安全机制(Zend Thread Safety,简称ZTS)用于保证线程的安全。

ZTS的基本原理及实现
基本思想
说起来ZTS的基本思想是很直观的,不是就是需要每个全局变量在每个线程都拥有一个副本吗?那我就提供这样的机制: 在多线程环境下,申请全局变量不再是简单声明一个变量,而是整个进程在堆上分配一块内存空间用作“线程全局变量池”,在进程启动时初始化这个内存池,每当有线程需要申请全局变量时,通过相应方法调用TSRM(Thread Safe Resource Manager,ZTS的具体实现)并传递必要的参数(如变量大小等等),TSRM负责在内存池中分配相应内存区块并将这块内存的引用标识返回,这样下次这个线程需要读写此变量时,就可以通过将唯一的引用标识传递给TSRM,TSRM将负责真正的读写操作。这样就实现了线程安全的全局变量。下图给出了ZTS原理的示意图:
PHP及Zend Engine的线程安全模型分析Thread1和Thread2同属一个进程,其中各自需要一个全局变量Global Var,TSRM为两者在线程全局内存池中(黄色部分)各自分配了一个区域,并且通过唯一的ID进行标识,这样两个线程就可以通过TSRM存取自己的变量而互不干扰。 下面通过具体的代码片段看一下Zend具体是如何实现这个机制的。这里我用的是PHP5.3.8的源码。 TSRM的实现代码在PHP源码的“TSRM”目录下。

数据结构
TSRM中比较重要的数据结构有两个:tsrm_tls_entry和tsrm_resource_type。下面先看tsrm_tls_entry。 tsrm_tls_entry定义在TSRM/TSRM.c中:

typedef struct _tsrm_tls_entry tsrm_tls_entry; struct _tsrm_tls_entry { 
void **storage; 
int count; 
THREAD_T thread_id; 
tsrm_tls_entry *next; 
}

每个tsrm_tls_entry结构负责表示一个线程的所有全局变量资源,其中thread_id存储线程ID,count记录全局变量数,next指向下一个节点。storage可以看做指针数组,其中每个元素是一个指向本节点代表线程的一个全局变量。最终各个线程的tsrm_tls_entry被组成一个链表结构,并将链表头指针赋值给一个全局静态变量tsrm_tls_table。注意,因为tsrm_tls_table是一个货真价实的全局变量,所以所有线程会共享这个变量,这就实现了线程间的内存管理一致性。tsrm_tls_entry和tsrm_tls_table结构的示意图如下:
PHP及Zend Engine的线程安全模型分析tsrm_resource_type的内部结构相对简单一些:
typedef struct { 
size_t size; 
ts_allocate_ctor ctor; 
ts_allocate_dtor dtor; 
int done; 
}

tsrm_resource_type;上文说过tsrm_tls_entry是以线程为单位的(每个线程一个节点),而tsrm_resource_type以资源(或者说全局变量)为单位,每次一个新的资源被分配时,就会创建一个tsrm_resource_type。所有tsrm_resource_type以数组(线性表)的方式组成tsrm_resource_table,其下标就是这个资源的ID。每个tsrm_resource_type存储了此资源的大小和构造、析构方法指针。某种程度上,tsrm_resource_table可以看做是一个哈希表,key是资源ID,value是tsrm_resource_type结构。

实现细节
这一小节分析TSRM一些算法的实现细节。因为整个TSRM涉及代码比较多,这里拣其中具有代表性的两个函数分析。 第一个值得注意的是tsrm_startup函数,这个函数在进程起始阶段被sapi调用,用于初始化TSRM的环境。由于tsrm_startup略长,这里摘录出我认为应该注意的地方:

/* Startup TSRM (call once for the entire process) */ 
TSRM_API int tsrm_startup(int expected_threads, int expected_resources, int debug_level, char *debug_filename) 
{ 
/* code... */ tsrm_tls_table_size = expected_threads; 
tsrm_tls_table = (tsrm_tls_entry **) calloc(tsrm_tls_table_size, sizeof(tsrm_tls_entry *)); 
if (!tsrm_tls_table) { 
TSRM_ERROR((TSRM_ERROR_LEVEL_ERROR, "Unable to allocate TLS table")); 
return 0; 
} 
id_count=0; 
resource_types_table_size = expected_resources; 
resource_types_table = (tsrm_resource_type *) calloc(resource_types_table_size, sizeof(tsrm_resource_type)); 
if (!resource_types_table) { 
TSRM_ERROR((TSRM_ERROR_LEVEL_ERROR, "Unable to allocate resource types table")); 
free(tsrm_tls_table); 
tsrm_tls_table = NULL; 
return 0; 
} 
/* code... */ 
return 1; 
}

其实tsrm_startup的主要任务就是初始化上文提到的两个数据结构。第一个比较有意思的是它的前两个参数:expected_threads和expected_resources。这两个参数由sapi传入,表示预计的线程数和资源数,可以看到tsrm_startup会按照这两个参数预先分配空间(通过calloc)。因此TSRM会首先分配可容纳expected_threads个线程和expected_resources个资源的。要看各个sapi默认会传入什么,可以看各个sapi的源码(在sapi目录下),我简单看了一下:
PHP及Zend Engine的线程安全模型分析可以看到比较常用的sapi如mod_php5、php-fpm和cgi都是预分配一个线程和一个资源,这样是因为不愿浪费内存空间,而且多数情况下PHP还是运行于单线程环境。 这里还可以看到一个id_count变量,这个变量是一个全局静态变量,其作用就是通过自增产生资源ID,这个变量在这里被初始化为0。所以TSRM产生资源ID的方式非常简单:就是一个整形变量的自增。 第二个需要仔细分析的就是ts_allocate_id,编写过PHP扩展的朋友对这个函数肯定不陌生,这个函数...
PHP 相关文章推荐
一个很方便的 XML 类!!原创的噢
Oct 09 PHP
PHP在Web开发领域的优势
Oct 09 PHP
PHP Warning: PHP Startup: Unable to load dynamic library \ D:/php5/ext/php_mysqli.dll\
Jun 17 PHP
在smarty中调用php内置函数的方法
Feb 07 PHP
浅析memcache启动以及telnet命令详解
Jun 28 PHP
PHP使用逆波兰式计算工资的方法
Jul 29 PHP
如何解决phpmyadmin导入数据库文件最大限制2048KB
Oct 09 PHP
yii2中结合gridview如何使用modal弹窗实例代码详解
Jun 12 PHP
eclipse php wamp配置教程
Jun 30 PHP
php利用云片网实现短信验证码功能的示例代码
Nov 18 PHP
PHP检查文件是否存在,不存在自动创建及读取文件内容操作示例
Jan 23 PHP
PHP 数组操作详解【遍历、指针、函数等】
May 13 PHP
PHP 多维数组的排序问题 根据二维数组中某个项排序
Nov 09 #PHP
php fsockopen中多线程问题的解决办法[翻译]
Nov 09 #PHP
PHP句法规则详解 入门学习
Nov 09 #PHP
php空间不支持socket但支持curl时recaptcha的用法
Nov 07 #PHP
PHP动态分页函数,PHP开发分页必备啦
Nov 07 #PHP
php获取远程图片的两种 CURL方式和sockets方式获取远程图片
Nov 07 #PHP
php数组函数序列之array_pop() - 删除数组中的最后一个元素
Nov 07 #PHP
You might like
PHP+MYSQL的文章管理系统(一)
2006/10/09 PHP
使用php发送有附件的电子邮件-(PHPMailer使用的实例分析)
2013/04/26 PHP
php计算两个日期时间差(返回年、月、日)
2014/06/19 PHP
php单态设计模式(单例模式)实例
2014/11/18 PHP
win7系统配置php+Apache+mysql环境的方法
2015/08/21 PHP
JS限制上传图片大小不使用控件在本地实现
2012/12/19 Javascript
jQuery遍历Table应用示例
2014/04/09 Javascript
JavaScript中的原始值和复杂值
2016/01/07 Javascript
jQuery图片左右滚动代码 有左右按钮实例
2016/06/20 Javascript
ionic+AngularJs实现获取验证码倒计时按钮
2017/04/22 Javascript
vue中简单弹框dialog的实现方法
2018/02/26 Javascript
Vue.js 事件修饰符的使用教程
2018/11/01 Javascript
微信小程序自定义底部导航带跳转功能
2018/11/27 Javascript
三分钟教你用Node做一个微信哄女友(基友)神器(面向小白)
2019/06/21 Javascript
微信小程序实现类似微信点击语音播放效果
2020/03/30 Javascript
如何使用three.js 制作一个三维的推箱子游戏
2020/07/29 Javascript
Vue中用JSON实现刷新界面不影响倒计时
2020/10/26 Javascript
采用Psyco实现python执行速度提高到与编译语言一样的水平
2014/10/11 Python
Python2.x版本中基本的中文编码问题解决
2015/10/12 Python
Python3 模块、包调用&路径详解
2017/10/25 Python
运动检测ViBe算法python实现代码
2018/01/09 Python
windows下cx_Freeze生成Python可执行程序的详细步骤
2018/10/09 Python
Python 实现数据结构-循环队列的操作方法
2019/07/17 Python
Python使用matplotlib实现交换式图形显示功能示例
2019/09/06 Python
python不使用for计算两组、多个矩形两两间的iou方式
2020/01/18 Python
CSS3实现红包抖动效果
2020/12/23 HTML / CSS
Allsole美国/加拿大:英国一家专门出售品牌鞋子的网站
2018/10/21 全球购物
安全的后院和健身蹦床:JumpSport
2019/07/15 全球购物
电气技术员岗位职责
2013/11/19 职场文书
小学教师事迹材料
2014/01/13 职场文书
即将毕业大学生自荐信
2014/01/24 职场文书
先进事迹报告会主持词
2014/04/02 职场文书
市贸粮局召开党的群众路线教育实践活动总结大会新闻稿
2014/10/21 职场文书
法人身份证明书
2015/06/18 职场文书
生活委员竞选稿
2015/11/21 职场文书
python中的3种定义类方法
2021/11/27 Python