理解php原理的opcodes(操作码)


Posted in PHP onOctober 26, 2010

Opcondes是一种php脚本编译后的中间语言,就像Java的Byte Code,或者.NET 的MSL 。(都没了解过~)

举个文中的例子

<?php 
echo "Hello World"; 

$a = 1 + 1; 

 echo $a; 

?>

PHP执行这段代码会经过如下4个步骤(确切的来说,应该是PHP的语言引擎Zend)
1.Scanning(Lexing) (扫描),将PHP代码转换为语言片段(Tokens) 

2.Parsing(语法分析), 将Tokens转换成简单而有意义的表达式 

3.Compilation(编译), 将表达式编译成Opocdes 

4.Execution(执行编译后的结果), 顺次执行Opcodes,每次一条,从而实现PHP脚本的功能。

其中他还提到一句:“现在有的Cache比如APC,可以使得PHP缓存住Opcodes,这样,每次有请求来临的时候,就不需要重复执行前面3步,从而能大幅的提高PHP的执行速度。 ” 这可能是php执行速度比较快的原因之一吧~

那什么是Lexing? 学过编译原理的同学都应该对编译原理中的词法分析步骤有所了解,Lex就是一个词法分析的依据表。 Zend/zend_language_scanner.c会根据Zend/zend_language_scanner.l(Lex文件),来输入的 PHP代码进行词法分析,从而得到一个一个的“词”,PHP4.2开始提供了一个函数叫token_get_all,这个函数就可以讲一段PHP代码 Scanning成Tokens;
如果用这个函数处理我们开头提到的PHP代码,将会得到如下结果:

Array 
( 
[0] => Array 
( 
[0] => 367 
[1] => Array 
( 
[0] => 316 
[1] => echo 
) 
[2] => Array 
( 
[0] => 370 
[1] => 
) 
[3] => Array 
( 
[0] => 315 
[1] => "Hello World" 
) 
[4] => ; 
[5] => Array 
( 
[0] => 370 
[1] => 
) 
[6] => = 
[7] => Array 
( 
[0] => 370 
[1] => 
) 
[8] => Array 
( 
[0] => 305 
[1] => 1 
) 
[9] => Array 
( 
[0] => 370 
[1] => 
) 
[10] => + 
[11] => Array 
( 
[0] => 370 
[1] => 
) 
[12] => Array 
( 
[0] => 305 
[1] => 1 
) 
[13] => ; 
[14] => Array 
( 
[0] => 370 
[1] => 
) 
[15] => Array 
( 
[0] => 316 
[1] => echo 
) 
[16] => Array 
( 
[0] => 370 
[1] => 
) 
[17] => ; 
)

分析这个返回结果我们可以发现,源码中的字符串,字符,空格,都会原样返回。每个源代码中的字符,都会出现在相应的顺序处。而,其他的比如标签,操作符, 语句,都会被转换成一个包含俩部分的Array: Token ID (也就是在Zend内部的改Token的对应码,比如,T_ECHO,T_STRING),和源码中的原来的内容。
接下来,就是Parsing阶段了,Parsing首先会丢弃Tokens Array中的多于的空格,然后将剩余的Tokens转换成一个一个的简单的表达式
1.echo a constant string 
2.add two numbers together 
3.store the result of the prior expression to a variable 
4.echo a variable

然后就改Compilation阶段了,它会把Tokens编译成一个个op_array, 每个op_arrayd包含如下5个部分:
1.Opcode数字的标识,指明了每个op_array的操作类型,比如add , echo 
2.结果 存放Opcode结果 
3.操作数1 给Opcode的操作数 
4.操作数2 
5.扩展值 1个整形用来区别被重载的操作符

比如,我们的PHP代码会被Parsing成:
* ZEND_ECHO 'Hello World' 
* ZEND_ADD ~0 1 1 
* ZEND_ASSIGN !0 ~0 
* ZEND_ECHO !0

呵呵,你可能会问了,我们的$a去那里了?

恩,这个要介绍操作数了,每个操作数都是由以下俩个部分组成:

a)op_type : 为IS_CONST, IS_TMP_VAR, IS_VAR, IS_UNUSED, or IS_CVb)u,一个联合体,根据op_type的不同,分别用不同的类型保存了这个操作数的值(const)或者左值(var)而对于var来说,每个var也不一样

IS_TMP_VAR, 顾名思义,这个是一个临时变量,保存一些op_array的结果,以便接下来的op_array使用,这种的操作数的u保存着一个指向变量表的一个句柄(整数),这种操作数一般用~开头,比如~0,表示变量表的0号未知的临时变量

IS_VAR 这种就是我们一般意义上的变量了,他们以$开头表示

IS_CV 表示ZE2.1/PHP5.1以后的编译器使用的一种cache机制,这种变量保存着被它引用的变量的地址,当一个变量第一次被引用的时候,就会被CV起来,以后对这个变量的引用就不需要再次去查找active符号表了,CV变量以!开头表示。

这么看来,我们的$a被优化成!0了。
总结:

1.php的执行顺序是: -> php程序

-> 被Scanning(扫描转换为Tokens(语言片段))

-> 被Parsing(语法分析,将Tokens转换成简单而有意义的表达式)

-> Compilation(编译,将表达式编译成Opocdes(操作码))
-> Execution(顺序执行编译后的结果)
2. APC(Alternative PHP Cache)的缓存机制可以缓存住Opcodes,这样,下次有请求来临的时候,就不需要重复执行前面3步,从而能大幅的提高PHP的执行速度。 这可能是php执行速度比较快的原因之一

补充:
apc,zend optimize是之所以能够加速php
就是因为他可以缓存opcode
并不是zend引擎本身自带的功能
zend引擎默认是一个轮回中任何一项都要走的

PHP 相关文章推荐
php中将时间差转换为字符串提示的实现代码
Aug 08 PHP
php class中self,parent,this的区别以及实例介绍
Apr 24 PHP
PHP判断远程图片或文件是否存在的实现代码
Feb 20 PHP
php实现的树形结构数据存取类实例
Nov 29 PHP
详解php比较操作符的安全问题
Dec 03 PHP
Thinkphp单字母函数使用指南
May 08 PHP
CI框架的安全性分析
May 18 PHP
php插入含有特殊符号数据的处理方法
Nov 24 PHP
PHP中时间加减函数strtotime用法分析
Apr 26 PHP
详解PHP字符串替换str_replace()函数四种用法
Oct 13 PHP
PHP实现求两个字符串最长公共子串的方法示例
Nov 17 PHP
PHP实现微信商户支付企业付款到零钱功能
Sep 30 PHP
PHP下常用正则表达式整理
Oct 26 #PHP
PHP编程最快明白(第一讲 软件环境和准备工作)
Oct 25 #PHP
微盾PHP脚本加密专家php解密算法
Sep 13 #PHP
smarty中先strip_tags过滤html标签后truncate截取文章运用
Oct 25 #PHP
php正则过滤html标签、空格、换行符的代码(附说明)
Oct 25 #PHP
PHP 强制下载文件代码
Oct 24 #PHP
php下网站防IP攻击代码,超级实用
Oct 24 #PHP
You might like
模板引擎正则表达式调试小技巧
2011/07/20 PHP
修改PHP的memory_limit限制的方法分享
2012/02/21 PHP
PHP图像处理之imagecreate、imagedestroy函数介绍
2014/11/19 PHP
PHP中大于2038年时间戳的问题处理方案
2015/03/03 PHP
PHPStudy下如何为Apache安装SSL证书的方法步骤
2019/01/23 PHP
Laravel 微信小程序后端搭建步骤详解
2019/11/26 PHP
Javascript 个人笔记(没有整理,很乱)
2007/07/07 Javascript
js判断背景图片是否加载成功使用img的width实现
2013/05/29 Javascript
js delete 用法(删除对象属性及变量)
2014/08/24 Javascript
javascript实现随时变化着的背景颜色
2015/04/02 Javascript
jQuery实现仿QQ在线客服效果的滚动层代码
2015/10/15 Javascript
字符串反转_JavaScript
2016/04/28 Javascript
Google 地图API Map()构造器详解
2016/08/06 Javascript
vue-dialog的弹出层组件
2020/05/25 Javascript
JS伪继承prototype实现方法示例
2018/06/20 Javascript
利用jquery和BootStrap实现动态滚动条效果
2018/12/03 jQuery
vue组件文档(.md)中如何自动导入示例(.vue)详解
2019/01/25 Javascript
node之本地服务器图片上传的方法示例
2019/03/26 Javascript
深入学习TypeScript 、React、 Redux和Ant-Design的最佳实践
2019/06/17 Javascript
在layer弹层layer.prompt中,修改placeholder的实现方法
2019/09/27 Javascript
vue video和vue-video-player实现视频铺满教程
2020/10/30 Javascript
[48:02]Ti4循环赛第三日 VG vs Liquid和NEWBEE vs DK
2014/07/12 DOTA
[01:09:16]DOTA2-DPC中国联赛 正赛 SAG vs Dynasty BO3 第一场 1月25日
2021/03/11 DOTA
Python的内存泄漏及gc模块的使用分析
2014/07/16 Python
Python模拟登录验证码(代码简单)
2016/02/06 Python
详解Python使用simplejson模块解析JSON的方法
2016/03/24 Python
python实现k-means聚类算法
2018/02/23 Python
python 利用pyttsx3文字转语音过程详解
2019/09/25 Python
Python命名空间namespace及作用域原理解析
2020/06/05 Python
python关于倒排列的知识点总结
2020/10/13 Python
欧缇丽加拿大官方网站:Caudalie加拿大
2019/07/18 全球购物
湖南卫视在线视频媒体平台:芒果TV
2019/10/30 全球购物
清扬洗发水广告词
2014/03/14 职场文书
投资合作意向书范本
2015/05/08 职场文书
公司宣传语大全
2015/07/13 职场文书
2015教师个人德育工作总结
2015/07/22 职场文书