理解php原理的opcodes(操作码)


Posted in PHP onOctober 26, 2010

Opcondes是一种php脚本编译后的中间语言,就像Java的Byte Code,或者.NET 的MSL 。(都没了解过~)

举个文中的例子

<?php 
echo "Hello World"; 

$a = 1 + 1; 

 echo $a; 

?>

PHP执行这段代码会经过如下4个步骤(确切的来说,应该是PHP的语言引擎Zend)
1.Scanning(Lexing) (扫描),将PHP代码转换为语言片段(Tokens) 

2.Parsing(语法分析), 将Tokens转换成简单而有意义的表达式 

3.Compilation(编译), 将表达式编译成Opocdes 

4.Execution(执行编译后的结果), 顺次执行Opcodes,每次一条,从而实现PHP脚本的功能。

其中他还提到一句:“现在有的Cache比如APC,可以使得PHP缓存住Opcodes,这样,每次有请求来临的时候,就不需要重复执行前面3步,从而能大幅的提高PHP的执行速度。 ” 这可能是php执行速度比较快的原因之一吧~

那什么是Lexing? 学过编译原理的同学都应该对编译原理中的词法分析步骤有所了解,Lex就是一个词法分析的依据表。 Zend/zend_language_scanner.c会根据Zend/zend_language_scanner.l(Lex文件),来输入的 PHP代码进行词法分析,从而得到一个一个的“词”,PHP4.2开始提供了一个函数叫token_get_all,这个函数就可以讲一段PHP代码 Scanning成Tokens;
如果用这个函数处理我们开头提到的PHP代码,将会得到如下结果:

Array 
( 
[0] => Array 
( 
[0] => 367 
[1] => Array 
( 
[0] => 316 
[1] => echo 
) 
[2] => Array 
( 
[0] => 370 
[1] => 
) 
[3] => Array 
( 
[0] => 315 
[1] => "Hello World" 
) 
[4] => ; 
[5] => Array 
( 
[0] => 370 
[1] => 
) 
[6] => = 
[7] => Array 
( 
[0] => 370 
[1] => 
) 
[8] => Array 
( 
[0] => 305 
[1] => 1 
) 
[9] => Array 
( 
[0] => 370 
[1] => 
) 
[10] => + 
[11] => Array 
( 
[0] => 370 
[1] => 
) 
[12] => Array 
( 
[0] => 305 
[1] => 1 
) 
[13] => ; 
[14] => Array 
( 
[0] => 370 
[1] => 
) 
[15] => Array 
( 
[0] => 316 
[1] => echo 
) 
[16] => Array 
( 
[0] => 370 
[1] => 
) 
[17] => ; 
)

分析这个返回结果我们可以发现,源码中的字符串,字符,空格,都会原样返回。每个源代码中的字符,都会出现在相应的顺序处。而,其他的比如标签,操作符, 语句,都会被转换成一个包含俩部分的Array: Token ID (也就是在Zend内部的改Token的对应码,比如,T_ECHO,T_STRING),和源码中的原来的内容。
接下来,就是Parsing阶段了,Parsing首先会丢弃Tokens Array中的多于的空格,然后将剩余的Tokens转换成一个一个的简单的表达式
1.echo a constant string 
2.add two numbers together 
3.store the result of the prior expression to a variable 
4.echo a variable

然后就改Compilation阶段了,它会把Tokens编译成一个个op_array, 每个op_arrayd包含如下5个部分:
1.Opcode数字的标识,指明了每个op_array的操作类型,比如add , echo 
2.结果 存放Opcode结果 
3.操作数1 给Opcode的操作数 
4.操作数2 
5.扩展值 1个整形用来区别被重载的操作符

比如,我们的PHP代码会被Parsing成:
* ZEND_ECHO 'Hello World' 
* ZEND_ADD ~0 1 1 
* ZEND_ASSIGN !0 ~0 
* ZEND_ECHO !0

呵呵,你可能会问了,我们的$a去那里了?

恩,这个要介绍操作数了,每个操作数都是由以下俩个部分组成:

a)op_type : 为IS_CONST, IS_TMP_VAR, IS_VAR, IS_UNUSED, or IS_CVb)u,一个联合体,根据op_type的不同,分别用不同的类型保存了这个操作数的值(const)或者左值(var)而对于var来说,每个var也不一样

IS_TMP_VAR, 顾名思义,这个是一个临时变量,保存一些op_array的结果,以便接下来的op_array使用,这种的操作数的u保存着一个指向变量表的一个句柄(整数),这种操作数一般用~开头,比如~0,表示变量表的0号未知的临时变量

IS_VAR 这种就是我们一般意义上的变量了,他们以$开头表示

IS_CV 表示ZE2.1/PHP5.1以后的编译器使用的一种cache机制,这种变量保存着被它引用的变量的地址,当一个变量第一次被引用的时候,就会被CV起来,以后对这个变量的引用就不需要再次去查找active符号表了,CV变量以!开头表示。

这么看来,我们的$a被优化成!0了。
总结:

1.php的执行顺序是: -> php程序

-> 被Scanning(扫描转换为Tokens(语言片段))

-> 被Parsing(语法分析,将Tokens转换成简单而有意义的表达式)

-> Compilation(编译,将表达式编译成Opocdes(操作码))
-> Execution(顺序执行编译后的结果)
2. APC(Alternative PHP Cache)的缓存机制可以缓存住Opcodes,这样,下次有请求来临的时候,就不需要重复执行前面3步,从而能大幅的提高PHP的执行速度。 这可能是php执行速度比较快的原因之一

补充:
apc,zend optimize是之所以能够加速php
就是因为他可以缓存opcode
并不是zend引擎本身自带的功能
zend引擎默认是一个轮回中任何一项都要走的

PHP 相关文章推荐
基于mysql的bbs设计(一)
Oct 09 PHP
用PHPdig打造属于你自己的Google[图文教程]
Feb 14 PHP
linux php mysql数据库备份实现代码
Mar 10 PHP
UCenter 批量添加用户的php代码
Jul 17 PHP
解析php中获取url与物理路径的总结
Jun 21 PHP
浅谈php自定义错误日志
Feb 13 PHP
php实现短信发送代码
Jul 05 PHP
PHP之浮点数计算比较以及取整数不准确的解决办法
Jul 29 PHP
php表单加入Token防止重复提交的方法分析
Oct 10 PHP
Paypal实现循环扣款(订阅)功能
Mar 23 PHP
Laravel 实现密码重置功能
Feb 23 PHP
详细分析PHP7与PHP5区别
Jun 26 PHP
PHP下常用正则表达式整理
Oct 26 #PHP
PHP编程最快明白(第一讲 软件环境和准备工作)
Oct 25 #PHP
微盾PHP脚本加密专家php解密算法
Sep 13 #PHP
smarty中先strip_tags过滤html标签后truncate截取文章运用
Oct 25 #PHP
php正则过滤html标签、空格、换行符的代码(附说明)
Oct 25 #PHP
PHP 强制下载文件代码
Oct 24 #PHP
php下网站防IP攻击代码,超级实用
Oct 24 #PHP
You might like
php定义一个参数带有默认值的函数实例分析
2015/03/16 PHP
Laravel 5使用Laravel Excel实现Excel/CSV文件导入导出的功能详解
2017/10/11 PHP
单击按钮显示隐藏子菜单经典案例
2013/01/04 Javascript
Javascript获取HTML静态页面参数传递值示例
2013/08/18 Javascript
javascript计时器事件使用详解
2014/01/07 Javascript
用javascript替换URL中的参数值示例代码
2014/01/27 Javascript
js获取下拉列表的值和元素个数示例
2014/05/07 Javascript
angularjs表格ng-table使用备忘录
2016/03/09 Javascript
基于JQuery打造无缝滚动新闻步骤详解
2016/03/31 Javascript
解析JavaScript面向对象概念中的Object类型与作用域
2016/05/10 Javascript
1秒50万字!js实现关键词匹配
2016/08/01 Javascript
Web纯前端“旭日图”实现元素周期表
2017/03/10 Javascript
ES6新特性之字符串的扩展实例分析
2017/04/01 Javascript
Javascript实现数组中的元素上下移动
2017/04/28 Javascript
JavaScript内存泄漏的处理方式
2017/11/20 Javascript
VUE基于NUXT的SSR 服务端渲染
2018/11/30 Javascript
[04:53]DOTA2英雄基础教程 祈求者
2014/01/03 DOTA
python生成IP段的方法
2015/07/07 Python
简单谈谈Python中的json与pickle
2017/07/19 Python
高质量Python代码编写的5个优化技巧
2017/11/16 Python
pandas 实现将重复表格去重,并重新转换为表格的方法
2018/04/18 Python
如何用python整理附件
2018/05/13 Python
使用python 打开文件并做匹配处理的实例
2019/01/02 Python
python模拟鼠标点击和键盘输入的操作
2019/08/04 Python
python wav模块获取采样率 采样点声道量化位数(实例代码)
2020/01/22 Python
解决pycharm不能自动保存在远程linux中的问题
2021/02/06 Python
HTML5 预加载让页面得以快速呈现
2013/08/13 HTML / CSS
如何写求职信
2014/05/24 职场文书
安全教育主题班会总结
2015/08/14 职场文书
大学生学习十八届五中全会精神心得体会
2016/01/05 职场文书
《地震中的父与子》教学反思
2016/02/16 职场文书
请假条应该怎么写?
2019/06/24 职场文书
选择比努力更重要?这是长期以来对“努力”的最大误解
2019/07/12 职场文书
公司要求试用期员工提交“述职报告”,该怎么写?
2019/07/17 职场文书
导游词之珠海轮廓
2019/10/25 职场文书
经典人生语录分享:不畏将来,不念过去,笑对当下
2019/12/12 职场文书