深入理解PHP之OpCode原理详解


Posted in PHP onJune 01, 2016

本文实例讲述了PHP中OpCode的原理。分享给大家供大家参考,具体如下:

OpCode是一种PHP脚本编译后的中间语言,就像Java的ByteCode,或者.NET的MSL。 此文主要基于《 Understanding OPcode》和 网络,根据个人的理解和修改,特记录下来 :

PHP代码:

<?php
  echo "Hello World";
  $a = 1 + 1;
  echo $a;
?>

PHP执行这段代码会经过如下4个步骤:

1. Scanning (Lexing) ,将PHP代码转换为语言片段(Tokens)
2. Parsing , 将Tokens转换成简单而有意义的表达式
3. Compilation , 将表达式编译成Opocdes
4. Execution , 顺次执行Opcodes,每次一条,从而实现PHP脚本的功能。

注:现在有的Cache比如:APC ,可以使得PHP缓存Opcodes ,这样,每次有请求来临的时候,就不需要重复执行前面3步,从而能大幅的提高PHP的执行速度。

首先,Zend/zend_language_scanner.c 会根据Zend/zend_language_scanner.l(Lex文件),来对输入的 PHP代码进行词法分析,从而得到一个一个的“词”,PHP4.2+开始提供了一个函数叫token_get_all ,这个函数就可以讲一段PHP代码 Scanning成Tokens;

<?php
$tokens = token_get_all('<?php
  echo "Hello World";
  $a = 1 + 1;
  echo $a;
?>');
print_r($tokens);
?>

将会得到如下结果:

Array
(
  [0] => Array
    (
      [0] => 367
      [1] => <?php
      [2] => 1
    )
  [1] => Array
    (
      [0] => 370
      [1] =>
      [2] => 2
    )
  [2] => Array
    (
      [0] => 316
      [1] => echo
      [2] => 2
    )
  [3] => Array
    (
      [0] => 370
      [1] =>
      [2] => 2
    )
  [4] => Array
    (
      [0] => 315
      [1] => "Hello World"
      [2] => 2
    )
  [5] => ;
  [6] => Array
    (
      [0] => 370
      [1] =>
      [2] => 2
    )
  [7] => Array
    (
      [0] => 309
      [1] => $a
      [2] => 3
    )
  [8] => Array
    (
      [0] => 370
      [1] =>
      [2] => 3
    )
  [9] => =
  [10] => Array
    (
      [0] => 370
      [1] =>
      [2] => 3
    )
  [11] => Array
    (
      [0] => 305
      [1] => 1
      [2] => 3
    )
  [12] => Array
    (
      [0] => 370
      [1] =>
      [2] => 3
    )
  [13] => +
  [14] => Array
    (
      [0] => 370
      [1] =>
      [2] => 3
    )
  [15] => Array
    (
      [0] => 305
      [1] => 1
      [2] => 3
    )
  [16] => ;
  [17] => Array
    (
      [0] => 370
      [1] =>
      [2] => 3
    )
  [18] => Array
    (
      [0] => 316
      [1] => echo
      [2] => 4
    )
  [19] => Array
    (
      [0] => 370
      [1] =>
      [2] => 4
    )
  [20] => Array
    (
      [0] => 309
      [1] => $a
      [2] => 4
    )
  [21] => ;
  [22] => Array
    (
      [0] => 370
      [1] =>
      [2] => 4
    )
  [23] => Array
    (
      [0] => 369
      [1] => ?>
      [2] => 5
    )
)

返回的结果, 源码中的字符串,字符,空格,都会原样返回。每个源代码中的字符,都会出现在相应的顺序处。而,其他的比如标签,操作符,语句,都会被转换成一个包含俩部分的Array: Token ID (也就是在Zend内部的改Token的对应码,比如,T_ECHO,T_STRING),和源码中的原来的内容。

接下来,就是Parsing阶段了,Parsing首先会丢弃Tokens Array中的多于的空格,然后将剩余的Tokens转换成一个一个的简单的表达式

1. echo a constant string
2. add two numbers together
3. store the result of the prior expression to a variable
4. echo a variable

然后,就改Compilation阶段了,它会把Tokens编译成一个个op_array,每个op_arrayd包含如下5个部分:

1. Opcode数字的标识,指明了每个op_array的操作类型,比如add,echo
2. 结果存放Opcode结果
3. 操作数1给Opcode的操作数
4. 操作数2
5. 扩展值1个整形用来区别被重载的操作符

比如,PHP代码会被Parsing成:

[root@localhost html]# /usr/local/php/bin/php -dvld.active=1 hello.php
Branch analysis from position: 0
Return found
filename:    /var/www/html/hello.php
function name: (null)
number of ops: 6
compiled vars: !0 = $a
line   # op              fetch     ext return operands
-------------------------------------------------------------------------------
  2   0 ECHO                           'Hello+world'
  3   1 ADD                       ~0   1, 1
     2 ASSIGN                          !0, ~0
  4   3 ECHO                           !0
  6   4 RETURN                          1
     5* ZEND_HANDLE_EXCEPTION
Hello world2

每个操作数都是由以下两个部分组成:

a) op_type : 为IS_CONST, IS_TMP_VAR, IS_VAR, IS_UNUSED, or IS_CV

b) u,一个联合体,根据op_type的不同,分别用不同的类型保存了这个操作数的值(const)或者左值(var)

而对于var来说,每个var也不一样。  IS_TMP_VAR, 顾名思义,这个是一个临时变量 ,保存一些op_array的结果,以便接下来的op_array使用,这种的操作数的u保存着一个指向变量表的一个句柄(整数),这种操作数一般用~开头,比如~0,表示变量表的0号未知的临时变量IS_VAR 这种就是我们一般意义上的变量了,他们以$开头表示IS_CV 表示ZE2.1/PHP5.1以后的编译器使用的一种cache机制,这种变量保存着被它引用的变量的地址 ,当一个变量第一次被引用的时候,就会被CV起来,以后对这个变量的引用就不需要再次去查找active符号表了,CV变量以 ! 开头表示。

$a 变量就被优化成 !0 了。

希望本文所述对大家PHP程序设计有所帮助。

PHP 相关文章推荐
手把手教你使用DedeCms的采集的图文教程
Mar 11 PHP
PHP开发中的错误收集,不定期更新。
Feb 03 PHP
php数据库抽象层 PDO
May 07 PHP
php使用exec shell命令注入的方法讲解
Nov 12 PHP
php实现上传图片生成缩略图示例
Apr 13 PHP
PHP实现生成唯一编号(36进制的不重复编号)
Jul 01 PHP
PHP实现的简单分页类及用法示例
May 06 PHP
CI框架(ajax分页,全选,反选,不选,批量删除)完整代码详解
Nov 01 PHP
PHP magento后台无法登录问题解决方法
Nov 24 PHP
PHP生成(支持多模板)二维码海报代码
Apr 30 PHP
PHP使用pdo实现事务处理操作示例
Sep 05 PHP
PHP token验证生成原理实例分析
Jun 05 PHP
深入理解PHP中的count函数
May 31 #PHP
Ubuntu server 11.04安装memcache及php使用memcache来存储session的方法
May 31 #PHP
php中json_encode不兼容JSON_UNESCAPED_UNICODE的解决方案
May 31 #PHP
让你的PHP7更快之Hugepage用法分析
May 31 #PHP
PHP表单数据写入MySQL数据库的代码
May 31 #PHP
PHP将页面中点击数量高的链接进行高亮显示的方法
May 30 #PHP
PHP如何实现跨域
May 30 #PHP
You might like
让你的PHP同时支持GIF、png、JPEG
2006/10/09 PHP
PHP中使用Imagick实现各种图片效果实例
2015/01/21 PHP
深入解析PHP的Yii框架中的缓存功能
2016/03/29 PHP
PHP基于自增数据如何生成不重复的随机数示例
2017/05/19 PHP
php中array_fill函数的实例用法
2021/03/02 PHP
setAttribute 与 class冲突解决
2008/02/17 Javascript
javascript hashtable 修正版 下载
2010/12/30 Javascript
JS函数的定义与调用方法推荐
2016/05/12 Javascript
微信小程序 教程之注册页面
2016/10/17 Javascript
mui上拉加载功能实例详解
2017/04/13 Javascript
vue-cli单页应用改成多页应用配置详解
2017/07/14 Javascript
动态加载、移除js/css文件的示例代码
2018/03/20 Javascript
微信小程序图片加载失败时替换为默认图片的方法
2019/12/09 Javascript
JS实现点餐自动选择框(案例分析)
2019/12/10 Javascript
[44:15]DOTA2上海特级锦标赛主赛事日 - 5 败者组决赛Liquid VS EG第二局
2016/03/06 DOTA
Python 可爱的大小写
2008/09/06 Python
浅谈python字典多键值及重复键值的使用
2016/11/04 Python
Python 文件操作的详解及实例
2017/09/18 Python
redis之django-redis的简单缓存使用
2018/06/07 Python
tensorflow更改变量的值实例
2018/07/30 Python
如何在VSCode上轻松舒适的配置Python的方法步骤
2019/10/28 Python
Python获取统计自己的qq群成员信息的方法
2019/11/15 Python
Python 实现将数组/矩阵转换成Image类
2020/01/09 Python
python的Jenkins接口调用方式
2020/05/12 Python
美国新兴城市生活方式零售商:VILLA
2017/12/06 全球购物
OSPREY LONDON官网:英国本土皮具品牌
2019/05/31 全球购物
入学生会自荐书范文
2014/02/05 职场文书
光信息科学与技术专业职业生涯规划
2014/03/13 职场文书
募捐倡议书
2014/04/14 职场文书
2014年打非治违工作总结
2014/11/13 职场文书
毕业生爱心捐书倡议书
2015/04/27 职场文书
2015年监理个人工作总结
2015/05/23 职场文书
医务人员医德医风心得体会
2016/01/25 职场文书
Python实现简繁体转换
2021/06/07 Python
SpringBoot 整合mongoDB并自定义连接池的示例代码
2022/02/28 MongoDB
详解MySQL的主键查询为什么这么快
2022/04/03 MySQL