深入理解PHP之OpCode原理详解


Posted in PHP onJune 01, 2016

本文实例讲述了PHP中OpCode的原理。分享给大家供大家参考,具体如下:

OpCode是一种PHP脚本编译后的中间语言,就像Java的ByteCode,或者.NET的MSL。 此文主要基于《 Understanding OPcode》和 网络,根据个人的理解和修改,特记录下来 :

PHP代码:

<?php
  echo "Hello World";
  $a = 1 + 1;
  echo $a;
?>

PHP执行这段代码会经过如下4个步骤:

1. Scanning (Lexing) ,将PHP代码转换为语言片段(Tokens)
2. Parsing , 将Tokens转换成简单而有意义的表达式
3. Compilation , 将表达式编译成Opocdes
4. Execution , 顺次执行Opcodes,每次一条,从而实现PHP脚本的功能。

注:现在有的Cache比如:APC ,可以使得PHP缓存Opcodes ,这样,每次有请求来临的时候,就不需要重复执行前面3步,从而能大幅的提高PHP的执行速度。

首先,Zend/zend_language_scanner.c 会根据Zend/zend_language_scanner.l(Lex文件),来对输入的 PHP代码进行词法分析,从而得到一个一个的“词”,PHP4.2+开始提供了一个函数叫token_get_all ,这个函数就可以讲一段PHP代码 Scanning成Tokens;

<?php
$tokens = token_get_all('<?php
  echo "Hello World";
  $a = 1 + 1;
  echo $a;
?>');
print_r($tokens);
?>

将会得到如下结果:

Array
(
  [0] => Array
    (
      [0] => 367
      [1] => <?php
      [2] => 1
    )
  [1] => Array
    (
      [0] => 370
      [1] =>
      [2] => 2
    )
  [2] => Array
    (
      [0] => 316
      [1] => echo
      [2] => 2
    )
  [3] => Array
    (
      [0] => 370
      [1] =>
      [2] => 2
    )
  [4] => Array
    (
      [0] => 315
      [1] => "Hello World"
      [2] => 2
    )
  [5] => ;
  [6] => Array
    (
      [0] => 370
      [1] =>
      [2] => 2
    )
  [7] => Array
    (
      [0] => 309
      [1] => $a
      [2] => 3
    )
  [8] => Array
    (
      [0] => 370
      [1] =>
      [2] => 3
    )
  [9] => =
  [10] => Array
    (
      [0] => 370
      [1] =>
      [2] => 3
    )
  [11] => Array
    (
      [0] => 305
      [1] => 1
      [2] => 3
    )
  [12] => Array
    (
      [0] => 370
      [1] =>
      [2] => 3
    )
  [13] => +
  [14] => Array
    (
      [0] => 370
      [1] =>
      [2] => 3
    )
  [15] => Array
    (
      [0] => 305
      [1] => 1
      [2] => 3
    )
  [16] => ;
  [17] => Array
    (
      [0] => 370
      [1] =>
      [2] => 3
    )
  [18] => Array
    (
      [0] => 316
      [1] => echo
      [2] => 4
    )
  [19] => Array
    (
      [0] => 370
      [1] =>
      [2] => 4
    )
  [20] => Array
    (
      [0] => 309
      [1] => $a
      [2] => 4
    )
  [21] => ;
  [22] => Array
    (
      [0] => 370
      [1] =>
      [2] => 4
    )
  [23] => Array
    (
      [0] => 369
      [1] => ?>
      [2] => 5
    )
)

返回的结果, 源码中的字符串,字符,空格,都会原样返回。每个源代码中的字符,都会出现在相应的顺序处。而,其他的比如标签,操作符,语句,都会被转换成一个包含俩部分的Array: Token ID (也就是在Zend内部的改Token的对应码,比如,T_ECHO,T_STRING),和源码中的原来的内容。

接下来,就是Parsing阶段了,Parsing首先会丢弃Tokens Array中的多于的空格,然后将剩余的Tokens转换成一个一个的简单的表达式

1. echo a constant string
2. add two numbers together
3. store the result of the prior expression to a variable
4. echo a variable

然后,就改Compilation阶段了,它会把Tokens编译成一个个op_array,每个op_arrayd包含如下5个部分:

1. Opcode数字的标识,指明了每个op_array的操作类型,比如add,echo
2. 结果存放Opcode结果
3. 操作数1给Opcode的操作数
4. 操作数2
5. 扩展值1个整形用来区别被重载的操作符

比如,PHP代码会被Parsing成:

[root@localhost html]# /usr/local/php/bin/php -dvld.active=1 hello.php
Branch analysis from position: 0
Return found
filename:    /var/www/html/hello.php
function name: (null)
number of ops: 6
compiled vars: !0 = $a
line   # op              fetch     ext return operands
-------------------------------------------------------------------------------
  2   0 ECHO                           'Hello+world'
  3   1 ADD                       ~0   1, 1
     2 ASSIGN                          !0, ~0
  4   3 ECHO                           !0
  6   4 RETURN                          1
     5* ZEND_HANDLE_EXCEPTION
Hello world2

每个操作数都是由以下两个部分组成:

a) op_type : 为IS_CONST, IS_TMP_VAR, IS_VAR, IS_UNUSED, or IS_CV

b) u,一个联合体,根据op_type的不同,分别用不同的类型保存了这个操作数的值(const)或者左值(var)

而对于var来说,每个var也不一样。  IS_TMP_VAR, 顾名思义,这个是一个临时变量 ,保存一些op_array的结果,以便接下来的op_array使用,这种的操作数的u保存着一个指向变量表的一个句柄(整数),这种操作数一般用~开头,比如~0,表示变量表的0号未知的临时变量IS_VAR 这种就是我们一般意义上的变量了,他们以$开头表示IS_CV 表示ZE2.1/PHP5.1以后的编译器使用的一种cache机制,这种变量保存着被它引用的变量的地址 ,当一个变量第一次被引用的时候,就会被CV起来,以后对这个变量的引用就不需要再次去查找active符号表了,CV变量以 ! 开头表示。

$a 变量就被优化成 !0 了。

希望本文所述对大家PHP程序设计有所帮助。

PHP 相关文章推荐
php预定义常量
Dec 25 PHP
PHP的一个基础知识 表单提交
Jul 04 PHP
PHP管理内存函数 memory_get_usage()使用介绍
Sep 23 PHP
PHP分页类集锦
Nov 18 PHP
php计算两个整数的最大公约数常用算法小结
Mar 05 PHP
Laravel 5框架学习之日期,Mutator 和 Scope
Apr 08 PHP
PHP实现中文圆形印章特效
Jun 19 PHP
php简单判断文本编码的方法
Jul 30 PHP
给WordPress中的留言加上楼层号的PHP代码实例
Dec 14 PHP
PHP批量去除BOM头内容信息代码
Mar 11 PHP
PHP下的浮点运算不准的解决方法
Oct 27 PHP
thinkphp下MySQL数据库读写分离代码剖析
Apr 18 PHP
深入理解PHP中的count函数
May 31 #PHP
Ubuntu server 11.04安装memcache及php使用memcache来存储session的方法
May 31 #PHP
php中json_encode不兼容JSON_UNESCAPED_UNICODE的解决方案
May 31 #PHP
让你的PHP7更快之Hugepage用法分析
May 31 #PHP
PHP表单数据写入MySQL数据库的代码
May 31 #PHP
PHP将页面中点击数量高的链接进行高亮显示的方法
May 30 #PHP
PHP如何实现跨域
May 30 #PHP
You might like
php.ini中date.timezone设置分析
2011/07/29 PHP
PHP网页游戏学习之Xnova(ogame)源码解读(十二)
2014/06/25 PHP
Laravel 5框架学习之表单验证
2015/04/08 PHP
使用Apache的rewrite
2021/03/09 Servers
js 验证密码强弱的小例子
2013/03/21 Javascript
JS图片无缝滚动(简单利于使用)
2013/06/17 Javascript
jquery submit ie6下失效的原因分析及解决方法
2013/11/15 Javascript
纯javascript判断查询日期是否为有效日期
2015/08/24 Javascript
深入浅析AngularJS和DataModel
2016/02/16 Javascript
Bootstrap每天必学之轮播(Carousel)插件
2016/04/25 Javascript
老司机带你解读jQuery插件开发流程
2016/05/16 Javascript
浅谈JavaScript对象的创建方式
2016/06/13 Javascript
jQuery实现页面下拉100像素出现悬浮窗口的方法
2016/09/05 Javascript
基于jquery实现弹幕效果
2016/09/29 Javascript
详解AngularJs路由之Ui-router-resolve(预加载)
2017/06/13 Javascript
node中使用es5/6以及支持性与性能对比
2017/08/11 Javascript
css配合JavaScript实现tab标签切换效果
2018/10/11 Javascript
vue路由守卫及路由守卫无限循环问题详析
2019/09/05 Javascript
layer实现登录弹框,登录成功后关闭弹框并调用父窗口的例子
2019/09/11 Javascript
python获取目录下所有文件的方法
2015/06/01 Python
Python调用C++程序的方法详解
2017/01/24 Python
python中实现指定时间调用函数示例代码
2017/09/08 Python
Django 根据数据模型models创建数据表的实例
2018/05/27 Python
python替换字符串中的子串图文步骤
2019/06/19 Python
python元组和字典的内建函数实例详解
2019/10/22 Python
python基于event实现线程间通信控制
2020/01/13 Python
求职自荐书范文
2013/12/04 职场文书
《草原》教学反思
2014/02/15 职场文书
教师节感恩老师演讲稿
2014/08/28 职场文书
2015大学生暑期实习报告
2015/07/13 职场文书
2019安全宣传标语大全
2019/08/14 职场文书
Python 制作自动化翻译工具
2021/04/25 Python
python四种出行路线规划的实现
2021/06/23 Python
深入解析Apache Hudi内核文件标记机制
2022/03/31 Servers
MySQL数据库 安全管理
2022/05/06 MySQL
win10壁纸在哪个文件夹 win10桌面背景图片文件位置分享
2022/08/05 数码科技