PHP 用数组降低程序的时间复杂度


Posted in PHP onDecember 04, 2009

而随着设备硬件配置的不断提升,对中小型应用程序来说,对算法的空间复杂度的要求也宽松了不少。不过,在当今 Web2.0 时代,对应用程序的时间复杂度却有了更高的要求。

什么是算法的时间复杂度呢?概要来说,是指从算法中选取一个能代表算法的原操作,以原操作重复执行的次数作为算法的时间量度。影响时间复杂度的因素有两个:一是原操作的执行时间,二是原操作因控制结构引起的执行次数。要把算法的时间复杂度降下来,降低原操作的执行次数是较为容易的方法,也是主要方法。本文所讲述的方法,是通过巧用 PHP 的数组,降低原操作的执行次数,从而达到降低算法时间复杂度的需求,和大家分享。

算法的时间量度记作 T(n)=O(f(n)),它表示算法中基本操作重复执行的次数是问题规模 n 的某个函数 f(n),也就是说随着问题规模 n 的增大,算法执行时间的增长率和 f(n) 的增长率相同。多数情况下,我们把最深层循环内的语句作为原操作来讨论算法的时间复杂度,因为它的执行次数和包含它的语句的频度相同。一般情况下,对一个问题只需选择一种基本操作来讨论算法的时间复杂度即可。有时也需要同时考虑多种基本操作。

在 Web 开发中,通常一个功能的执行时间或响应时间,不仅仅跟服务器的响应能力、处理能力有关,还涉及第三方工具的交互时间,如对数据库的链接时间和对数据进行存取的时间。因而在选定原操作是,需要综合考虑应用程序各方面的因素,以最大影响程序执行时间的操作为原操作,来衡量算法的时间复杂度。也就是说,需要程序员在编写代码的时候,对重要操作的执行时间能有基本的认识。

我们先看一个例子,假设 Web 程序的开发语言是 PHP,后台采用 DB2 数据库,PHP 通过 PEAR::DB 数据抽象层来实现对数据库的访问。

数据库中有学生表 STUDENTS(见表 1),班级表 CLASSES(见表 2),学生成绩表 SCORES(见表 3),需要在 Web 页面中显示出本次考试数学成绩超过 90 分的同学姓名和所在班级。

表 1. STUDENTS Table

列名 描述
SID 学号
STUNAME 姓名
GENDER 性别
AGE 年龄
CLASSID 班级号
 

表 2. CLASSES Table

列名 描述
CLASSID 班级号
CLASSNAME 班级名
 

表 3. SCORES Table

列名 描述
SID 学生学号
COURSE 学科
SCORE 成绩
 

根据个人编程习惯的不同,要解决这个问题,通常有两种做法(访问数据库的操作用 PEAR::DB 的方式表示),参看方法 1、2。

[ 方法 1 ]对 STUDENTS, CLASSES, SCORES 三个表做联合查询,一次获取满足条件的学生信息和班级信息。PHP 算法描述如下:

$querystr = "select distinct S.STUNAME as STUNAME,C.CLASSNAME as CLASSNAME ". "from STUDENTS as S,CLASSES as C,SCORES as R ". "where S.SID=R.SID and S.CLASSID=C.CLASSID and R.COURSE='Math' ". "and R.SCORE>=90"; $result = $db2handle->query( $querystr ); //从数据库中获取数据 while( $row=$result->fetchRow(DB_FETCHMODE_ASSOC) ){ //读取并显示数据 echo "StudentName=".$row['STUNAME']."\t ClassName=".$row['CLASSNAME']."\n"; }//Done

[ 方法 2 ]从 SCORES 表中找出满足条件的学生学号,然后从 STUDENTS 表中查找学生的姓名和班级编码,最后在 CLASSES 表中获取班级的名称。PHP 算法描述如下:

$scorestr = "select distinct SID from SCORES where COURSE='Math' and SCORE>=90"; $scoredata = $db2handle->query( $scorestr ); //从数据库中获取满足条件的学生学号 while( $score=$scoredata->fetchRow(DB_FETCHMODE_ASSOC) ){ //读取学生的学号,并在STUDENTS表中查找学生的姓名和班级编号 $studentstr = "select STUNAME,CLASSID from STUDENTS where SID='".$score['SID']."'"; $studata =$db2handle->query( $studentstr); $stu=$studata->fetchRow(DB_FETCHMODE_ASSOC); //显示学生的姓名 echo "StudentName=".$stu['STUNAME']."\t "; //读去学生的班级编号,并在CLASSES表中查找该学生所在班级名称 $classstr = "select CLASSNAME from CLASSES where CLASSID='".$stu['CLASSID']."'"; $classdata = $db2handle->query( $classstr); $class=$classdata ->fetchRow(DB_FETCHMODE_ASSOC); //显示学生的班级 echo "CLASSNAME=".$class['CLASSNAME']."\n"; }//end while for getting each student's ID. Done

对于这样的算法描述,相信大家会有似曾相识的感觉。这也是大多程序员广泛使用的算法。因为已经习惯了将思维中的算法逻辑直接译成代码,而往往没有时间和心思来斟酌算法的优劣。这里来分析一下这两种算法的时间复杂度。

因 Web 服务器读取并显示数据的时间相对较小,一般在 10ms 的数量级,而从 DB2 数据库里查询并获取数据的时间数量级会是 100ms 的数量级,并且随查询数据量的增加而增加。所以查询数据库的操作可作为量度时间复杂度的原操作,以 STUDENTS 表和 SCORES 表中的数据量作为问题规模 n( 通常情况下,CLASSES 表的数据量较小且相对稳定 )。

对于方法 1,随着问题规模 n 的增大,访问数据库的次数为常量 1。因而,时间复杂度为 T(n)=O(1)。对于方法 2,假设 SCORES 表中满足条件的记录有 m 个,则原操作的执行次数为 m+1。也就是说随着数据规模 n 的增大,原操作的执行次数成线性增长。可见时间复杂度为 T(n)=O(n)。可见,方法 1 的时间复杂度低。

那么方法 1 的问题在哪里?主要因为方法 1 会增大数据库负载,也就是原操作的执行时间受问题规模 n 的影响比较大。假设 STUDENTS,CLASSES,SCORES 的记录数分别为 X, Y, Z。那么在执行联合查询操作时,在数据库中会形成一个记录数为 X*Y*Z 的矩阵,然后在这个矩阵中查找满足条件的记录数,最后获取记录的 STUNAME 信息和 CLASSNAME。这样,任何一个表中的数据增加,都会造成矩阵表中记录的成倍增加。

主要思路 :在所需数据中存在相对简单且数据量稳定的情况下,利用 PHP 数组 (Array) 的下标 (Index) 可以为字符串 (String) 的特点,巧妙的将数据临时存放到数组中。这样可以通过下标 (Index) 快速获取所需值,从而降低对数据库的查询次数,进而降低算法的时间复杂度。

[ 方法 3 ]从 CLASSES 表中获取 CLASSID 和 CLASSNAME 的对应关系存放到 ClassArray 一维数组中,从 STUDENTS 表中获取 SID 和 STUNAME 以及 CLASSID 的对应关系存放到 StuArray 二维数组中。之后从 SCORES 表中找出满足条件的学生学号,从 StuArray 数组中读取学生的姓名和班级编号,从 ClassArray 中读取班级的名称。PHP 算法描述如下:

$ClassArray = Array(); $StuArray = Array(); $classstr = "select CLASSID,CLASSNAME from CLASSES"; $classdata = $db2handle->query( $classstr); while( $class=$classdata ->fetchRow(DB_FETCHMODE_ASSOC) ){ //生成ClassArray数组,下标Index以CLASSID命名,对应的值为CLASSNAME $ClassArray[$class['CLASSID']] = $class['CLASSNAME']; }//end while $ClassArray $stustr="select SID,STUNAME,CLASSID from STUDENTS"; $studata = $db2handle->query( $stustr); while( $stu=$studata ->fetchRow(DB_FETCHMODE_ASSOC) ){ //生成StuArray数组,下标Index以SID命名,对应的值为STUNAME和CLASSID $StuArray[$stu ['SID']]['STUNAME'] = $stu['STUNAME']; $StuArray[$stu ['SID']]['CLASSID'] = $stu['CLASSID']; }//end while $StuArray $scorestr = "select distinct SID from SCORES where COURSE='Math' and SCORE>=90"; $scoredata = $db2handle->query( $scorestr ); //从数据库中获取满足条件的学生学号 while( $score=$scoredata->fetchRow(DB_FETCHMODE_ASSOC) ){ //读取学生的学号,并从StuArray中读取学生的姓名,从ClassArray中读取班级名称 echo "StudentName=".$StuArray[ $score['SID'] ]['STUNAME']."\t "; echo "CLASSNAME=".$ClassArray[ $StuArray[ $score['SID'] ]['CLASSID'] ]."\n"; }//end while for getting each student's ID. Done

改进后方法的时间复杂度仍为 T(n)=O(1)。和方法 1 相比,方法 3 不必担心因某一个表中的记录增加而引起的数据库查询代价的成倍增加。和方法 2 相比,时间复杂度降低的同时,也没有影响算法空间复杂度。可谓一举两得。

虽然此优化方法简单易用,但并不是说它是万能的。使用时需要考虑“度”的问题。假设 STUDENTS 表的数据量很大,那么生成 StuArray 的时候对系统内存的消耗就增加,这样算法的空间复杂度就会受到影响。另外,当数据量足够大时,影响算法执行时间的主要因素就发生了变化,需要重新选择原操作。针对 STUDENTS 表记录数大,CLASSES 表记录少且稳定的情景,可以考虑用嵌套查询和数组相结合的方式,对算法进行优化。这里给出方法 4,以供参考。

[ 方法 4 ]从 CLASSES 表中获取 CLASSID 和 CLASSNAME 的对应关系存放到 ClassArray 一维数组中。从 SCORES 表中查询满足条件的学生学号,作为查询 STUDENTS 表的查询条件,获取学生的 STUNAME 和 CLASSID。之后从 ClassArray 中读取班级的名称。PHP 算法描述如下:

$ClassArray = Array(); $classstr = "select CLASSID,CLASSNAME from CLASSES"; $classdata = $db2handle->query( $classstr); while( $class=$classdata ->fetchRow(DB_FETCHMODE_ASSOC) ){ //生成ClassArray数组,下标Index以CLASSID命名,对应的值为CLASSNAME $ClassArray[$class['CLASSID']] = $class['CLASSNAME']; }//end while $ClassArray $stustr = "select STUNAME,CLASSID from STUDENTS where SID in ". "(select distinct SID from SCORES where COURSE='M' and SCORE>=90)"; $studata = $db2handle->query( $stustr); //从数据库中获取满足条件的学生姓名和班级编号 while( $stu=$studata ->fetchRow(DB_FETCHMODE_ASSOC) ){ //读取学生的姓名,并从ClassArray中读取班级名称 echo "StudentName=".$stu ['STUNAME']."\t "; echo "CLASSNAME=".$ClassArray[ $stu ['CLASSID'] ]."\n"; }//end while for getting each student's Info. Done

方法 3 和方法 4 中引用了数组这个小技巧,巧妙地降低了算法的时间复杂度。在实际应用程序中,算法逻辑要复杂得多,对算法的优化需要综合考虑多方面的因素。需要提出的是,本文所述的方法不仅适用于 PHP 应用程序。如果编程语言的数组支持以字符串作为下标,就可以考虑采用本文提出的方法:巧用数组的下标来降低算法的时间复杂度。对于不支持字符串做数组下标的编程语言,可以考虑使用建立哈希表来达到同样的效果。

PHP 相关文章推荐
php缓存技术介绍
Nov 25 PHP
某大型网络公司应聘时的笔试题目附答案
Mar 27 PHP
php 分页函数multi() discuz
Jun 21 PHP
php中计算时间差的几种方法
Dec 31 PHP
PHP生成网页快照 不用COM不用扩展.
Feb 11 PHP
PHP中全局变量global和$GLOBALS[]的区别分析
Aug 06 PHP
基于curl数据采集之单页面采集函数get_html的使用
Apr 28 PHP
php之Memcache学习笔记
Jun 17 PHP
php的数组与字符串的转换函数整理汇总
Jul 18 PHP
PHP中使用localhost连接Mysql不成功的解决方法
Aug 20 PHP
php将图片保存入mysql数据库失败的解决方法
Dec 27 PHP
CI框架简单分页类用法示例
Jun 06 PHP
PHP 柱状图实现代码
Dec 04 #PHP
Ajax+PHP边学边练 之五 图片处理
Dec 03 #PHP
PHPMyadmin 配置文件详解(配置)
Dec 03 #PHP
又一个php 分页类实现代码
Dec 03 #PHP
php 无限分类的树类代码
Dec 03 #PHP
php zip文件解压类代码
Dec 02 #PHP
PHP5 面向对象(学习记录)
Dec 02 #PHP
You might like
php版微信开发之接收消息,自动判断及回复相应消息的方法
2016/09/23 PHP
Zend Framework使用Zend_Loader组件动态加载文件和类用法详解
2016/12/09 PHP
php原生数据库分页的代码实例
2019/02/18 PHP
TP5框架请求响应参数实例分析
2019/10/17 PHP
在JavaScript中通过URL传递汉字的方法
2007/04/09 Javascript
javascript向flash swf文件传递参数值注意细节
2012/12/11 Javascript
javascript操作html控件实例(javascript添加html)
2013/12/02 Javascript
JavaScript将数组转换成CSV格式的方法
2015/03/19 Javascript
js简单工厂模式用法实例
2015/06/30 Javascript
JavaScript 事件流、事件处理程序及事件对象总结
2017/04/01 Javascript
Node.js学习之地址解析模块URL的使用详解
2017/09/28 Javascript
你点的 ES6一些小技巧,请查收
2018/04/25 Javascript
详解小程序缓存插件(mrc)
2018/08/17 Javascript
详解Vue-cli3 项目在安卓低版本系统和IE上白屏问题解决
2019/04/14 Javascript
layer弹出层自定义提交取消按钮的例子
2019/09/10 Javascript
vue之组件内监控$store中定义变量的变化详解
2019/11/08 Javascript
浅谈webpack构建工具配置和常用插件总结
2020/05/11 Javascript
VueCli4项目配置反向代理proxy的方法步骤
2020/05/17 Javascript
antd 表格列宽自适应方法以及错误处理操作
2020/10/27 Javascript
python中遍历文件的3个方法
2014/09/02 Python
深入讲解Python编程中的字符串
2015/10/14 Python
Python设置默认编码为utf8的方法
2016/07/01 Python
解决python "No module named pip" 的问题
2018/10/13 Python
在flask中使用python-dotenv+flask-cli自定义命令(推荐)
2020/01/05 Python
python输入中文的实例方法
2020/09/14 Python
python statsmodel的使用
2020/12/21 Python
英国街头品牌:Bee Inspired Clothing
2018/02/12 全球购物
俄罗斯运动鞋商店:Sneakerhead
2018/05/10 全球购物
个人简历中的自我评价怎么写
2014/01/26 职场文书
电子银行营销方案
2014/02/22 职场文书
《记金华的双龙洞》教学反思
2014/04/19 职场文书
爱的奉献演讲稿
2014/09/10 职场文书
2015年挂职干部工作总结
2015/05/14 职场文书
PHP控制循环操作的时间
2021/04/01 PHP
Redis延迟队列和分布式延迟队列的简答实现
2021/05/13 Redis
python pygame入门教程
2021/06/01 Python