PHP源码之explode使用说明


Posted in PHP onAugust 05, 2011

当我们需要将一个数组根据某个字符或字串进行分割成数组的时候,explode用的很happy,但是你知道~explode是怎么工作的么~~
首先可以肯定的是,explode也是会分配空间的,毫无疑问。

//文件1:ext/standard/string.c 
//先来看下explode的源代码 
PHP_FUNCTION(explode) 
{ 
char *str, *delim; 
int str_len = 0, delim_len = 0; 
long limit = LONG_MAX; /* No limit */ 
zval zdelim, zstr; 
if (zend_parse_parameters(ZEND_NUM_ARGS() TSRMLS_CC, "ss|l", &delim, &delim_len, &str, &str_len, &limit) == FAILURE) { 
return; 
} 
if (delim_len == 0) { 
php_error_docref(NULL TSRMLS_CC, E_WARNING, "Empty delimiter"); 
RETURN_FALSE; 
} 
//这里会开辟一个数组,用来存放分割后的数据 
array_init(return_value); 
//因为这个,我们用explode('|', '');成为了合法的 
if (str_len == 0) { 
if (limit >= 0) { 
add_next_index_stringl(return_value, "", sizeof("") - 1, 1); 
} 
return; 
} 
//下面这两个是将原字串和分割符都构建成_zval_struct 结构, 
//ZVAL_STRINGL会分配空间哦~~源代码随后贴出 
ZVAL_STRINGL(&zstr, str, str_len, 0); 
ZVAL_STRINGL(&zdelim, delim, delim_len, 0); 
//limit值是explode中允许传递的explode的第三个参数,它允许正负 
if (limit > 1) { 
php_explode(&zdelim, &zstr, return_value, limit); 
} else if (limit < 0) { 
php_explode_negative_limit(&zdelim, &zstr, return_value, limit); 
} else { 
add_index_stringl(return_value, 0, str, str_len, 1); 
} 
}

//ZVAL_STRINGL的源代码: 
//文件2:zend/zend_API.c 
#define ZVAL_STRINGL(z, s, l, duplicate) { \ 
const char *__s=(s); int __l=l; \ 
Z_STRLEN_P(z) = __l; \ 
Z_STRVAL_P(z) = (duplicate?estrndup(__s, __l):(char*)__s);\ 
Z_TYPE_P(z) = IS_STRING; \ 
} 
.... 
//estrndup才是主菜: 
//文件3:zend/zend_alloc.h 
#define estrndup(s, length) _estrndup((s), (length) ZEND_FILE_LINE_CC ZEND_FILE_LINE_EMPTY_CC) 
.... 
//_estrndup的实现: zend/zend_alloc.c 
ZEND_API char *_estrndup(const char *s, uint length ZEND_FILE_LINE_DC ZEND_FILE_LINE_ORIG_DC) 
{ 
char *p; 
p = (char *) _emalloc(length+1 ZEND_FILE_LINE_RELAY_CC ZEND_FILE_LINE_ORIG_RELAY_CC); 
if (UNEXPECTED(p == NULL)) { 
return p; 
} 
memcpy(p, s, length); //分配空间 
p[length] = 0; 
return p; 
} 
//另外在substr和strrchr strstr中用到的ZVAL_STRING也是使用了上诉的实现

下面根据explode的第三个参数limit来分析调用:条件对应的是explode中最后的三行,对limit条件的不同
注: limit在缺省的时候(没有传递),他的默认值是LONG_MAX,也就是属于分支1的情况
1、limit > 1 :
调用php_explode方法,该方法也可以在ext/standard/string.c中找到,并且是紧接着explode实现的上面出现(所以在查找本函数中调用来自本文件的方法的时候很方便,几乎无一列外都是在该函数的紧接着的上面^_^),
PHPAPI void php_explode(zval *delim, zval *str, zval *return_value, long limit) 
{ 
char *p1, *p2, *endp; 
//先得到的是源字串的末尾位置的指针 
endp = Z_STRVAL_P(str) + Z_STRLEN_P(str); 
//记录开始位置 
p1 = Z_STRVAL_P(str); 
//下面这个是获得分割符在str中的位置,可以看到在strrpos和strpos中也用到了这个方法去定位 
p2 = php_memnstr(Z_STRVAL_P(str), Z_STRVAL_P(delim), Z_STRLEN_P(delim), endp); 
if (p2 == NULL) { 
//因为这个,所以当我们调用explode('|', 'abc');是合法的,出来的的就是array(0 => 'abc') 
add_next_index_stringl(return_value, p1, Z_STRLEN_P(str), 1); 
} else { 
//依次循环获得下一个分隔符的位置,直到结束 
do { 
//将得到的子字串(上个位置到这个位置中间的一段,第一次的时候上个位置就是开始 
add_next_index_stringl(return_value, p1, p2 - p1, 1); 
//定位到分隔符位置p2+分隔符的长度的位置 
//比如,分隔符='|', 原字串= 'ab|c', p2 = 2, 则p1=2+1=3 
p1 = p2 + Z_STRLEN_P(delim); 
} while ((p2 = php_memnstr(p1, Z_STRVAL_P(delim), Z_STRLEN_P(delim), endp)) != NULL && 
--limit > 1); 
//将最后的一个分隔符后面的字串放到结果数组中 
//explode('|', 'avc|sdf'); => array(0 => 'avc', 1= > 'sdf') 
if (p1 <= endp) 
add_next_index_stringl(return_value, p1, endp-p1, 1); 
} 
}

2、limit < 0 :
调用php_explode_negative_limit方法
PHPAPI void php_explode_negative_limit(zval *delim, zval *str, zval *return_value, long limit) 
{ 
#define EXPLODE_ALLOC_STEP 64 
char *p1, *p2, *endp; 
endp = Z_STRVAL_P(str) + Z_STRLEN_P(str); 
p1 = Z_STRVAL_P(str); 
p2 = php_memnstr(Z_STRVAL_P(str), Z_STRVAL_P(delim), Z_STRLEN_P(delim), endp); 
if (p2 == NULL) { 
//它这里竟然没有处理,那explode('|', 'abc', -1) 就成非法的了,获得不了任何值 
/* 
do nothing since limit <= -1, thus if only one chunk - 1 + (limit) <= 0 
by doing nothing we return empty array 
*/ 
} else { 
int allocated = EXPLODE_ALLOC_STEP, found = 0; 
long i, to_return; 
char **positions = emalloc(allocated * sizeof(char *)); 
//注意这里的positions的声明,这个数组是用来保存所有子字串的读取位置 
positions[found++] = p1; //当然起始位置还是需要保存 
//下面两个循环,第一个是循环所有在字符串中出现的分隔符位置,并保存下一个子字串读取位置起来 
do { 
if (found >= allocated) { 
allocated = found + EXPLODE_ALLOC_STEP;/* make sure we have enough memory */ 
positions = erealloc(positions, allocated*sizeof(char *)); 
} 
positions[found++] = p1 = p2 + Z_STRLEN_P(delim); 
} while ((p2 = php_memnstr(p1, Z_STRVAL_P(delim), Z_STRLEN_P(delim), endp)) != NULL); 
//这个就是从数组中开始获得返回的结果将从哪个子字串开始读 
to_return = limit + found; 
/* limit is at least -1 therefore no need of bounds checking : i will be always less than found */ 
for (i = 0;i < to_return;i++) { /* this checks also for to_return > 0 */ 
add_next_index_stringl(return_value, positions[i], 
(positions[i+1] - Z_STRLEN_P(delim)) - positions[i], 
1 
); 
} 
efree(positions);//很重要,释放内存 
} 
#undef EXPLODE_ALLOC_STEP 
}

3、limit = 1 or limit = 0 :
当所有第一和第二条件都不满足的时候,就进入的这个分支,这个分支很简单就是将源字串放到输出数组中,explode('|', 'avc|sd', 1) or explode('|', 'avc|sd', 0) 都将返回array(0 => 'avc|sd');
//add_index_stringl源代码 
//文件4:zend/zend_API.c 
ZEND_API int add_next_index_stringl(zval *arg, const char *str, uint length, int duplicate) /* {{{ */ 
{ 
zval *tmp; 
MAKE_STD_ZVAL(tmp); 
ZVAL_STRINGL(tmp, str, length, duplicate); 
return zend_hash_next_index_insert(Z_ARRVAL_P(arg), &tmp, sizeof(zval *), NULL); 
} 
//zend_hash_next_index_insert 
//zend/zend_hash.h 
#define zend_hash_next_index_insert(ht, pData, nDataSize, pDest) \ 
_zend_hash_index_update_or_next_insert(ht, 0, pData, nDataSize, pDest, HASH_NEXT_INSERT ZEND_FILE_LINE_CC) 
//zend/zend_hash.c 
///太长了~~~~不贴了

可见(不包含分配空间这些),
当limit>1的时候,效率是O(N)【N为limit值】,
当limit<0的时候,效率是O(N+M)【N为limit值, M 为分割符出现次数】,
当limit=1 or limit=0 的时候, 效率是O(1)
PHP 相关文章推荐
在Zeus Web Server中安装PHP语言支持
Oct 09 PHP
用libTemplate实现静态网页的生成
Oct 09 PHP
php checkbox 取值详细说明
Aug 19 PHP
PHP实现异步调用方法研究与分享
Oct 27 PHP
PHP微信刮刮卡 附微信接口
Jul 22 PHP
PHP+Apache+Mysql环境搭建教程
Aug 01 PHP
Yii2实现log输出到file及database的方法
Nov 12 PHP
php操作access数据库的方法详解
Feb 22 PHP
php使用PDO从数据库表中读取数据的实现方法(必看)
Jun 02 PHP
ThinkPHP+EasyUI之ComboTree中的会计科目树形菜单实现方法
Jun 09 PHP
php取出数组单个值的方法
Mar 12 PHP
php 防护xss,PHP的防御XSS注入的终极解决方案
Apr 01 PHP
PHP在获取指定目录下的目录,在获取的目录下面再创建文件,多平台
Aug 03 #PHP
php中获取远程客户端的真实ip地址的方法
Aug 03 #PHP
用PHP实现的四则运算表达式计算实现代码
Aug 02 #PHP
PHP5 的对象赋值机制介绍
Aug 02 #PHP
利用PHP实现智能文件类型检测的实现代码
Aug 02 #PHP
10条PHP高级技巧[修正版]
Aug 02 #PHP
PHP获取url的函数代码
Aug 02 #PHP
You might like
PHP数据过滤的方法
2013/10/30 PHP
destoon首页调用求购供应信息的地区名称的方法
2014/08/21 PHP
PHP 获取指定地区的天气实例代码
2017/02/08 PHP
页面版文本框智能提示JS代码
2009/11/20 Javascript
jquery 笔记 事件
2011/11/02 Javascript
js实现字符串转日期格式的方法
2015/05/20 Javascript
JavaScript检测字符串中是否含有html标签实现方法
2015/07/01 Javascript
jQuery实现带玻璃流光质感的手风琴特效
2015/11/20 Javascript
jQuery的Ajax用户认证和注册技术实例教程(附demo源码)
2015/12/08 Javascript
Seajs 简易文档 提供简单、极致的模块化开发体验
2016/04/13 Javascript
JavaScript简单实现弹出拖拽窗口(一)
2016/06/17 Javascript
JS实现重新加载当前页面或者父页面的几种方法
2016/11/30 Javascript
React中使用async validator进行表单验证的实例代码
2018/08/17 Javascript
解决Vue+Element ui开发中碰到的IE问题
2018/09/03 Javascript
vue返回上一页面时回到原先滚动的位置的方法
2018/12/20 Javascript
el-form 多层级表单的实现示例
2020/09/10 Javascript
在Python中使用swapCase()方法转换大小写的教程
2015/05/20 Python
Python登录并获取CSDN博客所有文章列表代码实例
2017/12/28 Python
详解用TensorFlow实现逻辑回归算法
2018/05/02 Python
pycharm 实现显示project 选项卡的方法
2019/01/17 Python
用pyqt5 给按钮设置图标和css样式的方法
2019/06/24 Python
python super的使用方法及实例详解
2019/09/25 Python
使用python写一个自动浏览文章的脚本实例
2019/12/05 Python
django列表筛选功能的实现代码
2020/03/27 Python
python是怎么被发明的
2020/06/15 Python
Python并发爬虫常用实现方法解析
2020/11/19 Python
python 用opencv实现图像修复和图像金字塔
2020/11/27 Python
婴儿地球:Baby Earth
2018/12/25 全球购物
轻化专业学生实习自我鉴定
2013/09/20 职场文书
白酒营销策划方案
2014/08/17 职场文书
个人四风问题对照检查材料
2014/10/01 职场文书
交通事故被告代理词
2015/05/23 职场文书
来探秘“德国中小企业”的成功之道
2019/07/26 职场文书
python神经网络编程之手写数字识别
2021/05/08 Python
Logback 使用TurboFilter实现日志级别等内容的动态修改操作
2021/08/30 Java/Android
Elasticsearch 基本查询和组合查询
2022/04/19 Python