PHP源码之explode使用说明


Posted in PHP onAugust 05, 2011

当我们需要将一个数组根据某个字符或字串进行分割成数组的时候,explode用的很happy,但是你知道~explode是怎么工作的么~~
首先可以肯定的是,explode也是会分配空间的,毫无疑问。

//文件1:ext/standard/string.c 
//先来看下explode的源代码 
PHP_FUNCTION(explode) 
{ 
char *str, *delim; 
int str_len = 0, delim_len = 0; 
long limit = LONG_MAX; /* No limit */ 
zval zdelim, zstr; 
if (zend_parse_parameters(ZEND_NUM_ARGS() TSRMLS_CC, "ss|l", &delim, &delim_len, &str, &str_len, &limit) == FAILURE) { 
return; 
} 
if (delim_len == 0) { 
php_error_docref(NULL TSRMLS_CC, E_WARNING, "Empty delimiter"); 
RETURN_FALSE; 
} 
//这里会开辟一个数组,用来存放分割后的数据 
array_init(return_value); 
//因为这个,我们用explode('|', '');成为了合法的 
if (str_len == 0) { 
if (limit >= 0) { 
add_next_index_stringl(return_value, "", sizeof("") - 1, 1); 
} 
return; 
} 
//下面这两个是将原字串和分割符都构建成_zval_struct 结构, 
//ZVAL_STRINGL会分配空间哦~~源代码随后贴出 
ZVAL_STRINGL(&zstr, str, str_len, 0); 
ZVAL_STRINGL(&zdelim, delim, delim_len, 0); 
//limit值是explode中允许传递的explode的第三个参数,它允许正负 
if (limit > 1) { 
php_explode(&zdelim, &zstr, return_value, limit); 
} else if (limit < 0) { 
php_explode_negative_limit(&zdelim, &zstr, return_value, limit); 
} else { 
add_index_stringl(return_value, 0, str, str_len, 1); 
} 
}

//ZVAL_STRINGL的源代码: 
//文件2:zend/zend_API.c 
#define ZVAL_STRINGL(z, s, l, duplicate) { \ 
const char *__s=(s); int __l=l; \ 
Z_STRLEN_P(z) = __l; \ 
Z_STRVAL_P(z) = (duplicate?estrndup(__s, __l):(char*)__s);\ 
Z_TYPE_P(z) = IS_STRING; \ 
} 
.... 
//estrndup才是主菜: 
//文件3:zend/zend_alloc.h 
#define estrndup(s, length) _estrndup((s), (length) ZEND_FILE_LINE_CC ZEND_FILE_LINE_EMPTY_CC) 
.... 
//_estrndup的实现: zend/zend_alloc.c 
ZEND_API char *_estrndup(const char *s, uint length ZEND_FILE_LINE_DC ZEND_FILE_LINE_ORIG_DC) 
{ 
char *p; 
p = (char *) _emalloc(length+1 ZEND_FILE_LINE_RELAY_CC ZEND_FILE_LINE_ORIG_RELAY_CC); 
if (UNEXPECTED(p == NULL)) { 
return p; 
} 
memcpy(p, s, length); //分配空间 
p[length] = 0; 
return p; 
} 
//另外在substr和strrchr strstr中用到的ZVAL_STRING也是使用了上诉的实现

下面根据explode的第三个参数limit来分析调用:条件对应的是explode中最后的三行,对limit条件的不同
注: limit在缺省的时候(没有传递),他的默认值是LONG_MAX,也就是属于分支1的情况
1、limit > 1 :
调用php_explode方法,该方法也可以在ext/standard/string.c中找到,并且是紧接着explode实现的上面出现(所以在查找本函数中调用来自本文件的方法的时候很方便,几乎无一列外都是在该函数的紧接着的上面^_^),
PHPAPI void php_explode(zval *delim, zval *str, zval *return_value, long limit) 
{ 
char *p1, *p2, *endp; 
//先得到的是源字串的末尾位置的指针 
endp = Z_STRVAL_P(str) + Z_STRLEN_P(str); 
//记录开始位置 
p1 = Z_STRVAL_P(str); 
//下面这个是获得分割符在str中的位置,可以看到在strrpos和strpos中也用到了这个方法去定位 
p2 = php_memnstr(Z_STRVAL_P(str), Z_STRVAL_P(delim), Z_STRLEN_P(delim), endp); 
if (p2 == NULL) { 
//因为这个,所以当我们调用explode('|', 'abc');是合法的,出来的的就是array(0 => 'abc') 
add_next_index_stringl(return_value, p1, Z_STRLEN_P(str), 1); 
} else { 
//依次循环获得下一个分隔符的位置,直到结束 
do { 
//将得到的子字串(上个位置到这个位置中间的一段,第一次的时候上个位置就是开始 
add_next_index_stringl(return_value, p1, p2 - p1, 1); 
//定位到分隔符位置p2+分隔符的长度的位置 
//比如,分隔符='|', 原字串= 'ab|c', p2 = 2, 则p1=2+1=3 
p1 = p2 + Z_STRLEN_P(delim); 
} while ((p2 = php_memnstr(p1, Z_STRVAL_P(delim), Z_STRLEN_P(delim), endp)) != NULL && 
--limit > 1); 
//将最后的一个分隔符后面的字串放到结果数组中 
//explode('|', 'avc|sdf'); => array(0 => 'avc', 1= > 'sdf') 
if (p1 <= endp) 
add_next_index_stringl(return_value, p1, endp-p1, 1); 
} 
}

2、limit < 0 :
调用php_explode_negative_limit方法
PHPAPI void php_explode_negative_limit(zval *delim, zval *str, zval *return_value, long limit) 
{ 
#define EXPLODE_ALLOC_STEP 64 
char *p1, *p2, *endp; 
endp = Z_STRVAL_P(str) + Z_STRLEN_P(str); 
p1 = Z_STRVAL_P(str); 
p2 = php_memnstr(Z_STRVAL_P(str), Z_STRVAL_P(delim), Z_STRLEN_P(delim), endp); 
if (p2 == NULL) { 
//它这里竟然没有处理,那explode('|', 'abc', -1) 就成非法的了,获得不了任何值 
/* 
do nothing since limit <= -1, thus if only one chunk - 1 + (limit) <= 0 
by doing nothing we return empty array 
*/ 
} else { 
int allocated = EXPLODE_ALLOC_STEP, found = 0; 
long i, to_return; 
char **positions = emalloc(allocated * sizeof(char *)); 
//注意这里的positions的声明,这个数组是用来保存所有子字串的读取位置 
positions[found++] = p1; //当然起始位置还是需要保存 
//下面两个循环,第一个是循环所有在字符串中出现的分隔符位置,并保存下一个子字串读取位置起来 
do { 
if (found >= allocated) { 
allocated = found + EXPLODE_ALLOC_STEP;/* make sure we have enough memory */ 
positions = erealloc(positions, allocated*sizeof(char *)); 
} 
positions[found++] = p1 = p2 + Z_STRLEN_P(delim); 
} while ((p2 = php_memnstr(p1, Z_STRVAL_P(delim), Z_STRLEN_P(delim), endp)) != NULL); 
//这个就是从数组中开始获得返回的结果将从哪个子字串开始读 
to_return = limit + found; 
/* limit is at least -1 therefore no need of bounds checking : i will be always less than found */ 
for (i = 0;i < to_return;i++) { /* this checks also for to_return > 0 */ 
add_next_index_stringl(return_value, positions[i], 
(positions[i+1] - Z_STRLEN_P(delim)) - positions[i], 
1 
); 
} 
efree(positions);//很重要,释放内存 
} 
#undef EXPLODE_ALLOC_STEP 
}

3、limit = 1 or limit = 0 :
当所有第一和第二条件都不满足的时候,就进入的这个分支,这个分支很简单就是将源字串放到输出数组中,explode('|', 'avc|sd', 1) or explode('|', 'avc|sd', 0) 都将返回array(0 => 'avc|sd');
//add_index_stringl源代码 
//文件4:zend/zend_API.c 
ZEND_API int add_next_index_stringl(zval *arg, const char *str, uint length, int duplicate) /* {{{ */ 
{ 
zval *tmp; 
MAKE_STD_ZVAL(tmp); 
ZVAL_STRINGL(tmp, str, length, duplicate); 
return zend_hash_next_index_insert(Z_ARRVAL_P(arg), &tmp, sizeof(zval *), NULL); 
} 
//zend_hash_next_index_insert 
//zend/zend_hash.h 
#define zend_hash_next_index_insert(ht, pData, nDataSize, pDest) \ 
_zend_hash_index_update_or_next_insert(ht, 0, pData, nDataSize, pDest, HASH_NEXT_INSERT ZEND_FILE_LINE_CC) 
//zend/zend_hash.c 
///太长了~~~~不贴了

可见(不包含分配空间这些),
当limit>1的时候,效率是O(N)【N为limit值】,
当limit<0的时候,效率是O(N+M)【N为limit值, M 为分割符出现次数】,
当limit=1 or limit=0 的时候, 效率是O(1)
PHP 相关文章推荐
汉字转化为拼音(php版)
Oct 09 PHP
php 正则表达式小结
Aug 31 PHP
php中对2个数组相加的函数
Jun 24 PHP
LotusPhp笔记之:基于ObjectUtil组件的使用分析
May 06 PHP
php生成图形(Libchart)实例
Nov 06 PHP
php实现监听事件
Nov 06 PHP
PHP扩展开发入门教程
Feb 26 PHP
PHP添加图片水印、压缩、剪切的封装类
Aug 17 PHP
Laravel最佳分割路由文件(routes.php)的方式
Aug 04 PHP
php常用正则函数实例小结
Dec 29 PHP
php实现支持中文的文件下载功能示例
Aug 30 PHP
Laravel + Elasticsearch 实现中文搜索的方法
Feb 02 PHP
PHP在获取指定目录下的目录,在获取的目录下面再创建文件,多平台
Aug 03 #PHP
php中获取远程客户端的真实ip地址的方法
Aug 03 #PHP
用PHP实现的四则运算表达式计算实现代码
Aug 02 #PHP
PHP5 的对象赋值机制介绍
Aug 02 #PHP
利用PHP实现智能文件类型检测的实现代码
Aug 02 #PHP
10条PHP高级技巧[修正版]
Aug 02 #PHP
PHP获取url的函数代码
Aug 02 #PHP
You might like
PHPnow安装服务[apache_pn]失败的问题的解决方法
2010/09/10 PHP
使用Sphinx对索引进行搜索
2013/06/25 PHP
CodeIgniter上传图片成功的全部过程分享
2013/08/12 PHP
php生成随机密码自定义函数代码(简单快速)
2014/05/10 PHP
反射调用private方法实践(php、java)
2015/12/21 PHP
PHP图片添加水印功能示例小结
2016/10/03 PHP
在IE和VB中支持png图片透明效果的实现方法(vb源码打包)
2011/04/01 Javascript
Javascript new Date().valueOf()的作用与时间戳由来详解
2013/04/24 Javascript
基于jquery的文章中所有图片width大小批量设置方法
2013/08/01 Javascript
String.prototype实现的一些javascript函数介绍
2013/11/22 Javascript
用javascript删除当前行,添加行(示例代码)
2013/11/25 Javascript
javascript replace()第二个参数为函数时的参数用法
2016/12/26 Javascript
原生js实现吸顶效果
2017/03/13 Javascript
js将当前时间格式化为 年-月-日 时:分:秒的实现代码
2018/01/20 Javascript
vue里面父组件修改子组件样式的方法
2018/02/03 Javascript
Element-ui中元素滚动时el-option超出元素区域的问题
2019/05/30 Javascript
详解JavaScript 浮点数运算的精度问题
2019/07/23 Javascript
Vue状态模式实现窗口停靠功能(灵动、自由, 管理后台Admin界面)
2020/03/06 Javascript
Vue如何实现监听组件原生事件
2020/07/03 Javascript
[48:54]VGJ.T vs infamous Supermajor小组赛D组败者组第一轮 BO3 第二场 6.3
2018/06/04 DOTA
Python 代码性能优化技巧分享
2012/08/07 Python
python3模拟百度登录并实现百度贴吧签到示例分享(百度贴吧自动签到)
2014/02/24 Python
浅谈numpy库的常用基本操作方法
2018/01/09 Python
python十进制和二进制的转换方法(含浮点数)
2018/07/07 Python
Python中字符串List按照长度排序
2019/07/01 Python
PowerBI和Python关于数据分析的对比
2019/07/11 Python
Python基于DB-API操作MySQL数据库过程解析
2020/04/23 Python
浅谈matplotlib中FigureCanvasXAgg的用法
2020/06/16 Python
美国在线奢侈品寄售商店:Luxury Garage Sale
2018/08/19 全球购物
大码女装:Ulla Popken
2019/08/06 全球购物
机械绘图员岗位职责
2013/11/19 职场文书
酒鬼酒广告词
2014/03/21 职场文书
我是一名护士演讲稿
2014/08/28 职场文书
高一军训决心书
2015/02/05 职场文书
故意杀人案辩护词
2015/05/21 职场文书
解决Golang time.Parse和time.Format的时区问题
2021/04/29 Golang