Posted in PHP onFebruary 10, 2015
代码比较多,但是比较简单,一眼就看穿的,so,文字尽量少写了。
因为众所周知的网络原因,gavatar也开始越来越慢,写了一个小东西来解决这个问题,过程中遇到了get_headers这个函数,甚是忧伤,记录下来,以免后来人踩坑。
更新记录,函数稍微改了一下,返回值基本和之前序列化后的结果一致,暂时没考虑支持子项也支持数组等(考虑细节性能,还想把没用的http头砍掉….)
需求很简单:获取图片的head信息。
调试程序的时候发现这个函数的调用很缓慢,即使绑定ip,有时候都能蹦到20多秒。
寻思这个事情还是该加个超时吧,但是看官方文档,给出的导出函数接口如下:
array get_headers(string$url[,int$format=0])
你没有看错,这个东西没有超时接口…
上github翻看源码,期望可以用他的底层实现来重新实现一套:
地址 https://github.com/php/php-src/blob/88ca46d92bc1c426e7c7f7313f0fd2b7dcc33cf6/ext/standard/url.c#L710
/* {{{ proto array get_headers(string url[, int format]) fetches all the headers sent by the server in response to a HTTP request */ PHP_FUNCTION(get_headers) { char*url; size_t url_len; php_stream_context*context; php_stream*stream; zval*prev_val,*hdr=NULL,*h; HashTable*hashT; zend_long format=0; if(zend_parse_parameters(ZEND_NUM_ARGS()TSRMLS_CC,"s|l",&url,&url_len,&format)==FAILURE){ return; } /** 省略其他一堆... **/ } /* }}} */
但是很不幸的是,zend_parse_parameters 和 ZEND_NUM_ARGS也都没有PHP版的导出函数。
于是造轮子开始:
functionget_url_headers($url,$timeout=10) { $ch=curl_init(); curl_setopt($ch,CURLOPT_URL,$url); curl_setopt($ch,CURLOPT_HEADER,true); curl_setopt($ch,CURLOPT_NOBODY,true); curl_setopt($ch,CURLOPT_RETURNTRANSFER,true); curl_setopt($ch,CURLOPT_TIMEOUT,$timeout); $data=curl_exec($ch); $data=preg_split('/\n/',$data); $data=array_filter(array_map(function($data){ $data=trim($data); if($data){ $data=preg_split('/:\s/',trim($data),2); $length=count($data); switch($length){ case2: returnarray($data[0]=>$data[1]); break; case1: return$data; break; default: break; } } },$data)); sort($data); foreach($dataas$key=>$value){ $itemKey=array_keys($value)[0]; if(is_int($itemKey)){ $data[$key]=$value[$itemKey]; }elseif(is_string($itemKey)){ $data[$itemKey]=$value[$itemKey]; unset($data[$key]); } } return$data; }
对比最后结果:
原版又是蛮长的等待,不知道校验啥去了(没继续追代码了,有兴趣的童鞋可以去跟下玩):
Array ( [0]=>HTTP/1.0302Found [Accept-Ranges]=>bytes [Cache-Control]=>max-age=300 [Content-Type]=>Array ( [0]=>text/html;charset=utf-8 [1]=>text/html;charset=utf-8 ) [Date]=>Array ( [0]=>Fri,12Dec201415:35:40GMT [1]=>Fri,12Dec201415:35:43GMT ) [Expires]=>Fri,12Dec201415:40:40GMT [Last-Modified]=>Wed,11Jan198408:00:00GMT [Link]=><http://www.gravatar.com/avatar/[省略...]?s=42&d=http%3A%2F%2F[省略...]&r=G>; rel="canonical" [Location]=>http://i2.wp.com/[省略...] [Server]=>Array ( [0]=>ECS(oxr/838B) [1]=>nginx ) [Source-Age]=>85 [Via]=>1.1varnish [X-Cache]=>302-HIT [X-Varnish]=>14702550881470006304 [Content-Length]=>0 [Connection]=>Array ( [0]=>close [1]=>close ) [1]=>HTTP/1.1504Gateway Timeout )
轮子版返回(瞬间返回,两者内容略有不同,你仔细看就能发现一些有趣的地方了):
Array ( [0]=>HTTP/1.1302Found [Accept-Ranges]=>bytes [Via]=>1.1varnish [Cache-Control]=>max-age=300 [Server]=>ECS(oxr/838B) [Content-Type]=>text/html;charset=utf-8 [X-Varnish]=>14702550881470006304 [Date]=>Fri,12Dec201420:31:02GMT [Location]=>http://i2.wp.com/[省略...] [Expires]=>Fri,12Dec201420:36:02GMT [Source-Age]=>85 [Last-Modified]=>Wed,11Jan198408:00:00GMT [X-Cache]=>302-HIT [Link]=><http://www.gravatar.com/avatar/[省略...]?s=42&d=http%3A%2F%2F[省略...]&r=G>; rel="canonical" [Content-Length]=>0 )
PHP实现的带超时功能get_headers函数
- Author -
junjie声明:登载此文出于传递更多信息之目的,并不意味着赞同其观点或证实其描述。
Reply on: @reply_date@
@reply_contents@