php中file_get_contents与curl性能比较分析


Posted in PHP onNovember 08, 2014

本文实例讲述了php中file_get_contents与curl性能比较分析。分享给大家供大家参考。具体如下:

在php中如果不仔细的去分析性能会发现file_get_contents与curl两个同很多共同点的,他们都可以采集文件打开文件,但是如果仔细一对比会发现很多不同点,下面我们一起来看看file_get_contents与curl区别。

PHP中fopen,file_get_contents,curl函数的区别:

1.fopen /file_get_contents 每次请求都会重新做DNS查询,并不对 DNS信息进行缓存。但是CURL会自动对DNS信息进行缓存。对同一域名下的网页或者图片的请求只需要一次DNS查询。这大大减少了DNS查询的次数。所以CURL的性能比fopen /file_get_contents 好很多。

2.fopen /file_get_contents 在请求HTTP时,使用的是http_fopen_wrapper,不会keeplive。而curl却可以。这样在多次请求多个链接时,curl效率会好一些。

3.fopen / file_get_contents 函数会受到php.ini文件中allow_url_open选项配置的影响。如果该配置关闭了,则该函数也就失效了。而curl不受该配置的影响。

4.curl 可以模拟多种请求,例如:POST数据,表单提交等,用户可以按照自己的需求来定制请求。而fopen / file_get_contents只能使用get方式获取数据。
file_get_contents 获取远程文件时会把结果都存在一个字符串中 fiels函数则会储存成数组形式

因此,我还是比较倾向于使用curl来访问远程url。Php有curl模块扩展,功能很是强大。

说了半天大家可能说性能怎么没对比呢,那我们就来看看

最近需要获取别人网站上的音乐数据。用了file_get_contents函数,但是总是会遇到获取失败的问题,尽管按照手册中的 例子设置了超时,可多数时候不会奏效:

$config['context'] = stream_context_create(array('http' => array('method' => "GET",

   'timeout' => 5//这个超时时间不稳定,经常不奏效

   )

));

这时候,看一下服务器的连接池,会发现一堆类似的错误,让我头疼万分:

file_get_contents(http://***): failed to open stream…
现在改用了curl库,写了一个函数替换:

function curl_file_get_contents($durl){

  $ch = curl_init();

  curl_setopt($ch, CURLOPT_URL, $durl);

  curl_setopt($ch, CURLOPT_TIMEOUT, 5);

  curl_setopt($ch, CURLOPT_USERAGENT, _USERAGENT_);

  curl_setopt($ch, CURLOPT_REFERER,_REFERER_);

  curl_setopt($ch, CURLOPT_RETURNTRANSFER, 1);

  $r = curl_exec($ch);

  curl_close($ch);

   return $r;

}

如此,除了真正的网络问题外,没再出现任何问题。
这是别人做过的关于curl和file_get_contents的测试:
file_get_contents抓取google.com需用秒数:
 
2.31319094
2.30374217
2.21512604
3.30553889
2.30124092
curl使用的时间:
 
0.68719101
0.64675593
0.64326
0.81983113
0.63956594

差距很大?呵呵,从我使用的经验来说,这两个工具不只是速度有差异,稳定性也相差很大。

建议对网络数据抓取稳定性要求比较高的朋友使用上面的 curl_file_get_contents函数,不但稳定速度快,还能假冒浏览器欺骗目标地址哦

再看一个实例

后续贴出了curl和file_get_contents的对比结果,这边除了curl与file_get_contents的性能对比,还包含了他们的性能对比,讲之前看下如下的结果图:

php中file_get_contents与curl性能比较分析

curl与file_get_contents性能对比PHP源代码如下:

<?php 

/** 

 

* 通过淘宝IP接口获取IP地理位置 

 

* @param string $ip 

 

* @return: string 

 

**/

function getCityCurl($ip) 

{ 

    $url="http://ip.taobao.com/service/getIpInfo.php?ip=".$ip; 

    $ch = curl_init(); 

    $timeout = 5; 

    curl_setopt ($ch, CURLOPT_URL, $url); 

    curl_setopt ($ch, CURLOPT_RETURNTRANSFER, 1); 

    curl_setopt ($ch, CURLOPT_CONNECTTIMEOUT, $timeout); 

    $file_contents = curl_exec($ch); 

    curl_close($ch); 

  

    $ipinfo=json_decode($file_contents); 

    if($ipinfo->code=='1'){ 

        return false; 

    } 

    $city = $ipinfo->data->region.$ipinfo->data->city; 

    return $city; 

} 

  

function getCity($ip) 

{ 

    $url="http://ip.taobao.com/service/getIpInfo.php?ip=".$ip; 

    $ipinfo=json_decode(file_get_contents($url)); 

    if($ipinfo->code=='1'){ 

        return false; 

    } 

    $city = $ipinfo->data->region.$ipinfo->data->city; 

    return $city; 

} 

  

// for file_get_contents 

$startTime=explode(' ',microtime()); 

$startTime=$startTime[0] + $startTime[1]; 

for($i=1;$i<=10;$i++) 

{ 

   echo getCity("121.207.247.202")."</br>"; 

} 

$endTime = explode(' ',microtime()); 

$endTime = $endTime[0] + $endTime[1]; 

$totalTime = $endTime - $startTime; 

echo 'file_get_contents:'.number_format($totalTime, 10, '.', "")." seconds</br>"; 

  

//for curl 

$startTime2=explode(' ',microtime()); 

$startTime2=$startTime2[0] + $startTime2[1]; 

for($i=1;$i<=10;$i++) 

{ 

   echo getCityCurl('121.207.247.202')."</br>"; 

} 

$endTime2 = explode(' ',microtime()); 

$endTime2=$endTime2[0] + $endTime2[1]; 

$totalTime2 = $endTime2 - $startTime2; 

echo "curl:".number_format($totalTime2, 10, '.', "")." seconds"; 

?>

测试访问
https://3water.com
file_get_contents速度:4.2404510975 seconds
curl速度:2.8205530643 seconds
curl比file_get_contents速度快了30%左右,最重要的是服务器负载更低.

总结

file_get_contents处理频繁小的时候,用它感觉挺好的。没什么异常。如果你的文件被1k+人处理。那么你的服务器cpu就等着高升吧。所以建议自己和大家在以后写php代码的时候使用curl库。

希望本文所述对大家的PHP程序设计有所帮助。

PHP 相关文章推荐
oracle资料库函式库
Oct 09 PHP
如何使用脚本模仿登陆过程
Nov 22 PHP
追求程序速度,而不是编程的速度
Apr 23 PHP
zen cart新进商品的随机排序修改方法
Sep 10 PHP
destoon找回管理员密码的方法
Jun 21 PHP
9个实用的PHP代码片段分享
Jan 22 PHP
php实现的xml操作类
Jan 15 PHP
PHP的Yii框架中创建视图和渲染视图的方法详解
Mar 29 PHP
php处理复杂xml数据示例
Jul 11 PHP
PHP中时间加减函数strtotime用法分析
Apr 26 PHP
Yii支持多域名cors原理的实现
Dec 05 PHP
PHP超低内存遍历目录文件和读取超大文件的方法
May 01 PHP
Fatal error: Allowed memory size of 134217728 bytes exhausted (tried to allocate 2611816 bytes)
Nov 08 #PHP
PHP中使用循环实现的金字塔图形
Nov 08 #PHP
php调用新浪短链接API的方法
Nov 08 #PHP
php禁止浏览器使用缓存页面的方法
Nov 07 #PHP
php实现把url转换迅雷thunder资源下载地址的方法
Nov 07 #PHP
php采用file_get_contents代替使用curl实例
Nov 07 #PHP
php采用curl模仿登录人人网发布动态的方法
Nov 07 #PHP
You might like
各种咖啡的英文名子是什么
2021/03/03 新手入门
PHP怎样调用MSSQL的存储过程
2006/10/09 PHP
在PHP里得到前天和昨天的日期的代码
2007/08/16 PHP
PHP 读取文件的正确方法
2009/04/29 PHP
Php Ctemplate引擎开发相关内容
2012/03/03 PHP
php查找字符串出现次数的方法
2014/12/01 PHP
CI框架中数据库操作函数$this-&gt;db-&gt;where()相关用法总结
2016/05/17 PHP
浅谈javascript的数据类型检测
2010/07/10 Javascript
Javascript玩转继承(二)
2014/05/08 Javascript
如何防止回车(enter)键提交表单
2014/05/11 Javascript
JS不能跨域借助jquery获取IP地址的方法
2014/08/20 Javascript
jQuery实现冻结表头的方法
2015/03/09 Javascript
JavaScript提升性能的常用技巧总结【经典】
2016/06/20 Javascript
JS实现鼠标框选效果完整实例
2016/06/20 Javascript
jquery 手势密码插件
2017/03/17 Javascript
vue项目关闭eslint校验
2018/03/21 Javascript
JavaScript设计模式之原型模式分析【ES5与ES6】
2018/07/26 Javascript
详解小程序退出页面时清除定时器
2019/04/28 Javascript
详解django模板与vue.js冲突问题
2019/07/07 Javascript
[02:53]DOTA2英雄基础教程 山岭巨人小小
2013/12/09 DOTA
Python实现SVN的目录周期性备份实例
2015/07/17 Python
python实现可以断点续传和并发的ftp程序
2016/09/13 Python
分析python请求数据
2018/08/19 Python
在python中使用xlrd获取合并单元格的方法
2018/12/26 Python
python dlib人脸识别代码实例
2019/04/04 Python
Python列表与元组的异同详解
2019/07/02 Python
Pytorch训练过程出现nan的解决方式
2020/01/02 Python
浅谈python中频繁的print到底能浪费多长时间
2020/02/21 Python
在keras中对单一输入图像进行预测并返回预测结果操作
2020/07/09 Python
分享一个python的aes加密代码
2020/12/22 Python
python matlab库简单用法讲解
2020/12/31 Python
Python如何使用神经网络进行简单文本分类
2021/02/25 Python
京东港澳售:京东直邮港澳台
2018/01/31 全球购物
Tom Dixon官网:英国照明及家具设计和制造公司
2019/03/01 全球购物
幼儿园保育员辞职信
2014/01/12 职场文书
大四自我鉴定
2014/02/08 职场文书