php中file_get_contents与curl性能比较分析


Posted in PHP onNovember 08, 2014

本文实例讲述了php中file_get_contents与curl性能比较分析。分享给大家供大家参考。具体如下:

在php中如果不仔细的去分析性能会发现file_get_contents与curl两个同很多共同点的,他们都可以采集文件打开文件,但是如果仔细一对比会发现很多不同点,下面我们一起来看看file_get_contents与curl区别。

PHP中fopen,file_get_contents,curl函数的区别:

1.fopen /file_get_contents 每次请求都会重新做DNS查询,并不对 DNS信息进行缓存。但是CURL会自动对DNS信息进行缓存。对同一域名下的网页或者图片的请求只需要一次DNS查询。这大大减少了DNS查询的次数。所以CURL的性能比fopen /file_get_contents 好很多。

2.fopen /file_get_contents 在请求HTTP时,使用的是http_fopen_wrapper,不会keeplive。而curl却可以。这样在多次请求多个链接时,curl效率会好一些。

3.fopen / file_get_contents 函数会受到php.ini文件中allow_url_open选项配置的影响。如果该配置关闭了,则该函数也就失效了。而curl不受该配置的影响。

4.curl 可以模拟多种请求,例如:POST数据,表单提交等,用户可以按照自己的需求来定制请求。而fopen / file_get_contents只能使用get方式获取数据。
file_get_contents 获取远程文件时会把结果都存在一个字符串中 fiels函数则会储存成数组形式

因此,我还是比较倾向于使用curl来访问远程url。Php有curl模块扩展,功能很是强大。

说了半天大家可能说性能怎么没对比呢,那我们就来看看

最近需要获取别人网站上的音乐数据。用了file_get_contents函数,但是总是会遇到获取失败的问题,尽管按照手册中的 例子设置了超时,可多数时候不会奏效:

$config['context'] = stream_context_create(array('http' => array('method' => "GET",

   'timeout' => 5//这个超时时间不稳定,经常不奏效

   )

));

这时候,看一下服务器的连接池,会发现一堆类似的错误,让我头疼万分:

file_get_contents(http://***): failed to open stream…
现在改用了curl库,写了一个函数替换:

function curl_file_get_contents($durl){

  $ch = curl_init();

  curl_setopt($ch, CURLOPT_URL, $durl);

  curl_setopt($ch, CURLOPT_TIMEOUT, 5);

  curl_setopt($ch, CURLOPT_USERAGENT, _USERAGENT_);

  curl_setopt($ch, CURLOPT_REFERER,_REFERER_);

  curl_setopt($ch, CURLOPT_RETURNTRANSFER, 1);

  $r = curl_exec($ch);

  curl_close($ch);

   return $r;

}

如此,除了真正的网络问题外,没再出现任何问题。
这是别人做过的关于curl和file_get_contents的测试:
file_get_contents抓取google.com需用秒数:
 
2.31319094
2.30374217
2.21512604
3.30553889
2.30124092
curl使用的时间:
 
0.68719101
0.64675593
0.64326
0.81983113
0.63956594

差距很大?呵呵,从我使用的经验来说,这两个工具不只是速度有差异,稳定性也相差很大。

建议对网络数据抓取稳定性要求比较高的朋友使用上面的 curl_file_get_contents函数,不但稳定速度快,还能假冒浏览器欺骗目标地址哦

再看一个实例

后续贴出了curl和file_get_contents的对比结果,这边除了curl与file_get_contents的性能对比,还包含了他们的性能对比,讲之前看下如下的结果图:

php中file_get_contents与curl性能比较分析

curl与file_get_contents性能对比PHP源代码如下:

<?php 

/** 

 

* 通过淘宝IP接口获取IP地理位置 

 

* @param string $ip 

 

* @return: string 

 

**/

function getCityCurl($ip) 

{ 

    $url="http://ip.taobao.com/service/getIpInfo.php?ip=".$ip; 

    $ch = curl_init(); 

    $timeout = 5; 

    curl_setopt ($ch, CURLOPT_URL, $url); 

    curl_setopt ($ch, CURLOPT_RETURNTRANSFER, 1); 

    curl_setopt ($ch, CURLOPT_CONNECTTIMEOUT, $timeout); 

    $file_contents = curl_exec($ch); 

    curl_close($ch); 

  

    $ipinfo=json_decode($file_contents); 

    if($ipinfo->code=='1'){ 

        return false; 

    } 

    $city = $ipinfo->data->region.$ipinfo->data->city; 

    return $city; 

} 

  

function getCity($ip) 

{ 

    $url="http://ip.taobao.com/service/getIpInfo.php?ip=".$ip; 

    $ipinfo=json_decode(file_get_contents($url)); 

    if($ipinfo->code=='1'){ 

        return false; 

    } 

    $city = $ipinfo->data->region.$ipinfo->data->city; 

    return $city; 

} 

  

// for file_get_contents 

$startTime=explode(' ',microtime()); 

$startTime=$startTime[0] + $startTime[1]; 

for($i=1;$i<=10;$i++) 

{ 

   echo getCity("121.207.247.202")."</br>"; 

} 

$endTime = explode(' ',microtime()); 

$endTime = $endTime[0] + $endTime[1]; 

$totalTime = $endTime - $startTime; 

echo 'file_get_contents:'.number_format($totalTime, 10, '.', "")." seconds</br>"; 

  

//for curl 

$startTime2=explode(' ',microtime()); 

$startTime2=$startTime2[0] + $startTime2[1]; 

for($i=1;$i<=10;$i++) 

{ 

   echo getCityCurl('121.207.247.202')."</br>"; 

} 

$endTime2 = explode(' ',microtime()); 

$endTime2=$endTime2[0] + $endTime2[1]; 

$totalTime2 = $endTime2 - $startTime2; 

echo "curl:".number_format($totalTime2, 10, '.', "")." seconds"; 

?>

测试访问
https://3water.com
file_get_contents速度:4.2404510975 seconds
curl速度:2.8205530643 seconds
curl比file_get_contents速度快了30%左右,最重要的是服务器负载更低.

总结

file_get_contents处理频繁小的时候,用它感觉挺好的。没什么异常。如果你的文件被1k+人处理。那么你的服务器cpu就等着高升吧。所以建议自己和大家在以后写php代码的时候使用curl库。

希望本文所述对大家的PHP程序设计有所帮助。

PHP 相关文章推荐
对盗链说再见...
Oct 09 PHP
学习使用PHP数组
Oct 09 PHP
PHP 遍历文件实现代码
May 04 PHP
php empty() 检查一个变量是否为空
Nov 10 PHP
PHPMailer邮件发送的实现代码
May 04 PHP
php empty()与isset()区别的详细介绍
Jun 17 PHP
PHP系统命令函数使用分析
Jul 05 PHP
codeigniter自带数据库类使用方法说明
Mar 25 PHP
Laravel 5框架学习之子视图和表单复用
Apr 09 PHP
php实现用手机关闭计算机(电脑)的方法
Apr 22 PHP
双冒号 ::在PHP中的使用情况
Nov 05 PHP
使用WordPress发送电子邮件的相关PHP函数用法解析
Dec 15 PHP
Fatal error: Allowed memory size of 134217728 bytes exhausted (tried to allocate 2611816 bytes)
Nov 08 #PHP
PHP中使用循环实现的金字塔图形
Nov 08 #PHP
php调用新浪短链接API的方法
Nov 08 #PHP
php禁止浏览器使用缓存页面的方法
Nov 07 #PHP
php实现把url转换迅雷thunder资源下载地址的方法
Nov 07 #PHP
php采用file_get_contents代替使用curl实例
Nov 07 #PHP
php采用curl模仿登录人人网发布动态的方法
Nov 07 #PHP
You might like
php adodb连接不同数据库
2009/03/19 PHP
php var_export与var_dump 输出的不同
2013/08/09 PHP
PHP中include()与require()的区别说明
2017/02/14 PHP
php使用Jpgraph创建柱状图展示年度收支表效果示例
2017/02/15 PHP
用Javascript 和 CSS 实现脚注(Footnote)效果
2009/09/09 Javascript
Bootstrap实现带动画过渡的弹出框
2016/08/09 Javascript
AngularJS使用ng-repeat指令实现下拉框
2016/08/23 Javascript
纯javascript版日历控件
2016/11/24 Javascript
Angularjs通过指令监听ng-repeat渲染完成后执行脚本的方法
2016/12/31 Javascript
webpack配置之后端渲染详解
2017/10/26 Javascript
ES6扩展运算符用法实例分析
2017/10/31 Javascript
Three.js加载外部模型的教程详解
2017/11/10 Javascript
详解vue-cli之webpack3构建全面提速优化
2017/12/25 Javascript
vue element-ui之怎么封装一个自己的组件的详解
2019/05/20 Javascript
Vue.js实现立体计算器
2020/02/22 Javascript
浅谈vue权限管理实现及流程
2020/04/23 Javascript
[50:22]完美盛典-2018年度红毯走秀
2018/12/16 DOTA
[36:33]完美世界DOTA2联赛循环赛 Matador vs Forest 第一场 11.06
2020/11/06 DOTA
Python 自动补全(vim)
2014/11/30 Python
python实现复制整个目录的方法
2015/05/12 Python
python 网络编程详解及简单实例
2017/04/25 Python
解析Python中的eval()、exec()及其相关函数
2017/12/20 Python
TensorFlow实现AutoEncoder自编码器
2018/03/09 Python
pyhanlp安装介绍和简单应用
2019/02/22 Python
简单了解python gevent 协程使用及作用
2019/07/22 Python
Python图像处理模块ndimage用法实例分析
2019/09/05 Python
python基于TCP实现的文件下载器功能案例
2019/12/10 Python
HTML5 FormData 方法介绍以及实现文件上传示例
2017/09/12 HTML / CSS
N:Philanthropy官网:美国洛杉矶基础款服装
2020/06/09 全球购物
银行实习自我鉴定
2013/10/12 职场文书
简历中个人求职的自我评价模板
2013/11/29 职场文书
单位刻章介绍信范文
2014/01/11 职场文书
小学教师师德演讲稿
2014/05/06 职场文书
反四风个人对照检查材料思想汇报
2014/09/25 职场文书
教师批评与自我批评(群众路线)
2014/10/15 职场文书
win10下go mod配置方式
2021/04/25 Golang