PHP Curl出现403错误的解决办法


Posted in PHP onMay 29, 2014

自己用的小PHP应用,使用curl抓网页下来处理,为了穿墙方便,使用Privoxy作为代理,便于选择哪些网站使用proxy、哪些不用。但今天却遇到了奇怪的问题,访问google baidu这些网站居然都返回403错误,而访问其他的一些网站没事,如果设置为不使用proxy则都能正常访问。

难道google baidu就不让用proxy连接么?显然不可能,所以打开curl的信息输出(curl_setopt($this->mSh, CURLOPT_VERBOSE, 1);)看看,得到以下结果:

*   Trying 127.0.0.1... * connected
* Connected to 127.0.0.1 (127.0.0.1) port 8118 (#0)
* Establish HTTP proxy tunnel to www.baidu.com:80
> CONNECT www.baidu.com:80 HTTP/1.0
Host: www.baidu.com:80
User-Agent: Mozilla/4.0 (compatible; MSIE 6.0; Windows NT 5.1; SV1)
Proxy-Connection: Keep-Alive
< HTTP/1.0 403 Connection not allowable
< X-Hint: If you read this message interactively, then you know why this happens ,-)
< 
* The requested URL returned error: 403
* Received HTTP code 403 from proxy after CONNECT
* Closing connection #0
... Failed.

可以看到proxy服务器工作正常,的确是baidu返回了403错误,但原因肯定还在我这边。终于,从网上(1of2, 2of2)得到了点启发──我使用的是proxytunnel而非proxy。

在代码中,有这么一句:

 curl_setopt($this->mSh, CURLOPT_HTTPPROXYTUNNEL, true);
 curl_setopt($this->mSh, CURLOPT_PROXY, $phost);

php文档中没有详细说明,不过man curl中有详细解释,两者都是代理,proxytunnel(-p参数)允许其他协议通过http代理传输,而proxy(-x参数)则只能走http协议。所以我猜测,google baidu的服务器和curl的proxytunnel不和,所以返回403。

禁用掉上面2行代码的第一句后,curl访问恢复正常。

比较奇怪的是,几种操作系统下还不一样,一台MAC OSX就要显式的禁用proxytunnel才可以,curl版本:

$ curl --version
curl 7.16.3 (powerpc-apple-darwin9.0) libcurl/7.16.3 OpenSSL/0.9.7l zlib/1.2.3
Protocols: tftp ftp telnet dict ldap http file https ftps 
Features: GSS-Negotiate IPv6 Largefile NTLM SSL libz

而另外一台ubuntu则完全不受影响,怎么都能用,curl版本:
$ curl --version
curl 7.18.2 (i486-pc-linux-gnu) libcurl/7.18.2 OpenSSL/0.9.8g zlib/1.2.3.3 libidn/1.10
Protocols: tftp ftp telnet dict ldap ldaps http file https ftps 
Features: GSS-Negotiate IDN IPv6 Largefile NTLM SSL libz

MT主机上的centos也没事,curl版本:
$ curl --version
curl 7.15.5 (i686-redhat-linux-gnu) libcurl/7.15.5 OpenSSL/0.9.8b zlib/1.2.3 libidn/0.6.5
Protocols: tftp ftp telnet dict ldap http file https ftps 
Features: GSS-Negotiate IDN IPv6 Largefile NTLM SSL libz

看来不完全是curl版本问题,MAC OSX的确与众不同啊。

还有一个原因也会导致curl返回403错误,如果设置了:

 curl_setopt($ch, CURLOPT_NOBODY, true);

则需要紧跟着设置:
 curl_setopt($ch, CURLOPT_CUSTOMREQUEST, 'GET');

不然会因为http服务器不允许 HEAD 命令而返回403错误。参考:Trouble with a cURL request in PHP(http://forums.devshed.com/php-development-5/trouble-with-a-curl-request-in-php-445222.html)。MAC OSX上curl之所以特殊,也不排除是这种原因吧。
PHP 相关文章推荐
如何在PHP中进行身份认证
Oct 09 PHP
PHP 模板高级篇总结
Dec 21 PHP
php 错误处理经验分享
Oct 11 PHP
深入解析PHP的引用计数机制
Jun 14 PHP
[原创]php求圆周率的简单实现方法
May 30 PHP
php 时间time与日期date之间的使用详解及区别
Nov 07 PHP
mac os快速切换多个PHP版本的方法
Mar 07 PHP
使用一个for循环将N*N的二维数组的所有值置1实现方法
May 29 PHP
PHP数据库操作二:memcache用法分析
Aug 16 PHP
PHP设计模式之PHP迭代器模式讲解
Mar 22 PHP
Laravel开启跨域请求的方法
Oct 13 PHP
PHP框架实现WebSocket在线聊天通讯系统
Nov 21 PHP
PHP的foreach中使用引用时需要注意的一个问题和解决方法
May 29 #PHP
神盾加密解密教程(一)PHP变量可用字符
May 28 #PHP
CI框架开发新浪微博登录接口源码完整版
May 28 #PHP
PHP+javascript制作带提示的验证码源码分享
May 28 #PHP
微信支付开发教程(一)微信支付URL配置
May 28 #PHP
php中$美元符号与Zen Coding冲突问题解决方法分享
May 28 #PHP
php轻松实现中英文混排字符串截取
May 28 #PHP
You might like
用PHP制作静态网站的模板框架(一)
2006/10/09 PHP
php 空格,换行,跳格使用说明
2009/12/18 PHP
php 地区分类排序算法
2013/07/01 PHP
PHP 利用Mail_MimeDecode类提取邮件信息示例
2014/01/26 PHP
ThinkPHP 3.2 数据分页代码分享
2014/10/14 PHP
PHP 数组基本操作方法详解
2016/06/17 PHP
AJAX PHP无刷新form表单提交的简单实现(推荐)
2016/09/09 PHP
PHP用户注册邮件激活账户的实现代码
2017/05/31 PHP
php使用str_replace替换多维数组的实现方法分析
2017/06/15 PHP
javascript getElementsByClassName实现代码
2010/10/11 Javascript
jquery+json实现数据列表分页示例代码
2013/11/15 Javascript
用html5 js实现点击一个按钮达到浏览器全屏效果
2014/05/28 Javascript
jQuery表单域属性过滤器用法分析
2015/02/10 Javascript
JS 清除字符串数组中,重复元素的实现方法
2016/05/24 Javascript
Node.js与Sails redis组件的使用教程
2017/02/14 Javascript
three.js搭建室内场景教程
2018/12/30 Javascript
vue使用自定义事件的表单输入组件用法详解【日期组件与货币组件】
2020/06/01 Javascript
复习Python中的字符串知识点
2015/04/14 Python
python读取和保存视频文件
2018/04/16 Python
详解django中使用定时任务的方法
2018/09/27 Python
8款精美的CSS3表单设计(登录表单/下拉选择/按钮附演示及源码)
2013/02/04 HTML / CSS
在HTML5中如何使用CSS建立不可选的文字
2014/10/17 HTML / CSS
美国山地自行车、露营、户外装备和服装购物网站:Aventuron
2018/05/05 全球购物
毕业生动漫设计求职信
2013/10/11 职场文书
中层干部竞聘演讲稿
2014/05/15 职场文书
民主生活会发言材料
2014/10/20 职场文书
学生党支部工作总结2015
2015/05/26 职场文书
文化大革命观后感
2015/06/17 职场文书
2015年度对口支援工作总结
2015/07/22 职场文书
2016年“我们的节日·中秋节”活动总结
2016/04/05 职场文书
2019年入党思想汇报格式与要求
2019/06/25 职场文书
感恩信:写给爸爸妈妈的一封感谢信
2019/09/12 职场文书
PyTorch 如何设置随机数种子使结果可复现
2021/05/12 Python
python 如何在list中找Topk的数值和索引
2021/05/20 Python
Go Plugins插件的实现方式
2021/08/07 Golang
Springboot/Springcloud项目集成redis进行存取的过程解析
2021/12/04 Redis