Python基于scrapy采集数据时使用代理服务器的方法


Posted in Python onApril 16, 2015

本文实例讲述了Python基于scrapy采集数据时使用代理服务器的方法。分享给大家供大家参考。具体如下:

# To authenticate the proxy, 
#you must set the Proxy-Authorization header. 
#You *cannot* use the form http://user:pass@proxy:port 
#in request.meta['proxy']
import base64
proxy_ip_port = "123.456.789.10:8888"
proxy_user_pass = "awesome:dude"
request = Request(url, callback=self.parse)
# Set the location of the proxy
request.meta['proxy'] = "http://%s" % proxy_ip_port
# setup basic authentication for the proxy
encoded_user_pass=base64.encodestring(proxy_user_pass)
request.headers['Proxy-Authorization'] = 'Basic ' + encoded_user_pass

希望本文所述对大家的python程序设计有所帮助。

Python 相关文章推荐
python使用PyGame模块播放声音的方法
May 20 Python
利用Python获取操作系统信息实例
Sep 02 Python
Python多线程实现同步的四种方式
May 02 Python
Python对数据进行插值和下采样的方法
Jul 03 Python
Python迭代器与生成器基本用法分析
Jul 26 Python
selenium设置proxy、headers的方法(phantomjs、Chrome、Firefox)
Nov 29 Python
python3利用Socket实现通信的方法示例
May 06 Python
Python进程间通信Queue消息队列用法分析
May 22 Python
Python时间序列缺失值的处理方法(日期缺失填充)
Aug 11 Python
在flask中使用python-dotenv+flask-cli自定义命令(推荐)
Jan 05 Python
Django ValuesQuerySet转json方式
Mar 16 Python
Matplotlib 折线图plot()所有用法详解
Jul 28 Python
在Python的gevent框架下执行异步的Solr查询的教程
Apr 16 #Python
使用Python的Treq on Twisted来进行HTTP压力测试
Apr 16 #Python
Python3中多线程编程的队列运作示例
Apr 16 #Python
使用Python脚本操作MongoDB的教程
Apr 16 #Python
使用Python中的greenlet包实现并发编程的入门教程
Apr 16 #Python
利用Python的Twisted框架实现webshell密码扫描器的教程
Apr 16 #Python
使用Python的Twisted框架实现一个简单的服务器
Apr 16 #Python
You might like
天使彦史上最神还原,性别曝光的那一刻,百万网友恋爱了
2020/03/02 国漫
第二节--PHP5 的对象模型
2006/11/16 PHP
PHP版网站缓存加快打开速度的方法分享
2012/06/03 PHP
如何使用php绘制在图片上的正余弦曲线
2013/06/08 PHP
PHP产生不重复随机数的5个方法总结
2014/11/12 PHP
关于javascript中的parseInt使用技巧
2009/09/03 Javascript
基于jQuery的模仿新浪微博时间的组件
2011/10/04 Javascript
javascript圆盘抽奖程序实现原理和完整代码例子
2014/06/03 Javascript
JavaScript使用pop方法移除数组最后一个元素用法实例
2015/04/06 Javascript
jQuery动画显示和隐藏效果实例演示(附demo源码下载)
2015/12/31 Javascript
学习JavaScript事件流和事件处理程序
2016/01/25 Javascript
bootstrap table操作技巧分享
2017/02/15 Javascript
详解angular ui-grid之过滤器设置
2017/06/07 Javascript
React实践之Tree组件的使用方法
2017/09/30 Javascript
laravel5.3 vue 实现收藏夹功能实例详解
2018/01/21 Javascript
QQ跳转支付宝并自动领红包脚本(最新)
2018/06/22 Javascript
深入解析Vue源码实例挂载与编译流程实现思路详解
2019/05/05 Javascript
如何基于javascript实现贪吃蛇游戏
2020/02/09 Javascript
python中将字典转换成其json字符串
2014/07/16 Python
解决pandas无法在pycharm中使用plot()方法显示图像的问题
2018/05/24 Python
pytorch中的transforms模块实例详解
2019/12/31 Python
Python生成器常见问题及解决方案
2020/03/21 Python
Python request中文乱码问题解决方案
2020/09/17 Python
python IP地址转整数
2020/11/20 Python
Pycharm plot独立窗口显示的操作
2020/12/11 Python
css3实现波纹特效、H5实现动态波浪效果
2018/01/31 HTML / CSS
基于CSS3实现立方体自转效果
2016/03/01 HTML / CSS
详解CSS3中字体平滑处理和抗锯齿渲染
2017/03/29 HTML / CSS
六道php面试题附答案
2014/06/05 面试题
开朗女孩的自我评价
2014/02/10 职场文书
植物生产学专业求职信
2014/08/08 职场文书
西柏坡导游词
2015/02/05 职场文书
预备党员入党感想
2015/08/10 职场文书
筑梦中国心得体会
2016/01/18 职场文书
五年级作文之学校的四季
2019/12/05 职场文书
vue-cli3.x配置全局的scss的时候报错问题及解决
2022/04/30 Vue.js