Python基于scrapy采集数据时使用代理服务器的方法


Posted in Python onApril 16, 2015

本文实例讲述了Python基于scrapy采集数据时使用代理服务器的方法。分享给大家供大家参考。具体如下:

# To authenticate the proxy, 
#you must set the Proxy-Authorization header. 
#You *cannot* use the form http://user:pass@proxy:port 
#in request.meta['proxy']
import base64
proxy_ip_port = "123.456.789.10:8888"
proxy_user_pass = "awesome:dude"
request = Request(url, callback=self.parse)
# Set the location of the proxy
request.meta['proxy'] = "http://%s" % proxy_ip_port
# setup basic authentication for the proxy
encoded_user_pass=base64.encodestring(proxy_user_pass)
request.headers['Proxy-Authorization'] = 'Basic ' + encoded_user_pass

希望本文所述对大家的python程序设计有所帮助。

Python 相关文章推荐
python实现在windows下操作word的方法
Apr 28 Python
python实现马耳可夫链算法实例分析
May 20 Python
一些Centos Python 生产环境的部署命令(推荐)
May 07 Python
python爬取个性签名的方法
Jun 17 Python
Python错误处理操作示例
Jul 18 Python
python中的不可变数据类型与可变数据类型详解
Sep 16 Python
python 获得任意路径下的文件及其根目录的方法
Feb 16 Python
Django之创建引擎索引报错及解决详解
Jul 17 Python
Django Docker容器化部署之Django-Docker本地部署
Oct 09 Python
python扫描线填充算法详解
Feb 19 Python
Pycharm自动添加文件头注释和函数注释参数的方法
Oct 23 Python
Python自动化爬取天眼查数据的实现
Jun 15 Python
在Python的gevent框架下执行异步的Solr查询的教程
Apr 16 #Python
使用Python的Treq on Twisted来进行HTTP压力测试
Apr 16 #Python
Python3中多线程编程的队列运作示例
Apr 16 #Python
使用Python脚本操作MongoDB的教程
Apr 16 #Python
使用Python中的greenlet包实现并发编程的入门教程
Apr 16 #Python
利用Python的Twisted框架实现webshell密码扫描器的教程
Apr 16 #Python
使用Python的Twisted框架实现一个简单的服务器
Apr 16 #Python
You might like
php通过文件头检测文件类型通用代码类(zip,rar等)
2010/10/19 PHP
PHP大批量插入数据库的3种方法和速度对比
2014/07/08 PHP
Symfony2创建基于域名的路由相关示例
2016/11/14 PHP
Display SQL Server Version Information
2007/06/21 Javascript
jQuery实现原理的模拟代码 -6 代码下载
2010/08/16 Javascript
jQuery Jcrop插件实现图片选取功能
2011/11/23 Javascript
javascript显示用户停留时间的简单实例
2013/08/05 Javascript
jQuery淡入淡出元素让其效果更为生动
2014/09/01 Javascript
深入理解js promise chain
2016/05/05 Javascript
PhotoSwipe异步动态加载图片方法
2016/08/25 Javascript
Bootstrap图片轮播组件Carousel使用方法详解
2016/10/20 Javascript
通过AngularJS实现图片上传及缩略图展示示例
2017/01/03 Javascript
jQuery Masonry瀑布流布局神器使用详解
2017/05/25 jQuery
详解JS数组Reduce()方法详解及高级技巧
2017/08/18 Javascript
详解Web使用webpack构建前端项目
2017/09/23 Javascript
详解多页应用 Webpack4 配置优化与踩坑记录
2018/10/16 Javascript
详解用Webpack与Babel配置ES6开发环境
2019/03/12 Javascript
vue实现在v-html的html字符串中绑定事件
2019/10/28 Javascript
不刷新网页就能链接新的js文件方法总结
2020/03/01 Javascript
vue实现学生信息管理系统
2020/05/30 Javascript
[00:57]深扒TI7聊天轮盘语音出处5
2017/05/11 DOTA
[01:06:26]全国守擂赛第二周 Team Coach vs DeMonsTer
2020/04/28 DOTA
Python中的数据对象持久化存储模块pickle的使用示例
2016/03/03 Python
对Python3.x版本print函数左右对齐详解
2018/12/22 Python
使用pycharm在本地开发并实时同步到服务器
2019/08/02 Python
python3图片文件批量重命名处理
2019/10/31 Python
python爬虫开发之selenium模块详细使用方法与实例全解
2020/03/09 Python
Laura官网:加拿大女性的顶级时尚目的地
2019/09/20 全球购物
四川internet信息高速公路(C#)笔试题
2012/02/29 面试题
会计岗位说明书
2014/07/29 职场文书
单位工作证明书格式
2014/10/04 职场文书
世界水日宣传活动总结
2015/02/09 职场文书
网络管理员岗位职责
2015/02/12 职场文书
师德师风心得体会(2016精选篇)
2016/01/12 职场文书
python 逐步回归算法
2021/04/06 Python
入门学习Go的基本语法
2021/07/07 Golang