Python使用scrapy采集时伪装成HTTP/1.1的方法


Posted in Python onApril 08, 2015

本文实例讲述了Python使用scrapy采集时伪装成HTTP/1.1的方法。分享给大家供大家参考。具体如下:

添加下面的代码到 settings.py 文件

DOWNLOADER_HTTPCLIENTFACTORY = 'myproject.downloader.HTTPClientFactory'

保存以下代码到单独的.py文件
from scrapy.core.downloader.webclient import ScrapyHTTPClientFactory, ScrapyHTTPPageGetter

class PageGetter(ScrapyHTTPPageGetter):

    def sendCommand(self, command, path):

        self.transport.write('%s %s HTTP/1.1\r\n' % (command, path))

class HTTPClientFactory(ScrapyHTTPClientFactory):

     protocol = PageGetter

希望本文所述对大家的Python程序设计有所帮助。

Python 相关文章推荐
python函数局部变量用法实例分析
Aug 04 Python
django自带的server 让外网主机访问方法
May 14 Python
对numpy中数组转置的求解以及向量内积计算方法
Oct 31 Python
详解Python with/as使用说明
Dec 13 Python
Python函数和模块的使用总结
May 20 Python
Python3enumrate和range对比及示例详解
Jul 13 Python
python实现桌面气泡提示功能
Jul 29 Python
django框架F&Q 聚合与分组操作示例
Dec 12 Python
python通过matplotlib生成复合饼图
Feb 06 Python
python实现猜数游戏(保存游戏记录)
Jun 22 Python
Python3以GitHub为例来实现模拟登录和爬取的实例讲解
Jul 30 Python
Python request post上传文件常见要点
Nov 20 Python
Python打印scrapy蜘蛛抓取树结构的方法
Apr 08 #Python
使用IPython来操作Docker容器的入门指引
Apr 08 #Python
仅用50行Python代码实现一个简单的代理服务器
Apr 08 #Python
用Python实现一个简单的能够发送带附件的邮件程序的教程
Apr 08 #Python
Python 创建子进程模块subprocess详解
Apr 08 #Python
Python中使用gzip模块压缩文件的简单教程
Apr 08 #Python
Python使用scrapy抓取网站sitemap信息的方法
Apr 08 #Python
You might like
开发大型 PHP 项目的方法
2007/01/02 PHP
解决控件遮挡问题:关于有窗口元素和无窗口元素
2007/01/28 PHP
JavaScript与HTML结合的基本使用方法整理
2015/10/12 PHP
将PHP程序中返回的JSON格式数据用gzip压缩输出的方法
2016/03/03 PHP
PHP设计模式之简单工厂和工厂模式实例分析
2019/03/25 PHP
记录几个javascript有关的小细节
2007/04/02 Javascript
简单的无缝滚动程序-仅几行代码
2007/05/08 Javascript
JAVASCRIPT style 中visibility和display之间的区别
2010/01/22 Javascript
jquery 图片 上一张 下一张 链接效果(续篇)
2010/04/20 Javascript
JavaScript 构造函数 面相对象学习必备知识
2010/06/09 Javascript
jquery 弹出层注册页面等(asp.net后台)
2010/06/17 Javascript
JavaScript取得鼠标绝对位置程序代码介绍
2012/09/16 Javascript
关闭时刷新父窗口两种方法
2014/05/07 Javascript
JS实现在页面随时自定义背景颜色的方法
2015/02/27 Javascript
javascript简易画板开发
2020/04/12 Javascript
vue中渐进过渡效果实现
2016/10/27 Javascript
JS生成和下载二维码的代码
2016/12/07 Javascript
js实现贪吃蛇小游戏(容易理解)
2017/01/22 Javascript
微信小程序实现鼠标拖动效果示例
2017/12/01 Javascript
通过jquery toggleClass()属性制作文章段落更改背景颜色
2018/05/21 jQuery
vscode下的vue文件格式化问题
2018/11/28 Javascript
用Python代码来解图片迷宫的方法整理
2015/04/02 Python
Python中的深拷贝和浅拷贝详解
2015/06/03 Python
Python中str.format()详解
2017/03/12 Python
Python MD5加密实例详解
2017/08/02 Python
python基于twisted框架编写简单聊天室
2018/01/02 Python
详解python使用递归、尾递归、循环三种方式实现斐波那契数列
2018/01/16 Python
Python之lambda匿名函数及map和filter的用法
2019/03/05 Python
pandas将多个dataframe以多个sheet的形式保存到一个excel文件中
2019/10/10 Python
numpy数组做图片拼接的实现(concatenate、vstack、hstack)
2019/11/08 Python
使用Python函数进行模块化的实现
2019/11/15 Python
Pyecharts地图显示不完成问题解决方案
2020/05/11 Python
工商学院毕业生自荐信
2013/11/12 职场文书
环保建议书300字
2014/05/14 职场文书
2014年学习部工作总结
2014/11/12 职场文书
python 字典和列表嵌套用法详解
2021/06/29 Python