Python使用scrapy采集时伪装成HTTP/1.1的方法


Posted in Python onApril 08, 2015

本文实例讲述了Python使用scrapy采集时伪装成HTTP/1.1的方法。分享给大家供大家参考。具体如下:

添加下面的代码到 settings.py 文件

DOWNLOADER_HTTPCLIENTFACTORY = 'myproject.downloader.HTTPClientFactory'

保存以下代码到单独的.py文件
from scrapy.core.downloader.webclient import ScrapyHTTPClientFactory, ScrapyHTTPPageGetter

class PageGetter(ScrapyHTTPPageGetter):

    def sendCommand(self, command, path):

        self.transport.write('%s %s HTTP/1.1\r\n' % (command, path))

class HTTPClientFactory(ScrapyHTTPClientFactory):

     protocol = PageGetter

希望本文所述对大家的Python程序设计有所帮助。

Python 相关文章推荐
调试Python程序代码的几种方法总结
Apr 28 Python
Python3使用requests登录人人影视网站的方法
May 11 Python
python字典多键值及重复键值的使用方法(详解)
Oct 31 Python
python 如何快速找出两个电子表中数据的差异
May 26 Python
Python自定义函数实现求两个数最大公约数、最小公倍数示例
May 21 Python
python切片的步进、添加、连接简单操作示例
Jul 11 Python
Python 使用元类type创建类对象常见应用详解
Oct 17 Python
python中加背景音乐如何操作
Jul 19 Python
pycharm中如何自定义设置通过“ctrl+滚轮”进行放大和缩小实现方法
Sep 16 Python
利用python绘制中国地图(含省界、河流等)
Sep 21 Python
python实现无边框进度条的实例代码
Dec 30 Python
Python Pandas模块实现数据的统计分析的方法
Jun 24 Python
Python打印scrapy蜘蛛抓取树结构的方法
Apr 08 #Python
使用IPython来操作Docker容器的入门指引
Apr 08 #Python
仅用50行Python代码实现一个简单的代理服务器
Apr 08 #Python
用Python实现一个简单的能够发送带附件的邮件程序的教程
Apr 08 #Python
Python 创建子进程模块subprocess详解
Apr 08 #Python
Python中使用gzip模块压缩文件的简单教程
Apr 08 #Python
Python使用scrapy抓取网站sitemap信息的方法
Apr 08 #Python
You might like
世界收音机发展史
2021/03/01 无线电
PHP 批量删除 sql语句
2009/06/05 PHP
php的sso单点登录实现方法
2015/01/08 PHP
PHP自定义函数格式化json数据示例
2016/09/14 PHP
在laravel-admin中列表中禁止某行编辑、删除的方法
2019/10/03 PHP
TP5框架model常见操作示例小结【增删改查、聚合、时间戳、软删除等】
2020/04/05 PHP
JavaScript中URL编码函数代码
2011/01/11 Javascript
40款非常棒的jQuery 插件和制作教程(系列一)
2011/10/26 Javascript
js汉字排序问题 支持中英文混排,兼容各浏览器,包括CHROME
2011/12/20 Javascript
javascript重复绑定事件造成的后果说明
2013/03/02 Javascript
从零学习node.js之利用express搭建简易论坛(七)
2017/02/25 Javascript
收藏AngularJS中最重要的核心功能
2017/07/09 Javascript
js处理包含中文的字符串实例
2017/10/11 Javascript
关于vue单文件中引用路径的处理方法
2018/01/08 Javascript
简易Vue评论框架的实现(父组件的实现)
2018/01/08 Javascript
浅谈AngularJS中$http服务的简单用法
2018/05/15 Javascript
Vue列表渲染的示例代码
2018/11/01 Javascript
React Native中Mobx的使用方法详解
2018/12/04 Javascript
layui添加动态菜单与选项卡 AJAX请求的例子
2019/09/25 Javascript
[32:17]完美世界DOTA2联赛循环赛LBZS vs Forest第二场 10月30日
2020/10/31 DOTA
python实现人脸识别代码
2017/11/08 Python
python编程培训 python培训靠谱吗
2018/01/17 Python
Django中Forms的使用代码解析
2018/02/10 Python
python 3.6.4 安装配置方法图文教程
2018/09/18 Python
tensorflow 实现数据类型转换
2020/02/17 Python
h5调用摄像头的实现方法
2016/06/01 HTML / CSS
佐卡伊官网:中国知名珠宝品牌
2017/02/05 全球购物
介绍一下EJB的分类及其各自的功能及应用
2016/08/23 面试题
英语自荐信常用语句
2013/12/13 职场文书
大二学期个人自我评价
2014/01/13 职场文书
高中毕业生的个人自我评价
2014/02/21 职场文书
班主任对学生的评语
2014/04/26 职场文书
从事会计工作年限证明
2015/06/23 职场文书
初一语文教学反思
2016/03/03 职场文书
2016年度基层党建工作公开承诺书
2016/03/25 职场文书
英文诗歌翻译方法(赏析)
2019/08/16 职场文书