Scrapy 配置动态代理IP的实现


Posted in Python onSeptember 28, 2020

应用 Scrapy框架 ,配置动态IP处理反爬。

# settings 配置中间件
DOWNLOADER_MIDDLEWARES = {
  'text.middlewares.TextDownloaderMiddleware': 543,
  # 'text.middlewares.RandomUserAgentMiddleware': 544,
  # 'text.middlewares.CheckUserAgentMiddleware': 545,
  'text.middlewares.ProxyMiddleware': 546,
  'text.middlewares.CheckProxyMiddleware': 547
}

 
# settings 配置可用动态IP
PROXIES = [
  "http://101.231.104.82:80",
  "http://39.137.69.6:8080",
  "http://39.137.69.10:8080",
  "http://39.137.69.7:80",
  "http://39.137.77.66:8080",
  "http://117.191.11.102:80",
  "http://117.191.11.113:8080",
  "http://117.191.11.113:80",
  "http://120.210.219.103:8080",
  "http://120.210.219.104:80",
  "http://120.210.219.102:80",
  "http://119.41.236.180:8010",
  "http://117.191.11.80:8080"
]
# middlewares 配置中间件
import random

class ProxyMiddleware(object):

  def process_request(self, request, spider):
    ip = random.choice(spider.settings.get('PROXIES'))
    print('测试IP:', ip)
    request.meta['proxy'] = ip


class CheckProxyMiddleware(object):

  def process_response(self, request, response, spider):
    print('代理IP:', request.meta['proxy'])
    return response

到此这篇关于Scrapy 配置动态代理IP的实现的文章就介绍到这了,更多相关Scrapy 动态代理IP内容请搜索三水点靠木以前的文章或继续浏览下面的相关文章希望大家以后多多支持三水点靠木!

Python 相关文章推荐
跟老齐学Python之有容乃大的list(3)
Sep 15 Python
Python中的sort()方法使用基础教程
Jan 08 Python
python基于itchat实现微信群消息同步机器人
Feb 27 Python
Python数据结构之图的应用示例
May 11 Python
python3.6.3安装图文教程 TensorFlow安装配置方法
Jun 24 Python
解决Python获取字典dict中不存在的值时出错问题
Oct 17 Python
Python字典中的键映射多个值的方法(列表或者集合)
Oct 17 Python
Python实现监控Nginx配置文件的不同并发送邮件报警功能示例
Feb 26 Python
解决pycharm 安装numpy失败的问题
Dec 05 Python
python如何进行矩阵运算
Jun 05 Python
PyTorch 导数应用的使用教程
Aug 31 Python
Python 如何解决稀疏矩阵运算
May 26 Python
Scrapy中如何向Spider传入参数的方法实现
Sep 28 #Python
详解向scrapy中的spider传递参数的几种方法(2种)
Sep 28 #Python
小结Python的反射机制
Sep 28 #Python
scrapy与selenium结合爬取数据(爬取动态网站)的示例代码
Sep 28 #Python
scrapy结合selenium解析动态页面的实现
Sep 28 #Python
互斥锁解决 Python 中多线程共享全局变量的问题(推荐)
Sep 28 #Python
python 常见的反爬虫策略
Sep 27 #Python
You might like
手把手教你使用DedeCms V3的在线采集图文教程
2007/04/03 PHP
PHP5+UTF8多文件上传类
2008/10/17 PHP
php数组中包含中文的排序方法
2014/06/03 PHP
PHP获取短链接跳转后的真实地址和响应头信息的方法
2014/07/25 PHP
php分页原理 分页代码 分页类制作教程
2016/09/23 PHP
PHP验证类的封装与使用方法详解
2019/01/10 PHP
JavaScript delete操作符应用实例
2009/01/13 Javascript
EXTJS内使用ACTIVEX控件引起崩溃问题的解决方法
2010/03/31 Javascript
深入理解JavaScript 闭包究竟是什么
2013/04/12 Javascript
jQuery中parents()方法用法实例
2015/01/07 Javascript
JQuery中attr方法和removeAttr方法用法实例
2015/05/18 Javascript
javascript常用正则表达式汇总
2015/07/31 Javascript
微信小程序 数据绑定详解及实例
2016/10/25 Javascript
jQuery图片瀑布流的简单实现代码
2017/03/15 Javascript
微信小程序 自定义Toast实例代码
2017/06/12 Javascript
vue移动端裁剪图片结合插件Cropper的使用实例代码
2017/07/10 Javascript
layui加载数据显示loading加载完成loading消失的实例代码
2019/09/23 Javascript
[10:42]Team Liquid Vs Newbee
2018/06/07 DOTA
python中while循环语句用法简单实例
2015/05/07 Python
Python在信息学竞赛中的运用及Python的基本用法(详解)
2017/08/15 Python
Python算法之图的遍历
2017/11/16 Python
Python语言实现将图片转化为html页面
2017/12/06 Python
基于python3 OpenCV3实现静态图片人脸识别
2018/05/25 Python
使用jupyter notebook直接打开.md格式的文件
2020/04/10 Python
简单掌握CSS3将文字描边及填充文字颜色的方法
2016/03/07 HTML / CSS
Lovedrobe官网:英国领先的大码服装品牌
2019/09/19 全球购物
施工安全协议书
2013/12/11 职场文书
《桃林那间小木屋》教学反思
2014/05/01 职场文书
化学教育专业自荐信
2014/07/04 职场文书
2014大学班主任工作总结
2014/11/08 职场文书
2014年党建工作总结
2014/11/11 职场文书
2014年财政工作总结
2014/12/10 职场文书
热血教师观后感
2015/06/10 职场文书
初中运动会闭幕词范本3篇
2019/12/09 职场文书
Python机器学习之逻辑回归
2021/05/11 Python
使用javascript解析二维码的三种方式
2021/11/11 Javascript