Scrapy 配置动态代理IP的实现


Posted in Python onSeptember 28, 2020

应用 Scrapy框架 ,配置动态IP处理反爬。

# settings 配置中间件
DOWNLOADER_MIDDLEWARES = {
  'text.middlewares.TextDownloaderMiddleware': 543,
  # 'text.middlewares.RandomUserAgentMiddleware': 544,
  # 'text.middlewares.CheckUserAgentMiddleware': 545,
  'text.middlewares.ProxyMiddleware': 546,
  'text.middlewares.CheckProxyMiddleware': 547
}

 
# settings 配置可用动态IP
PROXIES = [
  "http://101.231.104.82:80",
  "http://39.137.69.6:8080",
  "http://39.137.69.10:8080",
  "http://39.137.69.7:80",
  "http://39.137.77.66:8080",
  "http://117.191.11.102:80",
  "http://117.191.11.113:8080",
  "http://117.191.11.113:80",
  "http://120.210.219.103:8080",
  "http://120.210.219.104:80",
  "http://120.210.219.102:80",
  "http://119.41.236.180:8010",
  "http://117.191.11.80:8080"
]
# middlewares 配置中间件
import random

class ProxyMiddleware(object):

  def process_request(self, request, spider):
    ip = random.choice(spider.settings.get('PROXIES'))
    print('测试IP:', ip)
    request.meta['proxy'] = ip


class CheckProxyMiddleware(object):

  def process_response(self, request, response, spider):
    print('代理IP:', request.meta['proxy'])
    return response

到此这篇关于Scrapy 配置动态代理IP的实现的文章就介绍到这了,更多相关Scrapy 动态代理IP内容请搜索三水点靠木以前的文章或继续浏览下面的相关文章希望大家以后多多支持三水点靠木!

Python 相关文章推荐
Python对列表中的各项进行关联详解
Aug 15 Python
Python入门之后再看点什么好?
Mar 05 Python
Python实现正弦信号的时域波形和频谱图示例【基于matplotlib】
May 04 Python
详解Django-auth-ldap 配置方法
Dec 10 Python
Python2和Python3的共存和切换使用
Apr 12 Python
python快速编写单行注释多行注释的方法
Jul 31 Python
python通过txt文件批量安装依赖包的实现步骤
Aug 13 Python
Python绘图实现显示中文
Dec 04 Python
Pandas中两个dataframe的交集和差集的示例代码
Dec 13 Python
python opencv肤色检测的实现示例
Dec 21 Python
python用字节处理文件实例讲解
Apr 13 Python
Python实现文字pdf转换图片pdf效果
Apr 03 Python
Scrapy中如何向Spider传入参数的方法实现
Sep 28 #Python
详解向scrapy中的spider传递参数的几种方法(2种)
Sep 28 #Python
小结Python的反射机制
Sep 28 #Python
scrapy与selenium结合爬取数据(爬取动态网站)的示例代码
Sep 28 #Python
scrapy结合selenium解析动态页面的实现
Sep 28 #Python
互斥锁解决 Python 中多线程共享全局变量的问题(推荐)
Sep 28 #Python
python 常见的反爬虫策略
Sep 27 #Python
You might like
php win下Socket方式发邮件类
2009/08/21 PHP
学习php设计模式 php实现抽象工厂模式
2015/12/07 PHP
php.ini中date.timezone设置详解
2016/11/20 PHP
php 字符串中是否包含指定字符串的多种方法
2018/04/12 PHP
HTML页面如何象ASP一样接受参数
2007/02/07 Javascript
prototype Element学习笔记(篇二)
2008/10/26 Javascript
IE 条件注释详解总结(附实例代码)
2009/08/29 Javascript
jquery实现的带缩略图的焦点图片切换(自动播放/响应鼠标动作)
2013/01/23 Javascript
jquery滚动特效集锦
2015/06/03 Javascript
JS模拟Dialog弹出浮动框效果代码
2015/10/16 Javascript
AngularJS 如何在控制台进行错误调试
2016/06/07 Javascript
Vuex模块化实现待办事项的状态管理
2017/03/15 Javascript
JS实现图片手风琴效果
2020/04/17 Javascript
angularJs中跳转到指定的锚点实例($anchorScroll)
2018/08/31 Javascript
jQuery 同时获取多个标签的指定内容并储存为数组
2018/11/20 jQuery
JavaScript静态作用域和动态作用域实例详解
2019/06/17 Javascript
JavaScript 中判断变量是否为数字的示例代码
2020/10/22 Javascript
[04:38]完美世界携手游戏风云打造 卡尔工作室饰品系统篇
2013/04/25 DOTA
Python中列表(list)操作方法汇总
2014/08/18 Python
Python判断文本中消息重复次数的方法
2016/04/27 Python
用TensorFlow实现多类支持向量机的示例代码
2018/04/28 Python
Windows 8.1 64bit下搭建 Scrapy 0.22 环境
2018/11/18 Python
详解配置Django的Celery异步之路踩坑
2018/11/25 Python
python爬虫爬取微博评论案例详解
2019/03/27 Python
Python数据结构与算法(几种排序)小结
2019/06/22 Python
python操作excel让工作自动化
2019/08/09 Python
Python3将jpg转为pdf文件的方法示例
2019/12/13 Python
Python使用lambda抛出异常实现方法解析
2020/08/20 Python
巴西Bo.Bô官方在线商店:经营奢侈品时尚业务
2020/03/16 全球购物
超越自我演讲稿
2014/05/21 职场文书
教师节感恩老师演讲稿
2014/08/28 职场文书
党员对照检查材料
2014/09/22 职场文书
初级职称评定工作总结
2015/08/13 职场文书
信息技术课教学反思
2016/02/23 职场文书
想创业成功,需要掌握这些要点
2019/12/06 职场文书
Nginx配置并兼容HTTP实现代码解析
2021/03/31 Servers