Scrapy 配置动态代理IP的实现


Posted in Python onSeptember 28, 2020

应用 Scrapy框架 ,配置动态IP处理反爬。

# settings 配置中间件
DOWNLOADER_MIDDLEWARES = {
  'text.middlewares.TextDownloaderMiddleware': 543,
  # 'text.middlewares.RandomUserAgentMiddleware': 544,
  # 'text.middlewares.CheckUserAgentMiddleware': 545,
  'text.middlewares.ProxyMiddleware': 546,
  'text.middlewares.CheckProxyMiddleware': 547
}

 
# settings 配置可用动态IP
PROXIES = [
  "http://101.231.104.82:80",
  "http://39.137.69.6:8080",
  "http://39.137.69.10:8080",
  "http://39.137.69.7:80",
  "http://39.137.77.66:8080",
  "http://117.191.11.102:80",
  "http://117.191.11.113:8080",
  "http://117.191.11.113:80",
  "http://120.210.219.103:8080",
  "http://120.210.219.104:80",
  "http://120.210.219.102:80",
  "http://119.41.236.180:8010",
  "http://117.191.11.80:8080"
]
# middlewares 配置中间件
import random

class ProxyMiddleware(object):

  def process_request(self, request, spider):
    ip = random.choice(spider.settings.get('PROXIES'))
    print('测试IP:', ip)
    request.meta['proxy'] = ip


class CheckProxyMiddleware(object):

  def process_response(self, request, response, spider):
    print('代理IP:', request.meta['proxy'])
    return response

到此这篇关于Scrapy 配置动态代理IP的实现的文章就介绍到这了,更多相关Scrapy 动态代理IP内容请搜索三水点靠木以前的文章或继续浏览下面的相关文章希望大家以后多多支持三水点靠木!

Python 相关文章推荐
python采用requests库模拟登录和抓取数据的简单示例
Jul 05 Python
Python中optparse模块使用浅析
Jan 01 Python
在Django同1个页面中的多表单处理详解
Jan 25 Python
Python中的id()函数指的什么
Oct 17 Python
Tensorflow实现AlexNet卷积神经网络及运算时间评测
May 24 Python
python中使用 xlwt 操作excel的常见方法与问题
Jan 13 Python
python爬虫爬取微博评论案例详解
Mar 27 Python
在linux下实现 python 监控usb设备信号
Jul 03 Python
pyqt5中动画的使用详解
Apr 01 Python
python使用opencv resize图像不进行插值的操作
Jul 05 Python
python 常见的反爬虫策略
Sep 27 Python
最新PyCharm 2020.2.3永久激活码(亲测有效)
Nov 26 Python
Scrapy中如何向Spider传入参数的方法实现
Sep 28 #Python
详解向scrapy中的spider传递参数的几种方法(2种)
Sep 28 #Python
小结Python的反射机制
Sep 28 #Python
scrapy与selenium结合爬取数据(爬取动态网站)的示例代码
Sep 28 #Python
scrapy结合selenium解析动态页面的实现
Sep 28 #Python
互斥锁解决 Python 中多线程共享全局变量的问题(推荐)
Sep 28 #Python
python 常见的反爬虫策略
Sep 27 #Python
You might like
PHP 抓取网页图片并且另存为的实现代码
2010/03/24 PHP
PHP邮件群发机实现代码
2016/02/16 PHP
PHP高并发和大流量解决方案整理
2019/12/24 PHP
Thinkphp 框架扩展之Widget扩展实现方法分析
2020/04/23 PHP
用javascript实现自定义标签
2007/05/08 Javascript
使用新的消息弹出框blackbirdjs
2008/10/16 Javascript
javascript脚本编程解决考试分数统计问题
2008/10/18 Javascript
前后台交互过程中json格式如何解析以及如何生成
2012/12/26 Javascript
css配合jquery美化 select
2013/11/29 Javascript
javascript中的undefined和not defined区别示例介绍
2014/02/26 Javascript
Web打印解决方案之证件套打的实现思路
2016/08/29 Javascript
微信小程序前端源码逻辑和工作流
2016/09/25 Javascript
ajax +NodeJS 实现图片上传实例
2017/06/06 NodeJs
关于javascript作用域的常见面试题分享
2017/06/18 Javascript
解决iview打包时UglifyJs报错的问题
2018/03/07 Javascript
微信小程序实现折线图的示例代码
2019/06/07 Javascript
[00:36]DOTA2勇士令状莱恩声望物品——冥晶之厄展示
2018/05/25 DOTA
[51:29]Alliance vs TNC 2019国际邀请赛小组赛 BO2 第二场 8.16
2019/08/18 DOTA
[58:25]VP vs RNG 2019国际邀请赛小组赛 BO2 第一场 8.15
2019/08/17 DOTA
Python操作SQLite简明教程
2014/07/10 Python
python处理csv数据的方法
2015/03/11 Python
利用一个简单的例子窥探CPython内核的运行机制
2015/03/30 Python
Python实现数通设备端口使用情况监控实例
2015/07/15 Python
Python之日期与时间处理模块(date和datetime)
2017/02/16 Python
python中如何使用朴素贝叶斯算法
2017/04/06 Python
python如何求数组连续最大和的示例代码
2020/02/04 Python
纯CSS绘制漂亮的圆形图案效果
2014/05/07 HTML / CSS
大学生冰淇淋店商业计划书
2014/01/14 职场文书
员工考核管理制度
2014/02/02 职场文书
运动会跳远广播稿
2014/02/04 职场文书
统计专业自荐书
2014/07/06 职场文书
2014年重阳节活动策划方案书
2014/09/16 职场文书
教师“一帮一”结对子活动总结
2015/05/07 职场文书
赵氏孤儿观后感
2015/06/09 职场文书
终止解除劳动合同证明书
2015/06/17 职场文书
主婚人致辞精选
2015/07/28 职场文书