Python爬虫scrapy框架Cookie池(微博Cookie池)的使用


Posted in Python onJanuary 13, 2021

下载代码Cookie池(这里主要是微博登录,也可以自己配置置其他的站点网址)

下载代码GitHub:https://github.com/Python3WebSpider/CookiesPool

Python爬虫scrapy框架Cookie池(微博Cookie池)的使用

下载安装过后注意看网页下面的相关基础配置和操作!!!!!!!!!!!!!

自己的设置主要有下面几步:

1、配置其他设置

Python爬虫scrapy框架Cookie池(微博Cookie池)的使用

2、设置使用的浏览器

Python爬虫scrapy框架Cookie池(微博Cookie池)的使用

Python爬虫scrapy框架Cookie池(微博Cookie池)的使用

3、设置模拟登陆

Python爬虫scrapy框架Cookie池(微博Cookie池)的使用

源码cookies.py的修改(以下两处不修改可能会产生bug)

Python爬虫scrapy框架Cookie池(微博Cookie池)的使用

 Python爬虫scrapy框架Cookie池(微博Cookie池)的使用

4、获取cookie

随机获取Cookies: http://localhost:5000/weibo/random(注意:cookie使用时是需要后期处理的!!)

Python爬虫scrapy框架Cookie池(微博Cookie池)的使用

简单的处理方式,如下代码(偶尔需要对获取的cookie处理):

def get_cookie(self):
    return requests.get('http://127.0.0.1:5000/weibo/random').text
 
  def stringToDict(self,cookie):
    itemDict = {}
    items = cookie.replace(':', '=').split(',')
    for item in items:
      key = item.split('=')[0].replace(' ', '').strip(' "')
      value = item.split('=')[1].strip(' "')
      itemDict[key] = value
    return itemDict

scrapy爬虫的使用示例(爬取微博):

middlewares.py中自定义请求中间件

def start_requests(self):
    ua = UserAgent()
    headers = {
      'User-Agent': ua.random,
      }
    cookies = self.stringToDict(str(self.get_cookie().strip('{|}')))
 
    yield scrapy.Request(url=self.start_urls[0], headers=headers,
               cookies=cookies, callback=self.parse)
cookies = self.stringToDict(str(self.get_cookie().strip('{|}')))

    yield scrapy.Request(url=self.start_urls[0], headers=headers,
               cookies=cookies, callback=self.parse)

settings.py 中的配置:

Python爬虫scrapy框架Cookie池(微博Cookie池)的使用

5、录入账号和密码:

Python爬虫scrapy框架Cookie池(微博Cookie池)的使用

格式规定(账号----密码)

Python爬虫scrapy框架Cookie池(微博Cookie池)的使用

6、验证:(注意:使用cmd)

Python爬虫scrapy框架Cookie池(微博Cookie池)的使用

7、使用时注意保持cmd打开运行!!

使用时一定要打开cmd,并运行如第6步。

得到Cookie是判断是否处理处理Cookie(几乎都需要!!)类比第4步!!!

到此这篇关于Python爬虫scrapy框架Cookie池(微博Cookie池)的使用的文章就介绍到这了,更多相关scrapy Cookie池内容请搜索三水点靠木以前的文章或继续浏览下面的相关文章希望大家以后多多支持三水点靠木!

Python 相关文章推荐
python实现dnspod自动更新dns解析的方法
Feb 14 Python
Python 统计字数的思路详解
May 08 Python
利用python GDAL库读写geotiff格式的遥感影像方法
Nov 29 Python
对Python 除法负数取商的取整方式详解
Dec 12 Python
python2和python3在处理字符串上的区别详解
May 29 Python
通过PYTHON来实现图像分割详解
Jun 26 Python
python 使用装饰器并记录log的示例代码
Jul 12 Python
Python中的 sort 和 sorted的用法与区别
Aug 10 Python
Python使用turtle库绘制小猪佩奇(实例代码)
Jan 16 Python
jenkins+python自动化测试持续集成教程
May 12 Python
Python数据分析之pandas读取数据
Jun 02 Python
再谈python_tkinter弹出对话框创建
Mar 20 Python
matplotlib交互式数据光标实现(mplcursors)
Jan 13 #Python
Python 生成短8位唯一id实战教程
Jan 13 #Python
python uuid生成唯一id或str的最简单案例
Jan 13 #Python
全网最全python库selenium自动化使用详细教程
Jan 12 #Python
[原创]赚疯了!转手立赚800+?大佬的python「抢茅台脚本」使用教程
Jan 12 #Python
五分钟学会怎么用python做一个简单的贪吃蛇
Jan 12 #Python
python生成word合同的实例方法
Jan 12 #Python
You might like
自己动手,丰衣足食 - 短波框形天线制作
2021/03/01 无线电
打造计数器DIY三步曲(下)
2006/10/09 PHP
php之字符串变相相减的代码
2007/03/19 PHP
phpstudy默认不支持64位php的解决方法
2017/02/20 PHP
PHP程序员学习使用Swoole的理由
2018/06/24 PHP
Yii2框架配置文件(Application属性)与调试技巧实例分析
2019/05/27 PHP
php设计模式之适配器模式实例分析【星际争霸游戏案例】
2020/04/07 PHP
javascript中的关于类型转换的性能优化
2010/12/14 Javascript
Javascript Request获取请求参数如何实现
2012/11/28 Javascript
javascript中数组的冒泡排序使用示例
2013/12/18 Javascript
checkbox选中与未选中判断示例
2014/08/04 Javascript
jquery如何获取元素的滚动条高度等实现代码
2015/10/19 Javascript
基于Jquery和html5的7款个性化地图插件
2015/11/17 Javascript
AngularJS基础 ng-keyup 指令简单示例
2016/08/02 Javascript
响应式表格之固定表头的简单实现
2016/08/26 Javascript
轻松掌握JavaScript享元模式
2016/08/27 Javascript
原生JS实现自定义滚动条效果
2020/10/27 Javascript
JavaScript实现图片拖曳效果
2017/09/08 Javascript
微信小程序实现鼠标拖动效果示例
2017/12/01 Javascript
JavaScript实现简单验证码
2020/08/24 Javascript
Python写的Socks5协议代理服务器
2014/08/06 Python
Python base64编码解码实例
2015/06/21 Python
在Python中定义和使用抽象类的方法
2016/06/30 Python
Python利用Django如何写restful api接口详解
2018/06/08 Python
使用Anaconda3建立虚拟独立的python2.7环境方法
2018/06/11 Python
详解关于Django中ORM数据库迁移的配置
2018/10/08 Python
Python BeautifulSoup [解决方法] TypeError: list indices must be integers or slices, not str
2019/08/07 Python
python matplotlib如何给图中的点加标签
2019/11/14 Python
New Balance加拿大官方网站:运动鞋和健身服装
2018/11/19 全球购物
巴西购物网站:Onofre Agora
2020/06/08 全球购物
优秀教师先进事迹
2014/01/22 职场文书
亲戚结婚的请假条
2014/02/11 职场文书
4s店市场专员岗位职责
2014/04/09 职场文书
初二学习计划书范文
2014/04/27 职场文书
2014年财务部工作总结
2014/11/11 职场文书
《乌鸦喝水》教学反思
2016/02/19 职场文书