Python爬虫scrapy框架Cookie池(微博Cookie池)的使用


Posted in Python onJanuary 13, 2021

下载代码Cookie池(这里主要是微博登录,也可以自己配置置其他的站点网址)

下载代码GitHub:https://github.com/Python3WebSpider/CookiesPool

Python爬虫scrapy框架Cookie池(微博Cookie池)的使用

下载安装过后注意看网页下面的相关基础配置和操作!!!!!!!!!!!!!

自己的设置主要有下面几步:

1、配置其他设置

Python爬虫scrapy框架Cookie池(微博Cookie池)的使用

2、设置使用的浏览器

Python爬虫scrapy框架Cookie池(微博Cookie池)的使用

Python爬虫scrapy框架Cookie池(微博Cookie池)的使用

3、设置模拟登陆

Python爬虫scrapy框架Cookie池(微博Cookie池)的使用

源码cookies.py的修改(以下两处不修改可能会产生bug)

Python爬虫scrapy框架Cookie池(微博Cookie池)的使用

 Python爬虫scrapy框架Cookie池(微博Cookie池)的使用

4、获取cookie

随机获取Cookies: http://localhost:5000/weibo/random(注意:cookie使用时是需要后期处理的!!)

Python爬虫scrapy框架Cookie池(微博Cookie池)的使用

简单的处理方式,如下代码(偶尔需要对获取的cookie处理):

def get_cookie(self):
    return requests.get('http://127.0.0.1:5000/weibo/random').text
 
  def stringToDict(self,cookie):
    itemDict = {}
    items = cookie.replace(':', '=').split(',')
    for item in items:
      key = item.split('=')[0].replace(' ', '').strip(' "')
      value = item.split('=')[1].strip(' "')
      itemDict[key] = value
    return itemDict

scrapy爬虫的使用示例(爬取微博):

middlewares.py中自定义请求中间件

def start_requests(self):
    ua = UserAgent()
    headers = {
      'User-Agent': ua.random,
      }
    cookies = self.stringToDict(str(self.get_cookie().strip('{|}')))
 
    yield scrapy.Request(url=self.start_urls[0], headers=headers,
               cookies=cookies, callback=self.parse)
cookies = self.stringToDict(str(self.get_cookie().strip('{|}')))

    yield scrapy.Request(url=self.start_urls[0], headers=headers,
               cookies=cookies, callback=self.parse)

settings.py 中的配置:

Python爬虫scrapy框架Cookie池(微博Cookie池)的使用

5、录入账号和密码:

Python爬虫scrapy框架Cookie池(微博Cookie池)的使用

格式规定(账号----密码)

Python爬虫scrapy框架Cookie池(微博Cookie池)的使用

6、验证:(注意:使用cmd)

Python爬虫scrapy框架Cookie池(微博Cookie池)的使用

7、使用时注意保持cmd打开运行!!

使用时一定要打开cmd,并运行如第6步。

得到Cookie是判断是否处理处理Cookie(几乎都需要!!)类比第4步!!!

到此这篇关于Python爬虫scrapy框架Cookie池(微博Cookie池)的使用的文章就介绍到这了,更多相关scrapy Cookie池内容请搜索三水点靠木以前的文章或继续浏览下面的相关文章希望大家以后多多支持三水点靠木!

Python 相关文章推荐
Python创建文件和追加文件内容实例
Oct 21 Python
详解python中xlrd包的安装与处理Excel表格
Dec 16 Python
利用Tkinter和matplotlib两种方式画饼状图的实例
Nov 06 Python
速记Python布尔值
Nov 09 Python
如何用Python合并lmdb文件
Jul 02 Python
Python使用指定端口进行http请求的例子
Jul 25 Python
python GUI库图形界面开发之PyQt5切换按钮控件QPushButton详细使用方法与实例
Feb 28 Python
浅谈selenium如何应对网页内容需要鼠标滚动加载的问题
Mar 14 Python
基于pycharm实现批量修改变量名
Jun 02 Python
浅谈keras中的目标函数和优化函数MSE用法
Jun 10 Python
解决Python3.7.0 SSL低版本导致Pip无法使用问题
Sep 03 Python
python使用matplotlib:subplot绘制多个子图的示例
Sep 24 Python
matplotlib交互式数据光标实现(mplcursors)
Jan 13 #Python
Python 生成短8位唯一id实战教程
Jan 13 #Python
python uuid生成唯一id或str的最简单案例
Jan 13 #Python
全网最全python库selenium自动化使用详细教程
Jan 12 #Python
[原创]赚疯了!转手立赚800+?大佬的python「抢茅台脚本」使用教程
Jan 12 #Python
五分钟学会怎么用python做一个简单的贪吃蛇
Jan 12 #Python
python生成word合同的实例方法
Jan 12 #Python
You might like
php学习笔记 [预定义数组(超全局数组)]
2011/06/09 PHP
php 启动时报错的简单解决方法
2014/01/27 PHP
PHP异常Parse error: syntax error, unexpected T_VAR错误解决方法
2014/05/06 PHP
php 把数字转换成汉字的代码
2015/07/21 PHP
PHP实现对xml的增删改查操作案例分析
2017/05/19 PHP
Knockoutjs快速入门(经典)
2012/12/24 Javascript
使用jQueryMobile实现滑动翻页效果的方法
2015/02/04 Javascript
浅析C/C++,Java,PHP,JavaScript,Json数组、对象赋值时最后一个元素后面是否可以带逗号
2016/03/22 Javascript
Node 自动化部署的方法
2017/10/17 Javascript
在Vue项目中使用d3.js的实例代码
2018/05/01 Javascript
用vue-cli开发vue时的代理设置方法
2018/09/20 Javascript
jQuery实现当拉动滚动条到底部加载数据的方法分析
2019/01/24 jQuery
js贪心算法 钱币找零问题代码实例
2019/09/11 Javascript
微信小程序在text文本实现多种字体样式
2019/11/08 Javascript
Python 网络爬虫--关于简单的模拟登录实例讲解
2018/06/01 Python
Python中应该使用%还是format来格式化字符串
2018/09/25 Python
Python 3.3实现计算两个日期间隔秒数/天数的方法示例
2019/01/07 Python
Python这样操作能存储100多万行的xlsx文件
2019/04/16 Python
简单了解python中对象的取反运算符
2019/07/01 Python
Python将主机名转换为IP地址的方法
2019/08/14 Python
PyCharm刷新项目(文件)目录的实现
2020/02/14 Python
新建文件时Pycharm中自动设置头部模板信息的方法
2020/04/17 Python
Django项目创建及管理实现流程详解
2020/10/13 Python
CSS3 input框的实现代码类似Google登录的动画效果
2020/08/04 HTML / CSS
美国班级戒指、帽子和礼服、毕业产品、年鉴:Balfour
2018/11/01 全球购物
企业后勤岗位职责
2014/02/28 职场文书
个人贷款承诺书
2014/03/28 职场文书
机械专业应届毕业生自荐书
2014/06/12 职场文书
自我检讨书范文
2015/01/28 职场文书
留学文书中的个人陈述,应该注意哪些问题?
2019/08/23 职场文书
修辞手法有哪些?
2019/08/29 职场文书
goland设置颜色和字体的操作
2021/05/05 Golang
MySQL数据库中varchar类型的数字比较大小的方法
2021/11/17 MySQL
JavaScript阻止事件冒泡的方法
2021/12/06 Javascript
Mongodb 迁移数据块的流程介绍分析
2022/04/18 MongoDB
ubuntu端向日葵键盘输入卡顿问题及解决
2022/12/24 Servers