Python爬虫scrapy框架Cookie池(微博Cookie池)的使用


Posted in Python onJanuary 13, 2021

下载代码Cookie池(这里主要是微博登录,也可以自己配置置其他的站点网址)

下载代码GitHub:https://github.com/Python3WebSpider/CookiesPool

Python爬虫scrapy框架Cookie池(微博Cookie池)的使用

下载安装过后注意看网页下面的相关基础配置和操作!!!!!!!!!!!!!

自己的设置主要有下面几步:

1、配置其他设置

Python爬虫scrapy框架Cookie池(微博Cookie池)的使用

2、设置使用的浏览器

Python爬虫scrapy框架Cookie池(微博Cookie池)的使用

Python爬虫scrapy框架Cookie池(微博Cookie池)的使用

3、设置模拟登陆

Python爬虫scrapy框架Cookie池(微博Cookie池)的使用

源码cookies.py的修改(以下两处不修改可能会产生bug)

Python爬虫scrapy框架Cookie池(微博Cookie池)的使用

 Python爬虫scrapy框架Cookie池(微博Cookie池)的使用

4、获取cookie

随机获取Cookies: http://localhost:5000/weibo/random(注意:cookie使用时是需要后期处理的!!)

Python爬虫scrapy框架Cookie池(微博Cookie池)的使用

简单的处理方式,如下代码(偶尔需要对获取的cookie处理):

def get_cookie(self):
    return requests.get('http://127.0.0.1:5000/weibo/random').text
 
  def stringToDict(self,cookie):
    itemDict = {}
    items = cookie.replace(':', '=').split(',')
    for item in items:
      key = item.split('=')[0].replace(' ', '').strip(' "')
      value = item.split('=')[1].strip(' "')
      itemDict[key] = value
    return itemDict

scrapy爬虫的使用示例(爬取微博):

middlewares.py中自定义请求中间件

def start_requests(self):
    ua = UserAgent()
    headers = {
      'User-Agent': ua.random,
      }
    cookies = self.stringToDict(str(self.get_cookie().strip('{|}')))
 
    yield scrapy.Request(url=self.start_urls[0], headers=headers,
               cookies=cookies, callback=self.parse)
cookies = self.stringToDict(str(self.get_cookie().strip('{|}')))

    yield scrapy.Request(url=self.start_urls[0], headers=headers,
               cookies=cookies, callback=self.parse)

settings.py 中的配置:

Python爬虫scrapy框架Cookie池(微博Cookie池)的使用

5、录入账号和密码:

Python爬虫scrapy框架Cookie池(微博Cookie池)的使用

格式规定(账号----密码)

Python爬虫scrapy框架Cookie池(微博Cookie池)的使用

6、验证:(注意:使用cmd)

Python爬虫scrapy框架Cookie池(微博Cookie池)的使用

7、使用时注意保持cmd打开运行!!

使用时一定要打开cmd,并运行如第6步。

得到Cookie是判断是否处理处理Cookie(几乎都需要!!)类比第4步!!!

到此这篇关于Python爬虫scrapy框架Cookie池(微博Cookie池)的使用的文章就介绍到这了,更多相关scrapy Cookie池内容请搜索三水点靠木以前的文章或继续浏览下面的相关文章希望大家以后多多支持三水点靠木!

Python 相关文章推荐
Python中设置变量作为默认值时容易遇到的错误
Apr 03 Python
python选择排序算法实例总结
Jul 01 Python
python采用django框架实现支付宝即时到帐接口
May 17 Python
python爬虫的工作原理
Mar 05 Python
Python urls.py的三种配置写法实例详解
Apr 28 Python
django输出html内容的实例
May 27 Python
利用rest framework搭建Django API过程解析
Aug 31 Python
pycharm运行scrapy过程图解
Nov 22 Python
Python如何基于selenium实现自动登录博客园
Dec 16 Python
Python如何进行时间处理
Aug 06 Python
Pycharm无法打开双击没反应的问题及解决方案
Aug 17 Python
Python find()、rfind()方法及作用
Dec 24 Python
matplotlib交互式数据光标实现(mplcursors)
Jan 13 #Python
Python 生成短8位唯一id实战教程
Jan 13 #Python
python uuid生成唯一id或str的最简单案例
Jan 13 #Python
全网最全python库selenium自动化使用详细教程
Jan 12 #Python
[原创]赚疯了!转手立赚800+?大佬的python「抢茅台脚本」使用教程
Jan 12 #Python
五分钟学会怎么用python做一个简单的贪吃蛇
Jan 12 #Python
python生成word合同的实例方法
Jan 12 #Python
You might like
Mysql的Root密码忘记,查看或修改的解决方法(图文介绍)
2013/06/14 PHP
Php header()函数语法及使用代码
2013/11/04 PHP
PHP跨平台获取服务器IP地址自定义函数分享
2014/12/29 PHP
php简单获取文件扩展名的方法
2015/03/24 PHP
PHP会话处理的10个函数
2015/08/11 PHP
Zend Framework常用校验器详解
2016/12/09 PHP
javascript cookie解码函数(兼容ff)
2008/03/17 Javascript
关于document.cookie的使用javascript
2008/04/11 Javascript
jQuery学习笔记 操作jQuery对象 CSS处理
2012/09/19 Javascript
通过javascript获取iframe里的值示例代码
2013/06/24 Javascript
JS循环遍历JSON数据的方法
2014/07/08 Javascript
基于javascript实现全国省市二级联动下拉选择菜单
2016/01/28 Javascript
JavaScript模拟push
2016/03/06 Javascript
JavaScript必知必会(三) String .的方法来自何方
2016/06/08 Javascript
ionic隐藏tabs的方法
2016/08/29 Javascript
详解基于vue-cli优化的webpack配置
2017/11/06 Javascript
快速解决vue-cli在ie9+中无效的问题
2018/09/04 Javascript
Vue中的methods、watch、computed的区别
2018/11/26 Javascript
小程序页面动态配置实现方法
2019/02/05 Javascript
解决微信浏览器缓存站点入口文件(IIS部署Vue项目)
2019/06/17 Javascript
Python Flask基础教程示例代码
2018/02/07 Python
Python父目录、子目录的相互调用方法
2019/02/16 Python
python openpyxl使用方法详解
2019/07/18 Python
Python 文件数据读写的具体实现
2020/01/24 Python
Liu Jo西班牙官网:意大利服装品牌
2019/09/11 全球购物
如何高效率的查找一个月以内的数据
2012/04/15 面试题
Java程序员面试题
2013/07/15 面试题
2014年两会学习心得体会
2014/03/17 职场文书
质量保证书范本
2014/04/29 职场文书
2014大学校园光棍节活动策划书
2014/09/29 职场文书
师范生见习报告
2014/10/31 职场文书
优秀班组申报材料
2014/12/25 职场文书
个人总结与自我评价
2015/02/14 职场文书
学生犯错保证书
2015/05/09 职场文书
公司董事任命书
2015/09/21 职场文书
python神经网络学习 使用Keras进行简单分类
2022/05/04 Python