python cookie反爬处理的实现


Posted in Python onNovember 01, 2020

Cookies的处理

作用
保存客户端的相关状态

在爬虫中如果遇到了cookie的反爬如何处理?

手动处理
    在抓包工具中捕获cookie,将其封装在headers中
    应用场景:cookie没有有效时长且不是动态变化

自动处理
 使用session机制
 使用场景:动态变化的cookie
 session对象:该对象和requests模块用法几乎一致.如果在请求的过程中产生了cookie,如果该请求使用session发起的,则cookie会被自动存储到session中.

案例

爬取雪球网中的新闻资讯数据:https://xueqiu.com/

#获取一个session对象
import requests
headers = {
  'User-Agent':'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/75.0.3770.100 Safari/537.36'
}
session = requests.Session()
main_url = 'https://xueqiu.com' #推测对该url发起请求会产生cookie
session.get(main_url,headers=headers)
url = 'https://xueqiu.com/v4/statuses/public_timeline_by_category.json'
params = {
  'since_id': '-1',
  'max_id': '20346152',
  'count': '15',
  'category': '-1',
}
page_text = session.get(url,headers=headers,params=params).json()
page_text

到此这篇关于python cookie反爬处理的实现的文章就介绍到这了,更多相关python cookie反爬内容请搜索三水点靠木以前的文章或继续浏览下面的相关文章希望大家以后多多支持三水点靠木!

Python 相关文章推荐
python列表与元组详解实例
Nov 01 Python
深入讲解Python中面向对象编程的相关知识
May 25 Python
Python中动态创建类实例的方法
Mar 24 Python
python 保存float类型的小数的位数方法
Oct 17 Python
解决Pycharm调用Turtle时 窗口一闪而过的问题
Feb 16 Python
python SQLAlchemy 中的Engine详解
Jul 04 Python
对Python中小整数对象池和大整数对象池的使用详解
Jul 09 Python
python实现几种归一化方法(Normalization Method)
Jul 31 Python
Python如何使用OS模块调用cmd
Feb 27 Python
如何将tensorflow训练好的模型移植到Android (MNIST手写数字识别)
Apr 22 Python
tensorflow使用L2 regularization正则化修正overfitting过拟合方式
May 22 Python
Python 多进程原理及实现
Dec 21 Python
10个python爬虫入门实例(小结)
Nov 01 #Python
利用pipenv和pyenv管理多个相互独立的Python虚拟开发环境
Nov 01 #Python
Python经纬度坐标转换为距离及角度的实现
Nov 01 #Python
详解Anaconda安装tensorflow报错问题解决方法
Nov 01 #Python
python Cartopy的基础使用详解
Nov 01 #Python
Python中使用aiohttp模拟服务器出现错误问题及解决方法
Oct 31 #Python
关于python中导入文件到list的问题
Oct 31 #Python
You might like
多文件上传的例子
2006/10/09 PHP
初级的用php写的采集程序
2007/03/16 PHP
php相当简单的分页类
2008/10/02 PHP
PHP采集利器 Snoopy 试用心得
2011/07/03 PHP
PHP实现的随机红包算法示例
2017/08/14 PHP
微信JSSDK分享功能图文实例详解
2019/04/08 PHP
用javascript实现页面打印的三种方法
2007/03/05 Javascript
用Js实现的动态增加表格示例自己写的
2013/10/21 Javascript
jQuery 过滤方法filter()选择具有特殊属性的元素
2014/06/15 Javascript
jQuery 浮动导航菜单适合购物商品类型的网站
2014/09/09 Javascript
jquery队列函数用法实例
2014/12/16 Javascript
node.js中的fs.createWriteStream方法使用说明
2014/12/17 Javascript
深入理解JavaScript系列(18):面向对象编程之ECMAScript实现
2015/03/05 Javascript
javascript操作ul中li的方法
2015/05/14 Javascript
一次让你了解全部JavaScript的作用域
2019/06/24 Javascript
微信小程序如何实现五星评价功能
2019/10/15 Javascript
JS数组方法push()、pop()用法实例分析
2020/01/18 Javascript
如何在Vue中使localStorage具有响应式(思想实验)
2020/07/14 Javascript
从零学python系列之从文件读取和保存数据
2014/05/23 Python
Python中利用sqrt()方法进行平方根计算的教程
2015/05/15 Python
python中类变量与成员变量的使用注意点总结
2017/04/29 Python
python+opencv+caffe+摄像头做目标检测的实例代码
2018/08/03 Python
Python判断一个三位数是否为水仙花数的示例
2018/11/13 Python
详解用Python进行时间序列预测的7种方法
2020/03/13 Python
python json.dumps中文乱码问题解决
2020/04/01 Python
Python 多线程C段扫描、检测 Ping扫描脚本的实现
2020/09/03 Python
wedgwood加拿大官网:1759年成立的英国国宝级陶瓷餐具品牌
2018/07/17 全球购物
Ivory Isle Designs美国/加拿大:婚礼和活动文具公司
2018/08/21 全球购物
房地产广告词大全
2014/03/19 职场文书
2015最新民情日记范文
2015/06/26 职场文书
学习党史心得体会2016
2016/01/23 职场文书
文明医院的标语集锦!
2019/07/24 职场文书
职场新人知识:如何制定一份合理的工作计划?
2019/09/11 职场文书
pytorch训练神经网络爆内存的解决方案
2021/05/22 Python
MySQL 5.7常见数据类型
2021/07/15 MySQL
Java死锁的排查
2022/05/11 Java/Android