python cookie反爬处理的实现


Posted in Python onNovember 01, 2020

Cookies的处理

作用
保存客户端的相关状态

在爬虫中如果遇到了cookie的反爬如何处理?

手动处理
    在抓包工具中捕获cookie,将其封装在headers中
    应用场景:cookie没有有效时长且不是动态变化

自动处理
 使用session机制
 使用场景:动态变化的cookie
 session对象:该对象和requests模块用法几乎一致.如果在请求的过程中产生了cookie,如果该请求使用session发起的,则cookie会被自动存储到session中.

案例

爬取雪球网中的新闻资讯数据:https://xueqiu.com/

#获取一个session对象
import requests
headers = {
  'User-Agent':'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/75.0.3770.100 Safari/537.36'
}
session = requests.Session()
main_url = 'https://xueqiu.com' #推测对该url发起请求会产生cookie
session.get(main_url,headers=headers)
url = 'https://xueqiu.com/v4/statuses/public_timeline_by_category.json'
params = {
  'since_id': '-1',
  'max_id': '20346152',
  'count': '15',
  'category': '-1',
}
page_text = session.get(url,headers=headers,params=params).json()
page_text

到此这篇关于python cookie反爬处理的实现的文章就介绍到这了,更多相关python cookie反爬内容请搜索三水点靠木以前的文章或继续浏览下面的相关文章希望大家以后多多支持三水点靠木!

Python 相关文章推荐
Python中atexit模块的基本使用示例
Jul 08 Python
一步步教你用Python实现2048小游戏
Jan 19 Python
Linux下python3.7.0安装教程
Jul 30 Python
Django集成搜索引擎Elasticserach的方法示例
Jun 04 Python
Pandas之MultiIndex对象的示例详解
Jun 25 Python
对Python的交互模式和直接运行.py文件的区别详解
Jun 29 Python
在python中用print()输出多个格式化参数的方法
Jul 16 Python
python使用paramiko模块通过ssh2协议对交换机进行配置的方法
Jul 25 Python
为什么说Python可以实现所有的算法
Oct 04 Python
Python 实现Image和Ndarray互相转换
Feb 19 Python
Python semaphore evevt生产者消费者模型原理解析
Mar 18 Python
python 使用xlsxwriter循环向excel中插入数据和图片的操作
Jan 01 Python
10个python爬虫入门实例(小结)
Nov 01 #Python
利用pipenv和pyenv管理多个相互独立的Python虚拟开发环境
Nov 01 #Python
Python经纬度坐标转换为距离及角度的实现
Nov 01 #Python
详解Anaconda安装tensorflow报错问题解决方法
Nov 01 #Python
python Cartopy的基础使用详解
Nov 01 #Python
Python中使用aiohttp模拟服务器出现错误问题及解决方法
Oct 31 #Python
关于python中导入文件到list的问题
Oct 31 #Python
You might like
聊天室php&mysql(六)
2006/10/09 PHP
百度工程师讲PHP函数的实现原理及性能分析(三)
2015/05/13 PHP
Yii CFileCache 获取不到值的原因分析
2017/02/08 PHP
php基于SQLite实现的分页功能示例
2017/06/21 PHP
js通过地址栏给action传值(中文乱码全是问号)
2013/05/02 Javascript
jquery 字符串切割函数substring的用法说明
2014/02/11 Javascript
对Angular.js Controller如何进行单元测试
2016/10/25 Javascript
jQuery实现动态文字搜索功能
2017/01/05 Javascript
JS+DIV实现的卷帘效果示例
2017/03/22 Javascript
整理关于Bootstrap过渡动画的慕课笔记
2017/03/29 Javascript
ES6解构赋值的功能与用途实例分析
2017/10/31 Javascript
vue 实现全选全不选的示例代码
2018/03/29 Javascript
24个解决实际问题的ES6代码片段(小结)
2020/02/02 Javascript
Vue实现简单的拖拽效果
2020/08/25 Javascript
[48:12]Secret vs Optic Supermajor 胜者组 BO3 第三场 6.4
2018/06/05 DOTA
python字符串替换的2种方法
2014/11/30 Python
Python实现获取磁盘剩余空间的2种方法
2017/06/07 Python
Python实现针对给定单链表删除指定节点的方法
2018/04/12 Python
OpenCV+python手势识别框架和实例讲解
2018/08/03 Python
Selenium chrome配置代理Python版的方法
2018/11/29 Python
Pyqt QImage 与 np array 转换方法
2019/06/27 Python
详解python中的数据类型和控制流
2019/08/08 Python
python调用支付宝支付接口流程
2019/08/15 Python
python图形用户接口实例详解
2019/12/16 Python
Python模块_PyLibTiff读取tif文件的实例
2020/01/13 Python
Pycharm+Python工程,引用子模块的实现
2020/03/09 Python
Python 中的函数装饰器和闭包详解
2021/02/06 Python
python利用文件时间批量重命名照片和视频
2021/02/09 Python
pyx文件 生成pyd 文件用于 cython调用的实现
2021/03/04 Python
简单说说tomcat的配置
2013/05/28 面试题
大学生创业计划书的格式要求
2013/12/29 职场文书
授权委托书样本
2014/04/03 职场文书
机电专业毕业生求职信
2014/07/01 职场文书
离婚协议书怎么写2014
2014/09/30 职场文书
使用redis生成唯一编号及原理示例详解
2021/09/15 Redis
MySQL中一条update语句是如何执行的
2022/03/16 MySQL