python cookie反爬处理的实现


Posted in Python onNovember 01, 2020

Cookies的处理

作用
保存客户端的相关状态

在爬虫中如果遇到了cookie的反爬如何处理?

手动处理
    在抓包工具中捕获cookie,将其封装在headers中
    应用场景:cookie没有有效时长且不是动态变化

自动处理
 使用session机制
 使用场景:动态变化的cookie
 session对象:该对象和requests模块用法几乎一致.如果在请求的过程中产生了cookie,如果该请求使用session发起的,则cookie会被自动存储到session中.

案例

爬取雪球网中的新闻资讯数据:https://xueqiu.com/

#获取一个session对象
import requests
headers = {
  'User-Agent':'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/75.0.3770.100 Safari/537.36'
}
session = requests.Session()
main_url = 'https://xueqiu.com' #推测对该url发起请求会产生cookie
session.get(main_url,headers=headers)
url = 'https://xueqiu.com/v4/statuses/public_timeline_by_category.json'
params = {
  'since_id': '-1',
  'max_id': '20346152',
  'count': '15',
  'category': '-1',
}
page_text = session.get(url,headers=headers,params=params).json()
page_text

到此这篇关于python cookie反爬处理的实现的文章就介绍到这了,更多相关python cookie反爬内容请搜索三水点靠木以前的文章或继续浏览下面的相关文章希望大家以后多多支持三水点靠木!

Python 相关文章推荐
深入学习Python中的装饰器使用
Jun 20 Python
Django自定义认证方式用法示例
Jun 23 Python
python下载图片实现方法(超简单)
Jul 21 Python
深入探究Django中的Session与Cookie
Jul 30 Python
python 3调用百度OCR API实现剪贴板文字识别
Sep 04 Python
Python with用法:自动关闭文件进程
Jul 10 Python
Django choices下拉列表绑定实例
Mar 13 Python
Python数据正态性检验实现过程
Apr 18 Python
Python基于numpy模块实现回归预测
May 14 Python
Python3爬虫里关于代理的设置总结
Jul 30 Python
Python字符串三种格式化输出
Sep 17 Python
Python中的 No Module named ***问题及解决
Jul 23 Python
10个python爬虫入门实例(小结)
Nov 01 #Python
利用pipenv和pyenv管理多个相互独立的Python虚拟开发环境
Nov 01 #Python
Python经纬度坐标转换为距离及角度的实现
Nov 01 #Python
详解Anaconda安装tensorflow报错问题解决方法
Nov 01 #Python
python Cartopy的基础使用详解
Nov 01 #Python
Python中使用aiohttp模拟服务器出现错误问题及解决方法
Oct 31 #Python
关于python中导入文件到list的问题
Oct 31 #Python
You might like
DOTA2 1月28日更新:监管系统降临刀塔世界
2021/01/28 DOTA
php的array数组和使用实例简明教程(容易理解)
2014/03/20 PHP
PHP生成短网址的3种方法代码实例
2014/07/08 PHP
PHP实现二叉树深度优先遍历(前序、中序、后序)和广度优先遍历(层次)实例详解
2018/04/20 PHP
PHP排序算法之简单选择排序(Simple Selection Sort)实例分析
2018/04/20 PHP
PHP call_user_func和call_user_func_array函数的简单理解与应用分析
2019/11/25 PHP
jQuery Div中加载其他页面的实现代码
2009/02/27 Javascript
jquery 注意事项与常用语法小结
2010/06/07 Javascript
一次失败的jQuery优化尝试小结
2011/02/06 Javascript
javaScript矢量图表库-gRaphael几行代码实现精美的条形图/饼图/点图/曲线图
2013/01/09 Javascript
jquery选择器的选择使用及性能介绍
2013/01/16 Javascript
js实现图片和链接文字同步切换特效的方法
2015/02/20 Javascript
js限制文本框只能输入中文的方法
2015/08/11 Javascript
学习使用AngularJS文件上传控件
2016/02/16 Javascript
easyui window refresh 刷新两次的解决方法(推荐)
2016/05/18 Javascript
JS前端加密算法示例
2016/12/22 Javascript
vue模板语法-插值详解
2017/03/06 Javascript
移动端利用H5实现压缩图片上传功能
2017/03/29 Javascript
详解React-Native解决键盘遮挡问题(Keyboard遮挡问题)
2017/07/13 Javascript
vue2实现数据请求显示loading图
2017/11/28 Javascript
JavaScript对JSON数组简单排序操作示例
2019/01/31 Javascript
详解从vue-loader源码分析CSS Scoped的实现
2019/09/23 Javascript
python简单判断序列是否为空的方法
2015/06/30 Python
python学习之编写查询ip程序
2016/02/27 Python
python决策树之C4.5算法详解
2017/12/20 Python
Python读取mat文件,并转为csv文件的实例
2018/07/04 Python
Python自定义装饰器原理与用法实例分析
2018/07/16 Python
python函数局部变量、全局变量、递归知识点总结
2019/11/15 Python
简单了解Pandas缺失值处理方法
2019/11/16 Python
Python网络爬虫四大选择器用法原理总结
2020/06/01 Python
鱼油专家:Omegavia
2016/10/10 全球购物
美国领先的水果篮送货公司和新鲜水果供应商:The Fruit Company
2018/02/13 全球购物
档案信息化建设方案
2014/05/16 职场文书
向雷锋同志学习倡议书
2015/04/27 职场文书
Django给表单添加honeypot验证增加安全性
2021/05/06 Python
Vue实现跑马灯样式文字横向滚动
2021/11/23 Vue.js