编程 Python

python cookie反爬处理的实现

Posted in Python onNovember 01, 2020

Cookies的处理

作用
保存客户端的相关状态

在爬虫中如果遇到了cookie的反爬如何处理?

手动处理
在抓包工具中捕获cookie,将其封装在headers中
应用场景:cookie没有有效时长且不是动态变化

自动处理
使用session机制
使用场景:动态变化的cookie
session对象:该对象和requests模块用法几乎一致.如果在请求的过程中产生了cookie,如果该请求使用session发起的,则cookie会被自动存储到session中.

案例

爬取雪球网中的新闻资讯数据:https://xueqiu.com/

#获取一个session对象
import requests
headers = {
  'User-Agent':'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/75.0.3770.100 Safari/537.36'
}
session = requests.Session()
main_url = 'https://xueqiu.com' #推测对该url发起请求会产生cookie
session.get(main_url,headers=headers)
url = 'https://xueqiu.com/v4/statuses/public_timeline_by_category.json'
params = {
  'since_id': '-1',
  'max_id': '20346152',
  'count': '15',
  'category': '-1',
}
page_text = session.get(url,headers=headers,params=params).json()
page_text

到此这篇关于python cookie反爬处理的实现的文章就介绍到这了,更多相关python cookie反爬内容请搜索三水点靠木以前的文章或继续浏览下面的相关文章希望大家以后多多支持三水点靠木！

python cookie反爬处理的实现

- Author -

corei5tj

声明：登载此文出于传递更多信息之目的，并不意味着赞同其观点或证实其描述。

Python 相关文章推荐

深入学习Python中的装饰器使用

Jun 20 Python

Django自定义认证方式用法示例

Jun 23 Python

python下载图片实现方法(超简单)

Jul 21 Python

深入探究Django中的Session与Cookie

Jul 30 Python

python 3调用百度OCR API实现剪贴板文字识别

Sep 04 Python

Python with用法：自动关闭文件进程

Jul 10 Python

Django choices下拉列表绑定实例

Mar 13 Python

Python数据正态性检验实现过程

Apr 18 Python

Python基于numpy模块实现回归预测

May 14 Python

Python3爬虫里关于代理的设置总结

Jul 30 Python

Python字符串三种格式化输出

Sep 17 Python

Python中的 No Module named ***问题及解决

Jul 23 Python

10个python爬虫入门实例(小结)

Nov 01 #Python

利用pipenv和pyenv管理多个相互独立的Python虚拟开发环境

Nov 01 #Python

Python经纬度坐标转换为距离及角度的实现

Nov 01 #Python

详解Anaconda安装tensorflow报错问题解决方法

Nov 01 #Python

python Cartopy的基础使用详解

Nov 01 #Python

Python中使用aiohttp模拟服务器出现错误问题及解决方法

Oct 31 #Python

关于python中导入文件到list的问题

Oct 31 #Python

You might like

DOTA2 1月28日更新：监管系统降临刀塔世界

2021/01/28 DOTA

php的array数组和使用实例简明教程（容易理解）

2014/03/20 PHP

PHP生成短网址的3种方法代码实例

2014/07/08 PHP

PHP实现二叉树深度优先遍历(前序、中序、后序)和广度优先遍历(层次)实例详解

2018/04/20 PHP

PHP排序算法之简单选择排序(Simple Selection Sort)实例分析

2018/04/20 PHP

PHP call_user_func和call_user_func_array函数的简单理解与应用分析

2019/11/25 PHP

jQuery Div中加载其他页面的实现代码

2009/02/27 Javascript

jquery 注意事项与常用语法小结

2010/06/07 Javascript

一次失败的jQuery优化尝试小结

2011/02/06 Javascript

javaScript矢量图表库-gRaphael几行代码实现精美的条形图/饼图/点图/曲线图

2013/01/09 Javascript

jquery选择器的选择使用及性能介绍

2013/01/16 Javascript

js实现图片和链接文字同步切换特效的方法

2015/02/20 Javascript

js限制文本框只能输入中文的方法

2015/08/11 Javascript

学习使用AngularJS文件上传控件

2016/02/16 Javascript

easyui window refresh 刷新两次的解决方法(推荐)

2016/05/18 Javascript

JS前端加密算法示例

2016/12/22 Javascript

vue模板语法-插值详解

2017/03/06 Javascript

移动端利用H5实现压缩图片上传功能

2017/03/29 Javascript

详解React-Native解决键盘遮挡问题（Keyboard遮挡问题）

2017/07/13 Javascript

vue2实现数据请求显示loading图

2017/11/28 Javascript

JavaScript对JSON数组简单排序操作示例

2019/01/31 Javascript

详解从vue-loader源码分析CSS Scoped的实现

2019/09/23 Javascript

python简单判断序列是否为空的方法

2015/06/30 Python

python学习之编写查询ip程序

2016/02/27 Python

python决策树之C4.5算法详解

2017/12/20 Python

Python读取mat文件,并转为csv文件的实例

2018/07/04 Python

Python自定义装饰器原理与用法实例分析

2018/07/16 Python

python函数局部变量、全局变量、递归知识点总结

2019/11/15 Python

简单了解Pandas缺失值处理方法

2019/11/16 Python

Python网络爬虫四大选择器用法原理总结

2020/06/01 Python

鱼油专家：Omegavia

2016/10/10 全球购物

美国领先的水果篮送货公司和新鲜水果供应商：The Fruit Company

2018/02/13 全球购物

档案信息化建设方案

2014/05/16 职场文书

向雷锋同志学习倡议书

2015/04/27 职场文书

Django给表单添加honeypot验证增加安全性

2021/05/06 Python

Vue实现跑马灯样式文字横向滚动

2021/11/23 Vue.js