python cookie反爬处理的实现


Posted in Python onNovember 01, 2020

Cookies的处理

作用
保存客户端的相关状态

在爬虫中如果遇到了cookie的反爬如何处理?

手动处理
    在抓包工具中捕获cookie,将其封装在headers中
    应用场景:cookie没有有效时长且不是动态变化

自动处理
 使用session机制
 使用场景:动态变化的cookie
 session对象:该对象和requests模块用法几乎一致.如果在请求的过程中产生了cookie,如果该请求使用session发起的,则cookie会被自动存储到session中.

案例

爬取雪球网中的新闻资讯数据:https://xueqiu.com/

#获取一个session对象
import requests
headers = {
  'User-Agent':'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/75.0.3770.100 Safari/537.36'
}
session = requests.Session()
main_url = 'https://xueqiu.com' #推测对该url发起请求会产生cookie
session.get(main_url,headers=headers)
url = 'https://xueqiu.com/v4/statuses/public_timeline_by_category.json'
params = {
  'since_id': '-1',
  'max_id': '20346152',
  'count': '15',
  'category': '-1',
}
page_text = session.get(url,headers=headers,params=params).json()
page_text

到此这篇关于python cookie反爬处理的实现的文章就介绍到这了,更多相关python cookie反爬内容请搜索三水点靠木以前的文章或继续浏览下面的相关文章希望大家以后多多支持三水点靠木!

Python 相关文章推荐
浅析Python中的序列化存储的方法
Apr 28 Python
python+django快速实现文件上传
Oct 24 Python
python数据类型_元组、字典常用操作方法(介绍)
May 30 Python
Python实现修改IE注册表功能示例
May 10 Python
Tensorflow 合并通道及加载子模型的方法
Jul 26 Python
python程序快速缩进多行代码方法总结
Jun 23 Python
Pandas的read_csv函数参数分析详解
Jul 02 Python
python3 深浅copy对比详解
Aug 12 Python
python中字典按键或键值排序的实现代码
Aug 27 Python
python对象转字典的两种实现方式示例
Nov 07 Python
python内置模块collections知识点总结
Dec 19 Python
5款实用的python 工具推荐
Oct 13 Python
10个python爬虫入门实例(小结)
Nov 01 #Python
利用pipenv和pyenv管理多个相互独立的Python虚拟开发环境
Nov 01 #Python
Python经纬度坐标转换为距离及角度的实现
Nov 01 #Python
详解Anaconda安装tensorflow报错问题解决方法
Nov 01 #Python
python Cartopy的基础使用详解
Nov 01 #Python
Python中使用aiohttp模拟服务器出现错误问题及解决方法
Oct 31 #Python
关于python中导入文件到list的问题
Oct 31 #Python
You might like
星际RPG字典
2020/03/04 星际争霸
探讨方法的重写(覆载)详解
2013/06/08 PHP
php调用shell的方法
2014/11/05 PHP
详解WordPress中过滤链接与过滤SQL语句的方法
2015/12/18 PHP
编写跨浏览器的javascript代码必备[js多浏览器兼容写法]
2008/10/29 Javascript
iframe 自适应高度[在IE6 IE7 FF下测试通过]
2009/04/13 Javascript
Javascript毫秒数用法实例
2015/02/05 Javascript
使用AngularJS中的SCE来防止XSS攻击的方法
2015/06/18 Javascript
JavaScript中数组slice和splice的对比小结
2016/09/22 Javascript
详解nodejs微信公众号开发——1.接入微信公众号
2017/04/10 NodeJs
jqueryUI tab标签页代码分享
2017/10/09 jQuery
浅析JavaScript中的特殊数据类型
2017/12/15 Javascript
详解解决使用axios发送json后台接收不到的问题
2018/06/27 Javascript
Echart折线图手柄触发事件示例详解
2018/12/16 Javascript
在vue项目中使用sass语法问题
2019/07/18 Javascript
解决vue路由name同名,路由重复的问题
2020/08/05 Javascript
[06:57]DOTA2-DPC中国联赛 正赛 Ehome vs PSG.LGD 选手采访
2021/03/11 DOTA
python实现中文分词FMM算法实例
2015/07/10 Python
利用Celery实现Django博客PV统计功能详解
2017/05/08 Python
pandas.DataFrame 根据条件新建列并赋值的方法
2018/04/08 Python
Python实现基于KNN算法的笔迹识别功能详解
2018/07/09 Python
tensorflow实现图像的裁剪和填充方法
2018/07/27 Python
Python3.5局部变量与全局变量作用域实例分析
2019/04/30 Python
python/golang实现循环链表的示例代码
2020/09/14 Python
python中time包实例详解
2021/02/02 Python
html5开发之viewport使用
2013/10/17 HTML / CSS
html5组织内容_动力节点Java学院整理
2017/07/10 HTML / CSS
中国专业的综合网上购物商城:京东
2016/08/02 全球购物
国际贸易专业推荐信
2013/11/15 职场文书
师范应届生求职信
2013/11/15 职场文书
驻村工作先进事迹
2014/08/14 职场文书
励志演讲稿3分钟
2014/08/21 职场文书
校园会短篇的广播稿
2014/10/21 职场文书
营销经理工作检讨书
2014/11/03 职场文书
2015年公司新年寄语
2014/12/08 职场文书
新手入门Mysql--sql执行过程
2021/06/20 MySQL