python cookie反爬处理的实现


Posted in Python onNovember 01, 2020

Cookies的处理

作用
保存客户端的相关状态

在爬虫中如果遇到了cookie的反爬如何处理?

手动处理
    在抓包工具中捕获cookie,将其封装在headers中
    应用场景:cookie没有有效时长且不是动态变化

自动处理
 使用session机制
 使用场景:动态变化的cookie
 session对象:该对象和requests模块用法几乎一致.如果在请求的过程中产生了cookie,如果该请求使用session发起的,则cookie会被自动存储到session中.

案例

爬取雪球网中的新闻资讯数据:https://xueqiu.com/

#获取一个session对象
import requests
headers = {
  'User-Agent':'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/75.0.3770.100 Safari/537.36'
}
session = requests.Session()
main_url = 'https://xueqiu.com' #推测对该url发起请求会产生cookie
session.get(main_url,headers=headers)
url = 'https://xueqiu.com/v4/statuses/public_timeline_by_category.json'
params = {
  'since_id': '-1',
  'max_id': '20346152',
  'count': '15',
  'category': '-1',
}
page_text = session.get(url,headers=headers,params=params).json()
page_text

到此这篇关于python cookie反爬处理的实现的文章就介绍到这了,更多相关python cookie反爬内容请搜索三水点靠木以前的文章或继续浏览下面的相关文章希望大家以后多多支持三水点靠木!

Python 相关文章推荐
使用Python求解最大公约数的实现方法
Aug 20 Python
编写Python爬虫抓取豆瓣电影TOP100及用户头像的方法
Jan 20 Python
python中plot实现即时数据动态显示方法
Jun 22 Python
python根据url地址下载小文件的实例
Dec 18 Python
Python判断对象是否相等及eq函数的讲解
Feb 25 Python
Python3 实现文件批量重命名示例代码
Jun 03 Python
解决pycharm remote deployment 配置的问题
Jun 27 Python
查看Python依赖包及其版本号信息的方法
Aug 13 Python
python中property属性的介绍及其应用详解
Aug 29 Python
Python性能分析工具Profile使用实例
Nov 19 Python
python 实现矩阵按对角线打印
Nov 29 Python
python将logging模块封装成单独模块并实现动态切换Level方式
May 12 Python
10个python爬虫入门实例(小结)
Nov 01 #Python
利用pipenv和pyenv管理多个相互独立的Python虚拟开发环境
Nov 01 #Python
Python经纬度坐标转换为距离及角度的实现
Nov 01 #Python
详解Anaconda安装tensorflow报错问题解决方法
Nov 01 #Python
python Cartopy的基础使用详解
Nov 01 #Python
Python中使用aiohttp模拟服务器出现错误问题及解决方法
Oct 31 #Python
关于python中导入文件到list的问题
Oct 31 #Python
You might like
PHP判断远程url是否有效的几种方法小结
2011/10/08 PHP
浅析PKI加密解密 OpenSSL
2013/07/01 PHP
php smarty模板引擎的6个小技巧
2014/04/24 PHP
Laravel 批量更新多条数据的示例
2017/11/27 PHP
Laravel6.0.4中将添加计划任务事件的方法步骤
2019/10/15 PHP
PHP语言对接抖音快手小红书视频/图片去水印API接口源码
2020/08/11 PHP
jQuery实现简洁的导航菜单效果
2015/11/23 Javascript
Web前端开发工具——bower依赖包管理工具
2016/03/29 Javascript
简洁实用的BootStrap jQuery手风琴插件
2016/08/31 Javascript
百度多文件异步上传控件webuploader基本用法解析
2016/11/07 Javascript
Sequelize中用group by进行分组聚合查询
2016/12/12 Javascript
JS高级运动实例分析
2016/12/20 Javascript
jQuery窗口拖动功能的实现代码
2017/02/04 Javascript
详解数组Array.sort()排序的方法
2020/05/09 Javascript
微信小程序 chooseImage选择图片或者拍照
2017/04/07 Javascript
jQuery实现的简单动态添加、删除表格功能示例
2017/09/21 jQuery
Vue2.0设置全局样式(less/sass和css)
2017/11/18 Javascript
javaScript 连接打印机,打印小票的实例
2017/12/29 Javascript
详解vite+ts快速搭建vue3项目以及介绍相关特性
2021/02/25 Vue.js
python求素数示例分享
2014/02/16 Python
解决python写的windows服务不能启动的问题
2014/04/15 Python
Python中random模块生成随机数详解
2016/03/10 Python
django定期执行任务(实例讲解)
2017/11/03 Python
Python3.4实现远程控制电脑开关机
2018/02/22 Python
python实现对文件中图片生成带标签的txt文件方法
2018/04/27 Python
重写django的model下的objects模型管理器方式
2020/05/15 Python
pandas 像SQL一样使用WHERE IN查询条件说明
2020/06/05 Python
Python制作简单的剪刀石头布游戏
2020/12/10 Python
CSS3盒子模型详解
2013/04/24 HTML / CSS
阿联酋团购网站:Groupon阿联酋
2016/10/14 全球购物
澳大利亚百货商店中销量第一的商务衬衫品牌:Van Heusen
2018/07/26 全球购物
全民健身日活动方案
2014/01/29 职场文书
主持人演讲稿
2014/05/13 职场文书
python基础之文件处理知识总结
2021/05/23 Python
Nginx的基本概念和原理
2022/03/21 Servers
Nginx配置之禁止指定IP访问
2022/05/02 Servers