python cookie反爬处理的实现


Posted in Python onNovember 01, 2020

Cookies的处理

作用
保存客户端的相关状态

在爬虫中如果遇到了cookie的反爬如何处理?

手动处理
    在抓包工具中捕获cookie,将其封装在headers中
    应用场景:cookie没有有效时长且不是动态变化

自动处理
 使用session机制
 使用场景:动态变化的cookie
 session对象:该对象和requests模块用法几乎一致.如果在请求的过程中产生了cookie,如果该请求使用session发起的,则cookie会被自动存储到session中.

案例

爬取雪球网中的新闻资讯数据:https://xueqiu.com/

#获取一个session对象
import requests
headers = {
  'User-Agent':'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/75.0.3770.100 Safari/537.36'
}
session = requests.Session()
main_url = 'https://xueqiu.com' #推测对该url发起请求会产生cookie
session.get(main_url,headers=headers)
url = 'https://xueqiu.com/v4/statuses/public_timeline_by_category.json'
params = {
  'since_id': '-1',
  'max_id': '20346152',
  'count': '15',
  'category': '-1',
}
page_text = session.get(url,headers=headers,params=params).json()
page_text

到此这篇关于python cookie反爬处理的实现的文章就介绍到这了,更多相关python cookie反爬内容请搜索三水点靠木以前的文章或继续浏览下面的相关文章希望大家以后多多支持三水点靠木!

Python 相关文章推荐
Django中使用group_by的方法
May 26 Python
构建Python包的五个简单准则简介
Jun 15 Python
简单实现python聊天程序
Apr 01 Python
利用Python如何生成便签图片详解
Jul 09 Python
Window环境下Scrapy开发环境搭建
Nov 18 Python
python3 小数位的四舍五入(用两种方法解决round 遇5不进)
Apr 11 Python
Python3匿名函数lambda介绍与使用示例
May 18 Python
python 将字符串完成特定的向右移动方法
Jun 11 Python
python输入多行字符串的方法总结
Jul 02 Python
Pandas分组与排序的实现
Jul 23 Python
tensorflow查看ckpt各节点名称实例
Jan 21 Python
python利用tkinter实现图片格式转换的示例
Sep 28 Python
10个python爬虫入门实例(小结)
Nov 01 #Python
利用pipenv和pyenv管理多个相互独立的Python虚拟开发环境
Nov 01 #Python
Python经纬度坐标转换为距离及角度的实现
Nov 01 #Python
详解Anaconda安装tensorflow报错问题解决方法
Nov 01 #Python
python Cartopy的基础使用详解
Nov 01 #Python
Python中使用aiohttp模拟服务器出现错误问题及解决方法
Oct 31 #Python
关于python中导入文件到list的问题
Oct 31 #Python
You might like
php 创建以UNIX时间戳命名的文件夹(示例代码)
2014/03/08 PHP
php选择排序法实现数组排序实例分析
2015/02/16 PHP
PHP按指定键值对二维数组进行排序的方法
2015/12/22 PHP
php使用正则表达式获取字符串中的URL
2016/12/29 PHP
PHP操作MongoDB实现增删改查功能【附php7操作MongoDB方法】
2018/04/24 PHP
js 表单验证方法(实用)
2009/04/28 Javascript
JavaScript实现将数组中所有元素连接成一个字符串的方法
2015/04/06 Javascript
jQuery实现文档树效果
2017/02/20 Javascript
基于jQuery实现图片推拉门动画效果的两种方法
2017/08/26 jQuery
深入理解使用Vue实现Context-Menu的思考与总结
2019/03/09 Javascript
个人小程序接入支付解决方案
2019/05/23 Javascript
js获取浏览器地址(获取第1个斜杠后的内容)
2019/09/03 Javascript
Vue开发中遇到的跨域问题及解决方法
2020/02/11 Javascript
在antd Table中插入可编辑的单元格实例
2020/10/28 Javascript
Python使用Beautiful Soup包编写爬虫时的一些关键点
2016/01/20 Python
Python中的sort()方法使用基础教程
2017/01/08 Python
python读取图片并修改格式与大小的方法
2018/07/24 Python
详解python-图像处理(映射变换)
2019/03/22 Python
python连接、操作mongodb数据库的方法实例详解
2019/09/11 Python
Python模块相关知识点小结
2020/03/09 Python
python实现控制台输出彩色字体
2020/04/05 Python
python产生模拟数据faker库的使用详解
2020/11/04 Python
阿联酋航空官方网站:Emirates
2017/10/17 全球购物
澳洲的服装老品牌:SABA
2018/02/06 全球购物
Nike瑞士官网:Nike CH
2021/01/18 全球购物
什么是典型的软件三层结构?软件设计为什么要分层?软件分层有什么好处?
2012/03/14 面试题
数据库方面面试题
2012/04/22 面试题
Linux不知道文件后缀名怎么判断文件类型
2014/08/21 面试题
愚人节活动策划方案
2014/03/11 职场文书
疾病捐款倡议书
2014/05/13 职场文书
幼儿园师德师风学习材料
2014/05/29 职场文书
增员口号大全
2014/06/18 职场文书
建筑专业毕业生求职信
2014/09/30 职场文书
流动人口婚育证明
2014/10/19 职场文书
2014年中班下学期工作总结
2014/12/11 职场文书
5道关于python基础 while循环练习题
2021/11/27 Python