python通过cookie模拟已登录状态的初步研究


Posted in Python onNovember 09, 2016

对于那些需要在登录环境下进行的爬虫操作,模拟登陆或伪装已登录状态是一个刚需。

分析了网上关于模拟登录的例子,很多都基于用户名/密码发起一个post请求,遇到有图片验证码的,比较理想的方法是进行人工干预,同步发起一个图片验证码的请求,将图片写到本地,人工查看后进行输入。

既然,少不了人工干预,为何登录操作不全程人工进行,已登录后再把浏览器的Cookie信息全拷贝出来,通过爬虫伪造成一个已登录的浏览器呢? 我暂时试了试国内的几个大网站,发现都行得通,可以模拟浏览器进行登录之后的很多操作,包括签到,修改个人资料等。

下面贴上简单的代码实现:

python通过cookie模拟已登录状态的初步研究

后话:关于图片验证码,为什么没有必要去搞一个自动识别?

因为像下面这种简单的,你也许花上几天就可以搞定:

python通过cookie模拟已登录状态的初步研究 python通过cookie模拟已登录状态的初步研究

但是很多网站它的验证码会不断地变换策略,它变一次可能很快,但对你来说可能就得花上好几天去改代码,也许你还没改完,人家又变了,总之,玩不过你也可以玩死你。

当它想换下面的姿势给你点惊喜,如果你还没破解出它的上一套验证码时,你肯定会后悔大学选错了专业:

python通过cookie模拟已登录状态的初步研究

为了开发出自动抢票软件,360用了高精尖的团队,也好像不能百分百识别出下面反人类的验证码:

python通过cookie模拟已登录状态的初步研究

以上所述是小编给大家介绍的python通过cookie模拟已登录状态的初步研究,希望对大家有所帮助,如果大家有任何疑问请给我留言,小编会及时回复大家的。在此也非常感谢大家对三水点靠木网站的支持!

Python 相关文章推荐
Python基于PycURL自动处理cookie的方法
Jul 25 Python
解决pyqt中ui编译成窗体.py中文乱码的问题
Dec 23 Python
Python实现视频下载功能
Mar 14 Python
Python中elasticsearch插入和更新数据的实现方法
Apr 01 Python
python读取Excel实例详解
Aug 17 Python
对python3中pathlib库的Path类的使用详解
Oct 14 Python
Python使用pyshp库读取shapefile信息的方法
Dec 29 Python
python爬取盘搜的有效链接实现代码
Jul 20 Python
详解Python中打乱列表顺序random.shuffle()的使用方法
Nov 11 Python
设置jupyter中DataFrame的显示限制方式
Apr 12 Python
Python连接HDFS实现文件上传下载及Pandas转换文本文件到CSV操作
Jun 06 Python
python基于opencv批量生成验证码的示例
Apr 28 Python
Python内置函数OCT详解
Nov 09 #Python
windows10系统中安装python3.x+scrapy教程
Nov 08 #Python
简单谈谈python中的多进程
Nov 06 #Python
python自带的http模块详解
Nov 06 #Python
Python程序中设置HTTP代理
Nov 06 #Python
Python 搭建Web站点之Web服务器网关接口
Nov 06 #Python
Python 搭建Web站点之Web服务器与Web框架
Nov 06 #Python
You might like
推荐几部必看的DC动画电影
2020/03/03 欧美动漫
PHP中substr函数字符串截取用法分析
2016/01/07 PHP
Yii2实现上下联动下拉框功能的方法
2016/08/10 PHP
PHP面向对象程序设计之多态性的应用示例
2018/12/19 PHP
基于PHP实现堆排序原理及实例详解
2020/06/19 PHP
javascript延时加载之defer测试
2012/12/28 Javascript
js修改table中Td的值(定义td的双击事件)
2013/01/10 Javascript
解析URI与URL之间的区别与联系
2013/11/22 Javascript
javascript实现倒计时跳转页面
2016/01/17 Javascript
对称加密与非对称加密优缺点详解
2017/02/06 Javascript
使用jQuery.Pin垂直滚动时固定导航
2017/05/24 jQuery
基于node.js express mvc轻量级框架实践
2017/09/14 Javascript
详解从零搭建 vue2 vue-router2 webpack3 工程
2017/11/22 Javascript
浅谈vue中慎用style的scoped属性
2017/11/28 Javascript
js实现动态改变radio状态的方法
2018/02/28 Javascript
说说Vue.js中的functional函数化组件的使用
2019/02/12 Javascript
微信小程序学习笔记之函数定义、页面渲染图文详解
2019/03/28 Javascript
Element-ui中元素滚动时el-option超出元素区域的问题
2019/05/30 Javascript
基于vue+uniapp直播项目实现uni-app仿抖音/陌陌直播室功能
2019/11/12 Javascript
JavaScript 浏览器对象模型BOM原理与常见用法实例分析
2019/12/16 Javascript
vue中h5端打开app(判断是安卓还是苹果)
2021/02/26 Vue.js
Python脚本获取操作系统版本信息
2016/12/17 Python
Django 使用logging打印日志的实例
2018/04/28 Python
对Python 语音识别框架详解
2018/12/24 Python
Python基于datetime或time模块分别获取当前时间戳的方法实例
2019/02/19 Python
tensorflow生成多个tfrecord文件实例
2020/02/17 Python
tensorflow之tf.record实现存浮点数数组
2020/02/17 Python
python实现TCP文件传输
2020/03/20 Python
用python写爬虫简单吗
2020/07/28 Python
python工具——Mimesis的简单使用教程
2021/01/16 Python
Myprotein葡萄牙官方网站:英国优质运动营养品牌
2016/09/12 全球购物
世界顶级足球门票网站:Live Football Tickets
2017/10/14 全球购物
为什么要用EJB
2014/04/17 面试题
项目开发计划书
2014/01/09 职场文书
2014年质量管理工作总结
2014/12/01 职场文书
新年晚会主持词开场白
2015/05/28 职场文书