python通过cookie模拟已登录状态的初步研究


Posted in Python onNovember 09, 2016

对于那些需要在登录环境下进行的爬虫操作,模拟登陆或伪装已登录状态是一个刚需。

分析了网上关于模拟登录的例子,很多都基于用户名/密码发起一个post请求,遇到有图片验证码的,比较理想的方法是进行人工干预,同步发起一个图片验证码的请求,将图片写到本地,人工查看后进行输入。

既然,少不了人工干预,为何登录操作不全程人工进行,已登录后再把浏览器的Cookie信息全拷贝出来,通过爬虫伪造成一个已登录的浏览器呢? 我暂时试了试国内的几个大网站,发现都行得通,可以模拟浏览器进行登录之后的很多操作,包括签到,修改个人资料等。

下面贴上简单的代码实现:

python通过cookie模拟已登录状态的初步研究

后话:关于图片验证码,为什么没有必要去搞一个自动识别?

因为像下面这种简单的,你也许花上几天就可以搞定:

python通过cookie模拟已登录状态的初步研究 python通过cookie模拟已登录状态的初步研究

但是很多网站它的验证码会不断地变换策略,它变一次可能很快,但对你来说可能就得花上好几天去改代码,也许你还没改完,人家又变了,总之,玩不过你也可以玩死你。

当它想换下面的姿势给你点惊喜,如果你还没破解出它的上一套验证码时,你肯定会后悔大学选错了专业:

python通过cookie模拟已登录状态的初步研究

为了开发出自动抢票软件,360用了高精尖的团队,也好像不能百分百识别出下面反人类的验证码:

python通过cookie模拟已登录状态的初步研究

以上所述是小编给大家介绍的python通过cookie模拟已登录状态的初步研究,希望对大家有所帮助,如果大家有任何疑问请给我留言,小编会及时回复大家的。在此也非常感谢大家对三水点靠木网站的支持!

Python 相关文章推荐
Python while、for、生成器、列表推导等语句的执行效率测试
Jun 03 Python
python中os模块详解
Oct 14 Python
Python实现遍历目录的方法【测试可用】
Mar 22 Python
详解Python核心对象类型字符串
Feb 11 Python
5分钟 Pipenv 上手指南
Dec 20 Python
windows下搭建python scrapy爬虫框架步骤
Dec 23 Python
如何通过Python实现标签云算法
Jul 02 Python
python通过TimedRotatingFileHandler按时间切割日志
Jul 17 Python
详解Python并发编程之从性能角度来初探并发编程
Aug 23 Python
利用Python计算KS的实例详解
Mar 03 Python
Python实现GIF图倒放
Jul 16 Python
python爬虫beautifulsoup解析html方法
Dec 07 Python
Python内置函数OCT详解
Nov 09 #Python
windows10系统中安装python3.x+scrapy教程
Nov 08 #Python
简单谈谈python中的多进程
Nov 06 #Python
python自带的http模块详解
Nov 06 #Python
Python程序中设置HTTP代理
Nov 06 #Python
Python 搭建Web站点之Web服务器网关接口
Nov 06 #Python
Python 搭建Web站点之Web服务器与Web框架
Nov 06 #Python
You might like
用PHP实现维护文件代码
2007/06/14 PHP
PHP判断变量是否为0的方法
2014/02/08 PHP
mac下Apache + MySql + PHP搭建网站开发环境
2014/06/02 PHP
服务器上配置PHP运行环境教程
2015/02/12 PHP
php给一组指定关键词添加span标签的方法
2015/03/31 PHP
PHP绕过open_basedir限制操作文件的方法
2018/06/10 PHP
laravel获取不到session的三种解决办法【推荐】
2018/09/16 PHP
jQuery1.6 使用方法一
2011/11/23 Javascript
javascript获取网页中指定节点的父节点、子节点的方法小结
2013/04/24 Javascript
jQuery表格插件ParamQuery简单使用方法示例
2013/12/05 Javascript
node.js入门教程
2014/06/01 Javascript
流量统计器如何鉴别C#:WebBrowser中伪造referer
2015/01/07 Javascript
html的DOM中document对象images集合用法实例
2015/01/21 Javascript
jQuery插件Timelinr 实现时间轴特效
2015/10/04 Javascript
jQuery使用animate实现ul列表项相互飘动效果示例
2016/09/16 Javascript
表单元素值获取方式js及java方式的简单实例
2016/10/15 Javascript
JS实现分页浏览横向图片(类轮播)实例代码
2017/11/06 Javascript
vue单个组件实现无限层级多选菜单功能
2018/04/10 Javascript
JavaScript 下载svg图片为png格式
2018/06/21 Javascript
使用JS获取页面上的所有标签
2018/10/18 Javascript
JQuery模拟实现网页中自定义鼠标右键菜单功能
2018/11/14 jQuery
Element-UI中关于table表格的那些骚操作(小结)
2019/08/15 Javascript
python字典基本操作实例分析
2015/07/11 Python
简单总结Python中序列与字典的相同和不同之处
2016/01/19 Python
Python时间序列处理之ARIMA模型的使用讲解
2019/04/02 Python
简述 Python 的类和对象
2020/08/21 Python
linux面试相关问题
2012/08/11 面试题
幼儿园六一儿童节主持节目串词
2014/03/21 职场文书
财务负责人任命书
2014/06/06 职场文书
争先创优心得体会
2014/09/12 职场文书
工作汇报开头与结尾怎么写
2014/11/08 职场文书
紧急通知
2015/04/17 职场文书
学生早退检讨书(范文)
2019/08/19 职场文书
MySQL Threads_running飙升与慢查询的相关问题解决
2021/05/08 MySQL
基于Apache Hudi在Google云构建数据湖平台的思路详解
2022/04/07 Servers
vue修饰符.capture和.self的区别
2022/04/22 Vue.js