python通过cookie模拟已登录状态的初步研究


Posted in Python onNovember 09, 2016

对于那些需要在登录环境下进行的爬虫操作,模拟登陆或伪装已登录状态是一个刚需。

分析了网上关于模拟登录的例子,很多都基于用户名/密码发起一个post请求,遇到有图片验证码的,比较理想的方法是进行人工干预,同步发起一个图片验证码的请求,将图片写到本地,人工查看后进行输入。

既然,少不了人工干预,为何登录操作不全程人工进行,已登录后再把浏览器的Cookie信息全拷贝出来,通过爬虫伪造成一个已登录的浏览器呢? 我暂时试了试国内的几个大网站,发现都行得通,可以模拟浏览器进行登录之后的很多操作,包括签到,修改个人资料等。

下面贴上简单的代码实现:

python通过cookie模拟已登录状态的初步研究

后话:关于图片验证码,为什么没有必要去搞一个自动识别?

因为像下面这种简单的,你也许花上几天就可以搞定:

python通过cookie模拟已登录状态的初步研究 python通过cookie模拟已登录状态的初步研究

但是很多网站它的验证码会不断地变换策略,它变一次可能很快,但对你来说可能就得花上好几天去改代码,也许你还没改完,人家又变了,总之,玩不过你也可以玩死你。

当它想换下面的姿势给你点惊喜,如果你还没破解出它的上一套验证码时,你肯定会后悔大学选错了专业:

python通过cookie模拟已登录状态的初步研究

为了开发出自动抢票软件,360用了高精尖的团队,也好像不能百分百识别出下面反人类的验证码:

python通过cookie模拟已登录状态的初步研究

以上所述是小编给大家介绍的python通过cookie模拟已登录状态的初步研究,希望对大家有所帮助,如果大家有任何疑问请给我留言,小编会及时回复大家的。在此也非常感谢大家对三水点靠木网站的支持!

Python 相关文章推荐
Python第三方库xlrd/xlwt的安装与读写Excel表格
Jan 21 Python
python定向爬虫校园论坛帖子信息
Jul 23 Python
浅述python中深浅拷贝原理
Sep 18 Python
python判断列表的连续数字范围并分块的方法
Nov 16 Python
浅析Python 读取图像文件的性能对比
Mar 07 Python
python使用pymongo操作mongo的完整步骤
Apr 13 Python
Python中Numpy mat的使用详解
May 24 Python
anaconda中更改python版本的方法步骤
Jul 14 Python
Pycharm 2019 破解激活方法图文详解
Oct 11 Python
Python xml、字典、json、类四种数据类型如何实现互相转换
May 27 Python
python3中TQDM库安装及使用详解
Nov 18 Python
python基础详解之if循环语句
Apr 24 Python
Python内置函数OCT详解
Nov 09 #Python
windows10系统中安装python3.x+scrapy教程
Nov 08 #Python
简单谈谈python中的多进程
Nov 06 #Python
python自带的http模块详解
Nov 06 #Python
Python程序中设置HTTP代理
Nov 06 #Python
Python 搭建Web站点之Web服务器网关接口
Nov 06 #Python
Python 搭建Web站点之Web服务器与Web框架
Nov 06 #Python
You might like
ThinkPHP分组下自定义标签库实例
2014/11/01 PHP
php删除文本文件中重复行的方法
2015/04/28 PHP
PHP自定义多进制的方法
2016/11/03 PHP
tp5.1 框架数据库高级查询技巧实例总结
2020/05/25 PHP
让ie运行js时提示允许阻止内容运行的解决方法
2010/10/24 Javascript
jquery 扑捉回车键事件代码
2014/04/24 Javascript
整理Javascript事件响应学习笔记
2015/12/02 Javascript
nodejs修复ipa处理过的png图片
2016/02/17 NodeJs
jQuery数据检索中根据关键字快速定位GridView指定行的实现方法
2016/06/08 Javascript
使用jQuery的load方法设计动态加载及解决被加载页面js失效问题
2017/03/01 Javascript
jQuery第一次运行页面默认触发点击事件的实例
2018/01/10 jQuery
ES6学习笔记之map、set与数组、对象的对比
2018/03/01 Javascript
jQuery中图片展示插件highslide.js的简单dom
2018/04/22 jQuery
vue 中swiper的使用教程
2018/05/22 Javascript
JS module的导出和导入的实现代码
2019/02/25 Javascript
微信小程序生成分享海报方法(附带二维码生成)
2019/03/29 Javascript
JavaScript 中的无穷数(Infinity)详解
2020/02/13 Javascript
nodejs+express最简易的连接数据库的方法
2020/12/23 NodeJs
[01:45]DOTA2众星出演!DSPL刀塔次级职业联赛宣传片
2014/11/21 DOTA
[52:02]DOTA2-DPC中国联赛 正赛 Phoenix vs Dragon BO3 第二场 2月26日
2021/03/11 DOTA
python中Genarator函数用法分析
2015/04/08 Python
详解Python的Django框架中的templates设置
2015/05/11 Python
浅谈python中的实例方法、类方法和静态方法
2017/02/17 Python
python2 与 python3 实现共存的方法
2018/07/12 Python
python中将正则过滤的内容输出写入到文件中的实例
2018/10/21 Python
python打包成so文件过程解析
2019/09/28 Python
使用Python FastAPI构建Web服务的实现
2020/06/08 Python
HTML5的Geolocation地理位置定位API使用教程
2016/05/12 HTML / CSS
英国最大的奢侈珠宝和手表网站:C W Sellors
2017/02/10 全球购物
俄罗斯街头服装品牌:Black Star Wear
2017/03/01 全球购物
在对linux系统分区进行格式化时需要对磁盘簇(或i节点密度)的大小进行选择,请说明选择的原则
2012/01/13 面试题
副董事长岗位职责
2014/04/02 职场文书
自主招生教师推荐信
2014/05/10 职场文书
pytorch 如何使用batch训练lstm网络
2021/05/28 Python
python开发飞机大战游戏
2021/07/15 Python
使用Nginx的访问日志统计PV与UV
2022/05/06 Servers