python通过cookie模拟已登录状态的初步研究


Posted in Python onNovember 09, 2016

对于那些需要在登录环境下进行的爬虫操作,模拟登陆或伪装已登录状态是一个刚需。

分析了网上关于模拟登录的例子,很多都基于用户名/密码发起一个post请求,遇到有图片验证码的,比较理想的方法是进行人工干预,同步发起一个图片验证码的请求,将图片写到本地,人工查看后进行输入。

既然,少不了人工干预,为何登录操作不全程人工进行,已登录后再把浏览器的Cookie信息全拷贝出来,通过爬虫伪造成一个已登录的浏览器呢? 我暂时试了试国内的几个大网站,发现都行得通,可以模拟浏览器进行登录之后的很多操作,包括签到,修改个人资料等。

下面贴上简单的代码实现:

python通过cookie模拟已登录状态的初步研究

后话:关于图片验证码,为什么没有必要去搞一个自动识别?

因为像下面这种简单的,你也许花上几天就可以搞定:

python通过cookie模拟已登录状态的初步研究 python通过cookie模拟已登录状态的初步研究

但是很多网站它的验证码会不断地变换策略,它变一次可能很快,但对你来说可能就得花上好几天去改代码,也许你还没改完,人家又变了,总之,玩不过你也可以玩死你。

当它想换下面的姿势给你点惊喜,如果你还没破解出它的上一套验证码时,你肯定会后悔大学选错了专业:

python通过cookie模拟已登录状态的初步研究

为了开发出自动抢票软件,360用了高精尖的团队,也好像不能百分百识别出下面反人类的验证码:

python通过cookie模拟已登录状态的初步研究

以上所述是小编给大家介绍的python通过cookie模拟已登录状态的初步研究,希望对大家有所帮助,如果大家有任何疑问请给我留言,小编会及时回复大家的。在此也非常感谢大家对三水点靠木网站的支持!

Python 相关文章推荐
Python BeautifulSoup中文乱码问题的2种解决方法
Apr 22 Python
在Linux下调试Python代码的各种方法
Apr 17 Python
使用Python编写vim插件的简单示例
Apr 17 Python
Python 数据处理库 pandas 入门教程基本操作
Apr 19 Python
centos6.8安装python3.7无法import _ssl的解决方法
Sep 17 Python
pandas DataFrame 删除重复的行的实现方法
Jan 29 Python
python中嵌套函数的实操步骤
Feb 27 Python
Python3实现的简单工资管理系统示例
Mar 12 Python
python 哈希表实现简单python字典代码实例
Sep 27 Python
详解Django中异步任务之django-celery
Nov 05 Python
Python利用matplotlib绘制折线图的新手教程
Nov 05 Python
详解Python函数print用法
Jun 18 Python
Python内置函数OCT详解
Nov 09 #Python
windows10系统中安装python3.x+scrapy教程
Nov 08 #Python
简单谈谈python中的多进程
Nov 06 #Python
python自带的http模块详解
Nov 06 #Python
Python程序中设置HTTP代理
Nov 06 #Python
Python 搭建Web站点之Web服务器网关接口
Nov 06 #Python
Python 搭建Web站点之Web服务器与Web框架
Nov 06 #Python
You might like
PHP静态调用非静态方法的应用分析
2013/05/02 PHP
PHPExcel简单读取excel文件示例
2016/05/26 PHP
基于PHP的登录和注册的功能的实现
2020/08/06 PHP
use jscript Create a SQL Server database
2007/06/16 Javascript
用html+css+js实现的一个简单的图片切换特效
2014/05/28 Javascript
JS判断是否360安全浏览器极速内核的方法
2015/01/29 Javascript
深入解析JavaScript编程中的this关键字使用
2015/11/09 Javascript
Angular2内置指令NgFor和NgIf详解
2016/08/03 Javascript
javascript实现根据汉字获取简拼
2016/09/25 Javascript
angularjs中$http异步上传Excel文件方法
2018/02/23 Javascript
使用D3.js+Vue实现一个简单的柱形图
2018/08/05 Javascript
webpack的CSS加载器的使用
2018/09/11 Javascript
使用 vue 实例更好的监听事件及vue实例的方法
2019/04/22 Javascript
详解node.js创建一个web服务器(Server)的详细步骤
2021/01/15 Javascript
JS相册图片抖动放大展示效果的示例代码
2021/01/29 Javascript
跟老齐学Python之深入变量和引用对象
2014/09/24 Python
如何准确判断请求是搜索引擎爬虫(蜘蛛)发出的请求
2015/10/13 Python
Python匹配中文的正则表达式
2016/05/11 Python
Python实现在线暴力破解邮箱账号密码功能示例【测试可用】
2017/09/06 Python
详解Django解决ajax跨域访问问题
2018/08/24 Python
浅谈python中str字符串和unicode对象字符串的拼接问题
2018/12/04 Python
python3实现表白神器
2019/04/09 Python
Python3网络爬虫中的requests高级用法详解
2019/06/18 Python
pytorch实现mnist数据集的图像可视化及保存
2020/01/14 Python
python+selenium定时爬取丁香园的新型冠状病毒数据并制作出类似的地图(部署到云服务器)
2020/02/09 Python
Python Selenium操作Cookie的实例方法
2021/02/28 Python
今天学到的CSS最新技术(与图片背景相关)
2012/12/24 HTML / CSS
马来西亚最热门的在线时尚商店:FashionValet
2018/11/11 全球购物
adidas瑞典官方网站:购买阿迪达斯鞋子和运动服
2019/12/11 全球购物
工商管理应届生求职信
2013/10/07 职场文书
化学专业毕业生自荐信
2013/11/15 职场文书
会计出纳员的自我评价
2014/01/15 职场文书
文艺晚会主持词
2014/03/24 职场文书
入党介绍人评语
2014/05/06 职场文书
工商管理本科生求职信
2014/07/13 职场文书
你真的了解PHP中的引用符号(&)吗
2021/05/12 PHP