python通过cookie模拟已登录状态的初步研究


Posted in Python onNovember 09, 2016

对于那些需要在登录环境下进行的爬虫操作,模拟登陆或伪装已登录状态是一个刚需。

分析了网上关于模拟登录的例子,很多都基于用户名/密码发起一个post请求,遇到有图片验证码的,比较理想的方法是进行人工干预,同步发起一个图片验证码的请求,将图片写到本地,人工查看后进行输入。

既然,少不了人工干预,为何登录操作不全程人工进行,已登录后再把浏览器的Cookie信息全拷贝出来,通过爬虫伪造成一个已登录的浏览器呢? 我暂时试了试国内的几个大网站,发现都行得通,可以模拟浏览器进行登录之后的很多操作,包括签到,修改个人资料等。

下面贴上简单的代码实现:

python通过cookie模拟已登录状态的初步研究

后话:关于图片验证码,为什么没有必要去搞一个自动识别?

因为像下面这种简单的,你也许花上几天就可以搞定:

python通过cookie模拟已登录状态的初步研究 python通过cookie模拟已登录状态的初步研究

但是很多网站它的验证码会不断地变换策略,它变一次可能很快,但对你来说可能就得花上好几天去改代码,也许你还没改完,人家又变了,总之,玩不过你也可以玩死你。

当它想换下面的姿势给你点惊喜,如果你还没破解出它的上一套验证码时,你肯定会后悔大学选错了专业:

python通过cookie模拟已登录状态的初步研究

为了开发出自动抢票软件,360用了高精尖的团队,也好像不能百分百识别出下面反人类的验证码:

python通过cookie模拟已登录状态的初步研究

以上所述是小编给大家介绍的python通过cookie模拟已登录状态的初步研究,希望对大家有所帮助,如果大家有任何疑问请给我留言,小编会及时回复大家的。在此也非常感谢大家对三水点靠木网站的支持!

Python 相关文章推荐
python socket网络编程步骤详解(socket套接字使用)
Dec 06 Python
python的类变量和成员变量用法实例教程
Aug 25 Python
简述Python中的面向对象编程的概念
Apr 27 Python
Python面向对象编程基础解析(二)
Oct 26 Python
Pandas探索之高性能函数eval和query解析
Oct 28 Python
基于Django的ModelForm组件(详解)
Dec 07 Python
python实现简易版计算器
Jun 22 Python
Python实现模拟浏览器请求及会话保持操作示例
Jul 30 Python
Python3.5文件修改操作实例分析
May 01 Python
Python 转换RGB颜色值的示例代码
Oct 13 Python
浅谈sklearn中predict与predict_proba区别
Jun 28 Python
详解Python魔法方法之描述符类
May 26 Python
Python内置函数OCT详解
Nov 09 #Python
windows10系统中安装python3.x+scrapy教程
Nov 08 #Python
简单谈谈python中的多进程
Nov 06 #Python
python自带的http模块详解
Nov 06 #Python
Python程序中设置HTTP代理
Nov 06 #Python
Python 搭建Web站点之Web服务器网关接口
Nov 06 #Python
Python 搭建Web站点之Web服务器与Web框架
Nov 06 #Python
You might like
Zend Studio 实用快捷键一览表(精心整理)
2013/08/10 PHP
PHP中addslashes与mysql_escape_string的区别分析
2016/04/25 PHP
Laravel使用Queue队列的技巧汇总
2019/09/02 PHP
Javascript中 关于prototype属性实现继承的原理图
2013/04/16 Javascript
javascript实现的DES加密示例
2013/10/30 Javascript
提高NodeJS中SSL服务的性能
2014/07/15 NodeJs
实现图片预加载的三大方法及优缺点分析
2014/11/19 Javascript
node.js中的events.emitter.removeAllListeners方法使用说明
2014/12/10 Javascript
jQuery+PHP实现微信转盘抽奖功能的方法
2016/05/25 Javascript
indexedDB bootstrap angularjs之 MVC DOMO (应用示例)
2016/06/20 Javascript
再谈Javascript中的异步以及如何异步
2016/08/19 Javascript
Bootstrap的class样式小结
2016/12/01 Javascript
jquery滚动条插件(可以自定义)
2016/12/11 Javascript
关于Promise 异步编程的实例讲解
2017/09/01 Javascript
使用async-validator编写Form组件的方法
2018/01/10 Javascript
小程序自定义组件实现城市选择功能
2018/07/18 Javascript
微信小程序实现canvas分享朋友圈海报
2020/06/21 Javascript
[49:31]TFT vs Mski Supermajor小组赛C组 BO3 第一场 6.3
2018/06/04 DOTA
玩转python爬虫之正则表达式
2016/02/17 Python
详解Python多线程Selenium跨浏览器测试
2017/04/01 Python
Python + selenium自动化环境搭建的完整步骤
2018/05/19 Python
python实现内存监控系统
2021/03/07 Python
python批量修改图片尺寸,并保存指定路径的实现方法
2019/07/04 Python
python实现切割url得到域名、协议、主机名等各个字段的例子
2019/07/25 Python
python如何实现复制目录到指定目录
2020/02/13 Python
python代码实现猜拳小游戏
2020/11/30 Python
深入解析HTML5的IndexedDB索引数据库
2015/09/14 HTML / CSS
Kenneth Cole官网:纽约时尚优雅品牌
2016/11/14 全球购物
美国儿童服装、家具和玩具精品店:Maisonette
2019/11/24 全球购物
敏捷开发的主要原则都有哪些
2015/04/26 面试题
大学生活学习的自我评价
2013/12/03 职场文书
倡议书范文格式
2014/05/12 职场文书
建筑工程催款函
2015/06/24 职场文书
先进个人事迹材料(2016推荐版)
2016/03/01 职场文书
MySQL锁机制
2021/04/05 MySQL
MySQL为数据表建立索引的原则详解
2022/03/03 MySQL