python实现网站的模拟登录


Posted in Python onJanuary 04, 2016

本文主要用python实现了对网站的模拟登录。通过自己构造post数据来用Python实现登录过程。

当你要模拟登录一个网站时,首先要搞清楚网站的登录处理细节(发了什么样的数据,给谁发等...)。我是通过HTTPfox来抓取http数据包来分析该网站的登录流程。同时,我们还要分析抓到的post包的数据结构和header,要根据提交的数据结构和heander来构造自己的post数据和header。

分析结束后,我们要构造自己的HTTP数据包,并发送给指定url。我们通过urllib2等几个模块提供的API来实现request请求的发送和相应的接收。
大部分网站登录时需要携带cookie,所以我们还必须设置cookie处理器来保证cookie。

具体代码和讲解如下

#!/usr/bin/python 
 
import HTMLParser 
import urlparse 
import urllib 
import urllib2 
import cookielib 
import string 
import re 
 
#登录的主页面 
hosturl = '******' //自己填写 
#post数据接收和处理的页面(我们要向这个页面发送我们构造的Post数据) 
posturl = '******' //从数据包中分析出,处理post请求的url 
 
#设置一个cookie处理器,它负责从服务器下载cookie到本地,并且在发送请求时带上本地的cookie 
cj = cookielib.LWPCookieJar() 
cookie_support = urllib2.HTTPCookieProcessor(cj) 
opener = urllib2.build_opener(cookie_support, urllib2.HTTPHandler) 
urllib2.install_opener(opener) 
 
#打开登录主页面(他的目的是从页面下载cookie,这样我们在再送post数据时就有cookie了,否则发送不成功) 
h = urllib2.urlopen(hosturl) 
 
#构造header,一般header至少要包含一下两项。这两项是从抓到的包里分析得出的。 
headers = {'User-Agent' : 'Mozilla/5.0 (Windows NT 6.1; WOW64; rv:14.0) Gecko/20100101 Firefox/14.0.1', 
  'Referer' : '******'} 
#构造Post数据,他也是从抓大的包里分析得出的。 
postData = {'op' : 'dmlogin', 
  'f' : 'st', 
  'user' : '******', //你的用户名 
  'pass' : '******', //你的密码,密码可能是明文传输也可能是密文,如果是密文需要调用相应的加密算法加密 
  'rmbr' : 'true', //特有数据,不同网站可能不同 
  'tmp' : '0.7306424454308195' //特有数据,不同网站可能不同 
 
  } 
 
#需要给Post数据编码 
postData = urllib.urlencode(postData) 
 
#通过urllib2提供的request方法来向指定Url发送我们构造的数据,并完成登录过程 
request = urllib2.Request(posturl, postData, headers) 
print request 
response = urllib2.urlopen(request) 
text = response.read() 
print text

领取干货:零基础入门学习python视频教程

 以上就是本文的全部内容,希望大家相互交流相互学习,共同进步!

Python 相关文章推荐
python爬虫实战之最简单的网页爬虫教程
Aug 13 Python
python删除某个字符
Mar 19 Python
Python文本处理之按行处理大文件的方法
Apr 09 Python
Python常见的pandas用法demo示例
Mar 16 Python
Python实现字符型图片验证码识别完整过程详解
May 10 Python
Tensorflow实现酸奶销量预测分析
Jul 19 Python
PyQt5基本控件使用详解:单选按钮、复选框、下拉框
Aug 05 Python
numpy 返回函数的上三角矩阵实例
Nov 25 Python
python利用线程实现多任务
Sep 18 Python
python爬虫调度器用法及实例代码
Nov 30 Python
浏览器常用基本操作之python3+selenium4自动化测试(基础篇3)
May 21 Python
Python中 range | np.arange | np.linspace三者的区别
Mar 22 Python
Python实现简单的文件传输与MySQL备份的脚本分享
Jan 03 #Python
简单介绍Python中的几种数据类型
Jan 02 #Python
简单实现python爬虫功能
Dec 31 #Python
python实现颜色空间转换程序(Tkinter)
Dec 31 #Python
基于python的Tkinter实现一个简易计算器
Dec 31 #Python
python实现爬虫统计学校BBS男女比例之数据处理(三)
Dec 31 #Python
python实现爬虫统计学校BBS男女比例之多线程爬虫(二)
Dec 31 #Python
You might like
PHP产生随机字符串函数
2006/12/06 PHP
yii框架源码分析之创建controller代码
2011/06/28 PHP
简单实用的.net DataTable导出Execl
2013/10/28 PHP
PHP中使用socket方式GET、POST数据实例
2015/04/02 PHP
php实现的后台表格分页功能示例
2017/10/23 PHP
CentOS7系统搭建LAMP及更新PHP版本操作详解
2020/03/26 PHP
onkeyup,onkeydown和onkeypress的区别介绍
2013/10/21 Javascript
js父窗口关闭时子窗口随之关闭完美解决方案
2014/04/29 Javascript
js动态控制table的tr、td增加及删除的具体实现
2014/04/30 Javascript
分享一个常用的javascript静态类
2014/12/31 Javascript
jQuery+jRange实现滑动选取数值范围特效
2015/03/14 Javascript
基于jquery实现表格无刷新分页
2016/01/07 Javascript
微信小程序 SocketIO 实例讲解
2016/10/13 Javascript
Node.js+jade+mongodb+mongoose实现爬虫分离入库与生成静态文件的方法
2017/09/20 Javascript
vue获取input输入值的问题解决办法
2017/10/17 Javascript
详解使用VUE搭建后台管理系统(vue-cli更新至3.0)
2018/08/22 Javascript
浅谈让你的代码更简短,更整洁,更易读的ES6小技巧
2018/10/25 Javascript
解决cordova+vue 项目打包成APK应用遇到的问题
2019/05/10 Javascript
详解Vue.js中引入图片路径的几种方式
2019/06/17 Javascript
基于javascript实现日历功能原理及代码实例
2020/05/07 Javascript
微信小程序实现单个或多个倒计时功能
2020/11/01 Javascript
[04:05]TI9战队采访 - Natus Vincere
2019/08/22 DOTA
仅用50行Python代码实现一个简单的代理服务器
2015/04/08 Python
在Django的模型中添加自定义方法的示例
2015/07/21 Python
python爬虫实战之爬取京东商城实例教程
2017/04/24 Python
Python 实现王者荣耀中的敏感词过滤示例
2019/01/21 Python
详解django中url路由配置及渲染方式
2019/02/25 Python
pytorch常见的Tensor类型详解
2020/01/15 Python
浅谈Python中re.match()和re.search()的使用及区别
2020/04/14 Python
亚洲领先的设计购物网站:Pinkoi
2020/11/26 全球购物
医学院四年学习生活的自我评价
2013/11/06 职场文书
办公室打字员岗位职责
2014/04/16 职场文书
司法建议书范文
2014/05/13 职场文书
初一新生军训方案
2014/05/22 职场文书
2016年度师德标兵先进事迹材料
2016/02/26 职场文书
2019最新版劳务派遣管理制度
2019/08/16 职场文书