Python爬虫实现验证码登录代码实例


Posted in Python onMay 10, 2019

很多网站为了避免被恶意访问,需要设置验证码登录,避免非人类的访问,Python爬虫实现验证码登录的原理则是先到登录页面将生成的验证码保存下来,然后人为输入后,包装后再POST给服务器,实现验证,这里还涉及到了Cookie,其实Cookie保存在本地主机上,避免用户重复输入用户名和密码,在连接服务器的时候将访问连接和Cookie组装起来POST给服务器。

这里涉及到了两次向服务器POST,一次是Cookie,这里还自行设计想要Cookie的内容,由于是要登录,Cookie中存放的则是用户名和密码。第二次POST则是向服务器提交验证。

这里用到Python3,主要用到的包是re  urllib.request   http.cookiejar

上代码,借鉴了别人的代码~~~

import re
import urllib.request
import http.cookiejar
#from http.comkie import CookieJar 上面那句和这句等同
 
loginurl='https://www.douban.com/accounts/login'
cookie = http.cookiejar.CookieJar()
opener = urllib.request.build_opener(urllib.request.HTTPCookieProcessor)#在已存的Cookie下建立连接
 
params={}
params['form_email']='用户名'
params['form_password']='密码'#这里写上已有的用户名和密码
params['source']='http://www.douban.com/accounts/login'
 
#从首页提交登陆
response = opener.open(loginurl,urllib.parse.urlencode(params).encode('utf-8'))#urllib.parse.urlencode(params).encode('utf-8')这个是向服务
#器POST的内容,可以打印一下response.geturl()请求的连接看一下
#print(response.geturl()[0:33])
#验证成功跳转至登陆页
if response.geturl()[0:33]=='https://accounts.douban.com/login':
    html = response.read().decode('utf-8')
    #print(html),可以先打印一下文件内容,为了看到网页元素更方便的写正则,可以复制下来,在需要获取的地方用(.+?)表示,然后用group()元组来取得,
    #验证图片地址
    imgurl=re.search('<img id="captcha_image" src="(.+?)" alt="captcha" class="captcha_image"/>',html)
    if imgurl:
       url=imgurl.group(1)
       #print(url)
       #将验证码以v.jpg保存在本地,在输入验证码的时候可以手工输入
       res=urllib.request.urlretrieve(url,'v.jpg')
       captcha = re.search('<input type="hidden" name="captcha-id" value="(.+?)"/>',html)
       #print(captcha.group(1))
       if captcha:
           vcode=input('请输入图片上的验证码:')
           params["captcha-solution"] = vcode
           params["captcha-id"] = captcha.group(1)#这个是动态生成的,需要从网页中获得
           params["user_login"] = "登录"
           #提交验证码验证
           response = opener.open(loginurl,urllib.parse.urlencode(params).encode('utf-8'))
           if response.geturl()=="https://www.douban.com/":
              print("login sucess")

以上所述是小编给大家介绍的Python爬虫实现验证码登录详解整合,希望对大家有所帮助,如果大家有任何疑问请给我留言,小编会及时回复大家的。在此也非常感谢大家对三水点靠木网站的支持!

Python 相关文章推荐
Python脚本实现DNSPod DNS动态解析域名
Feb 14 Python
在GitHub Pages上使用Pelican搭建博客的教程
Apr 25 Python
深入解答关于Python的11道基本面试题
Apr 01 Python
Django 多语言教程的实现(i18n)
Jul 07 Python
Python合并多个Excel数据的方法
Jul 16 Python
tensorflow实现简单逻辑回归
Sep 07 Python
PyTorch: 梯度下降及反向传播的实例详解
Aug 20 Python
python+tifffile之tiff文件读写方式
Jan 13 Python
Python中url标签使用知识点总结
Jan 16 Python
有关Tensorflow梯度下降常用的优化方法分享
Feb 04 Python
详解Python牛顿插值法
May 11 Python
Python包argparse模块常用方法
Jun 04 Python
详解如何管理多个Python版本和虚拟环境
May 10 #Python
不到40行代码用Python实现一个简单的推荐系统
May 10 #Python
Python和Java的语法对比分析语法简洁上python的确完美胜出
May 10 #Python
Python3列表内置方法大全及示例代码小结
May 10 #Python
详解python 爬取12306验证码
May 10 #Python
详解用python写一个抽奖程序
May 10 #Python
python实现小球弹跳效果
May 10 #Python
You might like
ftp类(example.php)
2006/10/09 PHP
php date与gmdate的获取日期的区别
2010/02/08 PHP
mysql 查询指定日期时间内sql语句实现原理与代码
2012/12/16 PHP
PHP版 汉字转码的实现详解
2013/06/09 PHP
解析PHP正则提取或替换img标记属性
2013/06/26 PHP
php调用c接口无错版介绍
2014/03/11 PHP
Yii基于数组和对象的Model查询技巧实例详解
2015/12/28 PHP
使用javascript实现ListBox左右全选,单选,多选,全请
2013/11/07 Javascript
当达到输入长度时表单自动切换焦点
2014/04/06 Javascript
两个多选select(multiple左右)添加、删除选项和取值实例
2014/05/12 Javascript
jquery的attr方法禁用表单元素禁用输入内容
2014/06/23 Javascript
jQuery实现的给图片点赞+1动画效果(附在线演示及demo源码下载)
2015/12/31 Javascript
ionic2 tabs使用 Modal底部tab弹出框
2016/12/30 Javascript
Javascript 编码约定(编码规范)
2018/03/11 Javascript
js canvas实现二维码和图片合成的海报
2020/11/19 Javascript
JS/CSS实现字符串单词首字母大写功能
2019/09/03 Javascript
微信内置开发 iOS修改键盘换行为搜索的解决方案
2019/11/06 Javascript
小程序实现图片预览裁剪插件
2019/11/22 Javascript
Python代码的打包与发布详解
2014/07/30 Python
Python中subprocess模块用法实例详解
2015/05/20 Python
用Python的Django框架来制作一个RSS阅读器
2015/07/22 Python
scrapy spider的几种爬取方式实例代码
2018/01/25 Python
使用tensorflow实现VGG网络,训练mnist数据集方式
2020/05/26 Python
Python -m参数原理及使用方法解析
2020/08/21 Python
python raise的基本使用
2020/09/10 Python
TripAdvisor印尼站:全球领先的旅游网站
2018/03/15 全球购物
公司培训欢迎词
2014/01/10 职场文书
人事部经理岗位职责
2014/03/07 职场文书
副科竞争上岗演讲稿
2014/05/12 职场文书
公司晚会策划方案
2014/05/17 职场文书
劳动争议和解协议书范本
2014/11/20 职场文书
碧霞祠导游词
2015/02/09 职场文书
辞职信的写法
2015/02/27 职场文书
谢师宴学生致辞
2015/07/27 职场文书
争做文明公民倡议书
2019/06/24 职场文书
Java基础之线程锁相关知识总结
2021/06/30 Java/Android