python+selenium识别验证码并登录的示例代码


Posted in Python onDecember 21, 2017

由于工作需要,登录网站需要用到验证码。最初是研究过验证码识别的,但是总是不能获取到我需要的那个验证码。直到这周五,才想起这事来,昨天顺利的解决了。

下面正题:

python版本:3.4.3

所需要的代码库:PIL,selenium,tesseract

先上代码:

#coding:utf-8
import subprocess
from PIL import Image
from PIL import ImageOps
from selenium import webdriver
import time,os,sys
def cleanImage(imagePath):
  image = Image.open(imagePath)  #打开图片
  image = image.point(lambda x: 0 if x<143 else 255) #处理图片上的每个像素点,使图片上每个点“非黑即白”
  borderImage = ImageOps.expand(image,border=20,fill='white')
  borderImage.save(imagePath)

def getAuthCode(driver, url="http://localhost/"):
  captchaUrl = url + "common/random"
  driver.get(captchaUrl) 
  time.sleep(0.5)
  driver.save_screenshot("captcha.jpg")  #截屏,并保存图片
  #urlretrieve(captchaUrl, "captcha.jpg")
  time.sleep(0.5)
  cleanImage("captcha.jpg")
  p = subprocess.Popen(["tesseract", "captcha.jpg", "captcha"], stdout=\
             subprocess.PIPE,stderr=subprocess.PIPE)
  p.wait()
  f = open("captcha.txt", "r")
  
  #Clean any whitespace characters
  captchaResponse = f.read().replace(" ", "").replace("\n", "")
  print("Captcha solution attempt: " + captchaResponse)
  if len(captchaResponse) == 4:
    return captchaResponse
  else:
    return False

def withoutCookieLogin(url="http://org.cfu666.com/"):
  driver = webdriver.Chrome()
  driver.maximize_window()
  driver.get(url)
  while True:   
    authCode = getAuthCode(driver, url)
    if authCode:
      driver.back()
      driver.find_element_by_xpath("//input[@id='orgCode' and @name='orgCode']").clear()
      driver.find_element_by_xpath("//input[@id='orgCode' and @name='orgCode']").send_keys("orgCode")
      driver.find_element_by_xpath("//input[@id='account' and @name='username']").clear()
      driver.find_element_by_xpath("//input[@id='account' and @name='username']").send_keys("username")
      driver.find_element_by_xpath("//input[@type='password' and @name='password']").clear()
      driver.find_element_by_xpath("//input[@type='password' and @name='password']").send_keys("password")       
      driver.find_element_by_xpath("//input[@type='text' and @name='authCode']").send_keys(authCode)
      driver.find_element_by_xpath("//button[@type='submit']").click()
      try:
        time.sleep(3)
        driver.find_element_by_xpath("//*[@id='side-menu']/li[2]/ul/li/a").click()
        return driver
      except:
        print("authCode Error:", authCode)
        driver.refresh()
  return driver
driver = withoutCookieLogin("http://localhost/")
driver.get("http://localhost/enterprise/add/")

怎么获取我们需要的验证码

在这获取验证码的道路上,我掉了太多的坑,看过太多的文章,很多都是教你验证码的识别方法,但是没有说明,怎么获取你当前需要的验证码图片。

我的处理方法是:

1.先用selenium打开你需要的登录的页面地址url1

python+selenium识别验证码并登录的示例代码

2.通过审核元素获取验证码的地址url2(其实最简单的是右键打开新页面)

python+selenium识别验证码并登录的示例代码

3:在url1页面,输入地址url2进入url2页面,然后截屏保存验证码页面

python+selenium识别验证码并登录的示例代码

4:处理验证码得到验证码字符串。然后点击浏览器后退按钮,返回url1登录页面

5:输入登录需要的信息和验证码

python+selenium识别验证码并登录的示例代码

6:点击登录

7:验证登录后的页面,判断是否成功,若不成功则需要重新1-7的操作。

为了保护公司的信息,这个页面是我本地搭的服务,我在伯乐在线注册页面进行测试过这个验证码获得方法,可以通过。(这个验证码的处理方法,仅限验证码背景是像素点,若验证码有横线需额外处理。)

以上就是本文的全部内容,希望对大家的学习有所帮助,也希望大家多多支持三水点靠木。

Python 相关文章推荐
50行代码实现贪吃蛇(具体思路及代码)
Apr 27 Python
Python使用正则表达式抓取网页图片的方法示例
Apr 21 Python
pandas数据分组和聚合操作方法
Apr 11 Python
django admin 后台实现三级联动的示例代码
Jun 22 Python
python对list中的每个元素进行某种操作的方法
Jun 29 Python
python使用 __init__初始化操作简单示例
Sep 26 Python
python自动化实现登录获取图片验证码功能
Nov 20 Python
Python Numpy 自然数填充数组的实现
Nov 28 Python
Python基于当前时间批量创建文件
May 07 Python
QML用PathView实现轮播图
Jun 03 Python
python代数式括号有效性检验示例代码
Oct 04 Python
OpenCV-Python实现怀旧滤镜与连环画滤镜
Jun 09 Python
python实现随机森林random forest的原理及方法
Dec 21 #Python
python编写分类决策树的代码
Dec 21 #Python
Python基于PyGraphics包实现图片截取功能的方法
Dec 21 #Python
用Python写王者荣耀刷金币脚本
Dec 21 #Python
python使用Apriori算法进行关联性解析
Dec 21 #Python
python实现kMeans算法
Dec 21 #Python
利用Tkinter(python3.6)实现一个简单计算器
Dec 21 #Python
You might like
类的另类用法--数据的封装
2006/10/09 PHP
php rmdir使用递归函数删除非空目录实例详解
2016/10/20 PHP
jquery做的一个简单的屏幕锁定提示框
2014/03/26 Javascript
jQuery实现级联菜单效果(仿淘宝首页菜单动画)
2014/04/10 Javascript
node.js中使用socket.io制作命名空间
2014/12/15 Javascript
JQuery实现可直接编辑的表格
2015/04/16 Javascript
KnockoutJS 3.X API 第四章之表单submit、enable、disable绑定
2016/10/10 Javascript
javascript iframe跨域详解
2016/10/26 Javascript
浅谈Node.js轻量级Web框架Express4.x使用指南
2017/05/03 Javascript
JavaScript使用Ajax上传文件的示例代码
2017/08/10 Javascript
js数据类型转换与流程控制操作实例分析
2019/12/18 Javascript
Vue全局使用less样式,组件使用全局样式文件中定义的变量操作
2020/10/21 Javascript
vue中activated的用法
2021/01/03 Vue.js
[28:57]EG vs VGJ.T 2018国际邀请赛小组赛BO2 第二场 8.16
2018/08/16 DOTA
[03:01]完美盛典趣味短片 DOTA2年度最佳&拉胯英雄
2019/12/07 DOTA
Python中使用SAX解析xml实例
2014/11/21 Python
在Python的struct模块中进行数据格式转换的方法
2015/06/17 Python
Python中关键字nonlocal和global的声明与解析
2017/03/12 Python
python urllib爬取百度云连接的实例代码
2017/06/19 Python
python使用pyqt写带界面工具的示例代码
2017/10/23 Python
python 常用的基础函数
2018/07/10 Python
Python常见内置高效率函数用法示例
2018/07/31 Python
python使用knn实现特征向量分类
2018/12/26 Python
详解python datetime模块
2020/08/17 Python
使用数据结构给女朋友写个Html5走迷宫游戏
2019/11/26 HTML / CSS
正宗的日本零食和糖果订阅盒:Bokksu
2019/11/21 全球购物
比较基础的php面试题及答案-填空题
2014/04/26 面试题
高三历史教学反思
2014/01/09 职场文书
通信生自我鉴定
2014/01/18 职场文书
幼儿园毕业寄语
2014/04/03 职场文书
师德师风个人自我剖析材料
2014/09/27 职场文书
学习党章的体会
2014/11/07 职场文书
不会写演讲稿,快来看看这篇文章!
2019/08/06 职场文书
解决Vue+SpringBoot+Shiro跨域问题
2021/06/09 Vue.js
深入详解JS函数的柯里化
2021/06/09 Javascript
安装配置mysql及Navicat prenium的详细流程
2021/06/10 MySQL